Найти

Поиск статей

Расширенные фильтры

Опубликовано после

Опубликовано до

По автору

Результаты поиска

Как эмбеддинги имен сущностей влияют на качество выравнивания сущностей

Даниил Иванович Гусев, Зинаида Владимировна Апанович

52-79

Аннотация:

Алгоритмы установления соответствия между сущностями осуществляют поиск эквивалентных сущностей в разноязычных графах знаний. Данная проблема возникает, как правило, при интеграции разноязычных графов знаний. В настоящее время решение этой проблемы становится весьма актуальным для практического решения проблем импортозамещения, например, чтобы найти информацию о лекарствах, выпускаемых в разных странах под разными названиями, или же решить проблему поиска эквивалентных запчастей.

В настоящее время известно несколько библиотек с открытым кодом, которые объединяют известные алгоритмы выравнивания сущностей, а также тестовые наборы данных для различных языков. В данной работе описан русско-английский набор данных для экспериментов с нескольким популярными алгоритмами выравнивания сущностей. Особое внимание уделено методам генерации векторных представлений для имен сущностей. В частности, рассмотрены комбинации различных методов генерации векторных представлений (эмбеддингов) имен сущностей с известными алгоритмами выравнивания сущностей. Таблицы с результатами экспериментов дополнены визуализациями.

Ключевые слова: разноязычные графы знаний, идентификация сущностей, cross-lingual entity alignment, knowledge graphs, relational embeddings, name embeddings.

К вопросу о представлении синтагматических отношений морфем в векторных языковых моделях

Дарья Кирилловна Родионова, Ольга Александровна Митрофанова

898-918

Аннотация:

В работе рассмотрено представление семантической структуры производных слов в языковых моделях, учитывающее внутрисловные синтагматические отношения между словообразовательными морфемами. Эксперименты проводились с привлечением морфемных моделей НейроКРЯ, а также моделей fastText и ruRoBERTa. Проверена гипотеза о композициональности производных слов, представляемых в виде агрегированных векторов морфем, а также выполнено сравнение представлений семантических отношений с помощью морфемных векторов fastText и стандартных векторов подслов в модели ruRoBERTa. Полученные результаты указывают на умеренную чувствительность векторов fastText к синтагматическим связям между морфемами и словообразовательным типам. Установлено также что агрегация морфемных векторов в fastText улучшает регистрацию семантических отношений между словами, связанными словообразовательными отношениями, по сравнению с агрегацией векторов подслов в модели ruRoBERTa.

Стандартные токенизаторы BPE (Byte-Pair Encoding) и WordPiece, применяемые в моделях семейства Transformer, являются слабоинтерпретируемыми в отношении языковых данных, поскольку в них сегменты слов не всегда соответствуют морфемам. Исследовательская проблема состоит в необходимости оценки того, в какой мере современные языковые модели способны регистрировать лингвистические признаки, характеризующие отношения производных слов в словообразовательных гнездах.

В работе оценена способность предсказывающих моделей распределенных векторных вложений воспроизводить синтагматические связи между морфемами внутри производных слов и на уровне словообразовательных гнезд в русском языке.

Полученные результаты стимулируют разработку нейросетевых архитектур, учитывающих синтагматические отношения между морфемами, совершенствование морфемных токенизаторов и их интеграцию в языковые модели.

Ключевые слова: языковая модель, морфемный анализ, словообразовательные способы, композициональность.

Искусственный интеллект в решении проблемы онкопрофилактики: ретроспективное исследование

Петр Александрович Филоненко, Владимир Николаевич Кох, Павел Дмитриевич Блинов

1253-1266

Аннотация:

Исследована возможность эффективного решения задачи популяционной онкопрофилактики с помощью методов искусственного интеллекта (ИИ), прогнозирующих риск злокачественных новообразований (ЗНО) на основе минимального набора данных из электронной медицинской карты (ЭМК) – кодов медицинских диагнозов и услуг. Для решения поставленной задачи рассмотрен широкий спектр современных подходов, включающих методы классического машинного обучения, анализа выживаемости, глубокого обучения и больших языковых моделей (LLM). Численные эксперименты показали, что наилучшей способностью ранжирования пациентов по уровню риска ЗНО обладает градиентный бустинг, использующий модели анализа выживаемости в качестве дополнительных предикторов, что позволяет учитывать как популяционные, так и индивидуальные факторы риска ЗНО. Из данных ЭМК были сконструированы предикторы, включающие демографические характеристики, паттерны обращений за медицинской помощью и клинические маркеры. Это решение было протестировано в ретроспективных экспериментах под контролем профильных врачей-онкологов. В ретроспективном эксперименте с участием более 1.9 млн пациентов установлено, что в группу риска попадает до 5.4 раза больше пациентов с ЗНО при том же уровне медицинских обследований. Предложенный метод представляет собой масштабируемое решение, использующее исключительно коды диагнозов и услуг, не требующее специализированной инфраструктуры и интегрируемое в процесс онконастороженности, что делает его применимым для решения задач популяционной онкопрофилактики.

Ключевые слова: ИИ в медицине, популяционная онкопрофилактика, ретроспективные эксперименты.

Оценка флуктуационных характеристик распределённых объектов на основе оптического потока

Александр Михайлович Синица

415-431

Аннотация:

Предложен метод оценки флуктуационных характеристик распределённых объектов на основе флуктуационного анализа в предположении, что оценка оптического потока является аналогом приращений случайного блуждания. Достоверность и применимость метода проверены в двух вычислительных экспериментах. Первый эксперимент посвящён анализу броуновского движения компактного объекта. Во втором подтверждена адекватность метода для оценки динамических характеристик пространственно-распределённого флуктуирующего объекта. В рамках обоих экспериментов контроль показателя Херста осуществлен методом флуктуационного анализа с исключением тренда. Полученные результаты указывают на потенциальную применимость метода и необходимость его дальнейшей оптимизации с целью повышения робастности.

Ключевые слова: флуктуационный анализ, компьютерное зрение, распределенные объекты.

Алгоритмы индивидуализации обучения на основе композиции результатов педагогических экспериментов

Михаил Сергеевич Дьяченко

998-1026

Аннотация:

Рассмотрены различные аспекты практической реализации алгоритмов индивидуализированного обучения (основанные на результатах педагогических экспериментов) при обучении с преподавателем (в аудитории, дистанционно или в гибридном режиме) и при самостоятельной работе студента. Описанная система одновременно обучает студента материалам курса и приемам самостоятельного обучения, то есть образовательным технологиям, которые формируют индивидуальную образовательную траекторию. Подмножество образовательных технологий определяется индивидуально для каждого студента в группе. Образовательные технологии независимы от учебного курса и универсальны, поэтому могут применяться на последующих или параллельных курсах. Преподаватели могут описывать новые образовательные технологии в виде скриптов на языке Python без привлечения разработчиков. Предложенная реализация интегрируется с цифровой образовательной платформой Мирера для расширения возможностей платформы.

Ключевые слова: индивидуализация обучения, автоматизированная система обучения, цифровая образовательная платформа, адаптивное обучение.

Пост-коррекция слабой расшифровки большими языковыми моделями в итерационном процессе распознавания рукописей

Валерий Павлович Зыков, Леонид Моисеевич Местецкий

1385-1414

Аннотация:

Рассмотрена задача ускорения построения точной редакторской разметки рукописных архивных текстов в рамках инкрементного цикла обучения на основе слабой расшифровки. В отличие от ранее опубликованных результатов, основное внимание уделено интеграции автоматической посткоррекции слабой расшифровки с помощью больших языковых моделей (Large Language Models, LLM). Предложен и реализован протокол применения LLM на уровне строк в режиме обучения на нескольких примерах с тщательно сконструированными промптами и контролем формата вывода (сохранение дореформенной орфографии, защита имен и числительных, запрет на изменение структуры строк). Эксперименты проведены на корпусе дневников А. В. Сухово-Кобылина. В качестве базовой модели распознавания использована строчная версия модели Vertical Attention Network. Результаты показали, что LLM-коррекция на примере сервиса ChatGPT-4o заметно улучшает читабельность слабой разметки и существенно снижает процент ошибок в словах (в нашем опыте – порядка −12 процентных пунктов), при этом не внося ухудшения в проценте ошибок в буквах. Другой исследуемый сервис – DeepSeek-R1 – показал менее стабильное поведение. Рассмотрены практические настройки промптов, ограничения (контекстные лимиты, риск «галлюцинаций») и даны рекомендации по безопасной интеграции LLM-коррекции в итерационный пайплайн разметки с целью сокращения трудозатрат эксперта-асессора и ускорения оцифровки исторических архивов.

Ключевые слова: распознавание рукописного текста, слабая разметка, Vertical Attention Network (VAN), большие языковые модели (LLM), посткоррекция, итерационное дообучение.

Интеграция семантического и математического моделирования для анализа проблем энергетической безопасности

Алексей Геннадьевич Массель, Тимур Габилович Мамедов

842-859

Аннотация:

Рассмотрена задача интеграции когнитивного и математического моделирования в исследованиях направлений развития топливно-энергетического комплекса с учетом требований энергетической безопасности. Актуальность работы обусловлена тем, что в существующей двухуровневой технологии исследований переход от результатов качественного анализа с помощью когнитивного моделирования к параметрам математической модели в значительной степени выполняется вручную, что снижает воспроизводимость численных экспериментов и ограничивает эффективность использования накопленных знаний. Цель проведенного исследования состояла в разработке программного компонента, обеспечивающего совместное использование когнитивной и математической моделей в составе Экосистемы знаний в энергетике. Предложен программный компонент, реализованный в составе комплекса ИНТЭК-SAW и обеспечивающий преобразование изменений когнитивной модели в параметры экономико-математической модели, а также обратную интерпретацию результатов расчетов. Разработана технология проведения численного эксперимента, включающая построение семантических (онтологической и когнитивной) моделей, формирование вычислительного сценария, выполнение оптимизационных расчетов и представление результатов, отличающаяся автоматизацией совместного использования онтологических, когнитивных и экономико-математических моделей. Для учета неопределенности предложен численный метод стохастической корректировки параметров на основе когнитивных весов. Работоспособность подхода продемонстрирована на численном эксперименте по исследованию влияния ограничений выбросов CO₂ на топливно-энергетические балансы Сибирского федерального округа. Практическая значимость работы состоит в повышении обоснованности и воспроизводимости исследований развития топливно-энергетического комплекса за счет согласованного использования средств качественного и количественного анализа.

Ключевые слова: топливно-энергетический комплекс, энергетическая безопасность, когнитивное моделирование, онтологии, численный эксперимент, линейное программирование.

Абстрактивная суммаризация новостей внешней торговли на основе нового специализированного корпуса данных

Дарья Андреевна Лютова, Валентин Андреевич Малых

1120-1137

Аннотация:

Представлен TradeNewsSum — корпус для абстрактивной генерации аннотаций к новостям внешней торговли, охватывающий русско- и англоязычные публикации из профильных источников. Все рефераты подготовлены вручную по унифицированным правилам. Проведены эксперименты с дообучением трансформерных и seq2seq-моделей и автоматическую оценку по схеме LLM-as-a-judge. Наилучшие результаты показала LLaMA 3.1 в режиме инструкционного промптинга, продемонстрировав высокие значения по метрикам, включая фактологическую полноту.

Ключевые слова: абстрактивное реферирование, многоязычный корпус, новости внешней торговли, санкции, торговые режимы, TradeNewsSum, трансформеры, большие языковые модели, LLM-as-a-judge, NER-оценка сущностей.

Квантование Vision Transformer: CPU-центричный анализ компромисса между размером модели и скоростью инференса

Амир Рамисович Нигматуллин, Рустам Арифович Лукманов, Ахмад Таха

262-286

Аннотация:

Использование моделей Vision Transformer (ViT) в реальной медицинской практике, например в больницах или диагностических центрах, часто затруднено, потому что на рабочих компьютерах врачей обычно нет мощных графических процессоров (GPU), а имеющиеся вычислительные ресурсы ограничены. В настоящей работе рассмотрен полный путь практической реализации модели на этапе применения (pipeline инференса), направленный на снижение вычислительных затрат без существенной потери качества.

Предложенный подход объединяет несколько методов оптимизации.
Во-первых, использована дистилляция знаний (knowledge distillation) – метод обучения, при котором компактная модель копирует поведение более крупной и точной модели-учителя. Во-вторых, применено экспоненциальное скользящее среднее (Exponential Moving Average, EMA) весов, позволяющее стабилизировать обучение и повысить обобщающую способность модели.
В-третьих, исследована посттренировочная квантизация до целочисленного формата INT8 (post-training quantization, PTQ), направленная на уменьшение размера модели и ускорение инференса. Дополнительно рассмотрен упрощенный вариант квантизации совместно с обучением (QAT-lite), при котором эффекты квантизации частично учитываются во время дообучения модели.

Эксперименты проведены на датасете ISIC, содержащем дерматоскопические изображения кожных новообразований. Оценка качества моделей включает стандартные метрики классификации: точность (accuracy), макроусредненную F1-меру и площадь под ROC-кривой (ROC-AUC). Проанализированы характеристики производительности на центральном процессоре (CPU), включая задержку инференса, пропускную способность, потребление памяти и итоговый размер модели.

Полученные результаты показали, что посттренировочная INT8-квантизация позволяет сохранить качество, близкое к модели в формате FP32, при существенном снижении требований к памяти и вычислительным ресурсам. В то же время использование QAT-lite не демонстрирует устойчивых и воспроизводимых улучшений по сравнению с PTQ.

Ключевые слова: Визуальный трансформер (ViT), дистилляция знаний, экспоненциальная скользящая средняя (EMA), посттренировочная квантизация, обучение с учетом квантования.

Региональный опыт реализации «мягкой» модели обучения геометрии с опорой на компьютерный эксперимент

Милена Альбертовна Мичасова

99-108

Аннотация:

Представлены некоторые результаты реализации «мягкой» модели обучения геометрии в школах Нижегородской области с опорой на идеи экспериментальной математики, в соответствии с которыми отбирается и разрабатывается содержание учебных материалов, способствующих развитию интеллекта учащихся (открытые задачи по геометрии). Отмечены преимущества перехода от статического взгляда на геометрическую задачу к динамическому, от традиционного изучения геометрии – к экспериментальному при использовании специальных развивающих учебных заданий: открытых исследовательских задач. Особенностью предлагаемых открытых задач по геометрии является то, что они, будучи проекцией традиционных классических задач по геометрии, в то же время, во-первых обеспечивают формирование основных компонентов ментального (когнитивного, понятийного, метакогнитивного, интенционального) опыта ученика и, во-вторых, создают условия для проявления индивидуальных познавательных стилей учащихся. Обогащение метакогнитивного опыта осуществляется с помощью цепочек открытых задач, которые создают условия для формирования умений планировать, прогнозировать и контролировать свою математическую деятельность.

Ключевые слова: экспериментальная математика, открытые задачи по геометрии, математическая деятельность, основная школа.

Распределенное многоагентное моделирование радиотехнических систем, основанное на онтологиях

Андрей Олегович Щирый

1109-1125

Аннотация:

Подход к многоагентному моделированию, основанный на онтологиях, предполагает реализацию моделирующей системы посредством создания онтологий. Примером целостной реализации такого подхода к агентному моделированию является стандарт IEEE 1516 Standard for Modeling and Simulation High Level Architecture. Данная работа посвящена распределенной многоагентной моделирующей системе, предназначенной для моделирования сложных радиотехнических систем (особенно радиолокационных станций), её актуальность обусловлена необходимостью замены части натурных испытаний имитационными экспериментами. Мотивация перехода на стандарт IEEE 1516 для «тяжелой» многоагентной моделирующей системы, кроме прочего, состоит в обеспечении масштабируемости, открытости и многократного повторного использования разработанных агентных моделей, что совершенно логично делать на основе существующего хорошо проработанного и апробированного стандарта, устанавливающего правила взаимодействия моделей и разработки программных интерфейсов. В статье приведены общие принципы построения и архитектура моделирующей системы. Показаны основные требования к агентам, их роль и место в комплексной моделирующей системе, особое место среди агентов занимает имитатор фоно-целевой обстановки. Обсуждается также возможность совмещения двух схем имитационного моделирования: дискретно-событийной и пошаговой. Дело в том, что пошаговая схема обладает такими преимуществами, как простота и наглядность, в ней удобно моделировать алгоритмы обработки, составные части радиотехнических систем. Однако в ней невозможно реализовать истинную автономность и асинхронность агентов. Совмещение двух схем моделирования позволяет объединить их достоинства.

Ключевые слова: многоагентное моделирование, имитационное моделирование, дискретно-событийное моделирование, онтологии, радиотехнические системы, загоризонтные радиолокационные станции.

Исследование сходимости численных методов решения задач с оператором смешанного типа в неограниченной области

Михаил Павлович Галанин, Дмитрий Леонидович Сорокин

656-665

Аннотация: Проанализированы методы решения задач, базирующиеся на основной интегральной формуле Грина. Предложены новые методы решения задачи с оператором смешанного типа в неограниченной области. На основе этих методов созданы программы для решения задач с оператором смешанного типа. Приведены результаты вычислительных экспериментов, показывающие корректность применения методов.

Ключевые слова: неограниченная область, оператор смешанного типа, электродинамические ускорители рельсового типа, система уравнений Максвелла в квазистационарном приближении.

Издания XIX-XX века о телеграфе (по материалам электронных библиотек)

Юрий Евгеньевич Поляк

1157-1183

Аннотация:

В позапрошлом столетии произошли революционные изменения в передаче информации. Для функционирования оптического телеграфа, появившегося в конце XVIII века, были необходимы громоздкие башни для прямой видимости сигналов семафора. Сто лет спустя протяжённость телеграфных линий составляла сотни тысяч километров; на рубеже веков начались первые опыты применения беспроводного телеграфа. Информация об этом отражена в многочисленных брошюрах, книгах, периодических изданиях того времени. Ещё через сто лет многие из этих материалов стали общедоступными благодаря развитию интернета и электронных библиотек; они интенсивно сканируются и выкладываются в Сеть. Взрывной рост количества электронных библиотек и их информационного наполнения сделал возможным появление данной работы. Её цель – проследить эволюцию технологий и процессов передачи информации, отражённую в литературе, с помощью самых разнообразных электронных библиотек – от грандиозных проектов Библиотеки Конгресса и Google Books с их миллионами оцифрованных книг до скромных частных собраний, посвящённых локальным темам. Использованы материалы более 20 электронных библиотек.

Ключевые слова: электронные библиотеки, история техники, оптический телеграф, электромагнитный телеграф, трансатлантический кабель, радио.

Экспериментальное исследование порогового метода HSV и нейронной сети U-Net в задаче распознавания пожаров

Максим Владимирович Бобырь, Наталья Анатольевна Милостная, Богдан Андреевич Бондаренко, Максим Максимович Бобырь

829-851

Аннотация:

Проведен сравнительный анализ методов сегментации изображений пожара с использованием пороговой обработки в цветовом пространстве HSV и нейронной сети U-Net. Цель исследования заключалась в оценке эффективности этих подходов по времени выполнения и точности детекции огня на основе метрик RMSE, IoU, Dice и MAPE. Эксперименты были проведены на четырех различных изображениях пожара с вручную подготовленными истинными масками пожаров. Результаты показали, что метод HSV обеспечивает высокую скорость обработки (0.0010–0.0020 с), но склонен к детекции не только огня, но и дыма, что снижает его точность (IoU 0.0863–0.3357, Dice 0.1588–0.5026). Нейронная сеть U-Net демонстрирует более высокую точность сегментации огня (IoU – до 0.6015, Dice – до 0.7512) за счет избирательного выделения пламени, однако требует значительно большего времени (1.2477–1.3733 с) и может недооценивать общую площадь пожара (MAPE – до 78.5840%). Визуальная оценка подтвердила различия в поведении методов: HSV захватывает дым как часть целевой области, тогда как U-Net фокусируется исключительно на огне. Выбор между методами зависит от приоритетов задачи: скорости или точности. Предложены направления дальнейших исследований, включая оптимизацию U-Net и разработку гибридных подходов.

Ключевые слова: сегментирование, локализация пожаров, HSV-сегментация, U-Net.

Специализация использования микрокомпьютеров

Феликс Освальдович Каспаринский

746-769

Аннотация: С 2015 года в информационной среде появились микрокомпьютеры (микроПК), представляющие собой компактный системный блок с минимальным функционалом без периферии. В статье представлены результаты анализа использования 6 различных микрокомпьютеров в различных сферах деятельности. Цель исследования – определить лимитирующие факторы, влияющие на эффективность целевого применения микрокомпьютеров. Установлено, что для научно-образовательных презентаций, офисной и трейдерской деятельности в настоящее время целесообразно использовать безвентиляторные микрокомпьютеры с перфорированным корпусом и внутренней WiFi-антенной, не менее 4 Гб оперативной и 64 Гб постоянной памяти, разъёмом карты памяти microSD (TF, не менее 128 Гб, файловая система NTFS), графическим ускорителем GPU Intel HD Graphics, интерфейсами USB3.0 и HDMI. На основе сравнительных экспериментов созданы методические рекомендации по оптимизации конфигурирования аппаратно-программной среды микрокомпьютеров в стационарных и мобильных условиях. Проанализированы проблемы крупных обновлений Windows 10, а также совместимости программного обеспечения Microsoft Store и сторонних производителей. Рекомендовано специализировать отдельные микрокомпьютеры для работы с 32-битными приложениями; бухгалтерскими и криптографическими программами; а также проведения презентаций с их видеозаписью. Предложены варианты оптимального конфигурирования меню «Пуск» рабочего стола Windows 10. Сделан вывод, что специализация аппаратно-программной конфигурации современных микрокомпьютеров позволяет увеличить эффективность работы с применением одиночных устройств и их сопряжённых систем в соответствии со стандартами BYOD (Bring Your Own Device).

Ключевые слова: микрокомпьюрер, микроПК, Windows 10, конфигурация, наука, образование, бизнес, трейдинг, BYOD.

Обратная задача идентификации термофизических параметров модели Грина – Нагди III типа для упругого стержня на основе физически информированной нейронной сети

Яна Андреевна Вахтерова, Дарья Андреевна Леонтьева

852-869

Аннотация:

Исследована обратная задача идентификации безразмерного коэффициента теплопроводности для уравнения Грина – Нагди III типа, которое описывает распространение тепловых возмущений с конечной скоростью и учитывает инерционные эффекты теплового потока. Для обратной задачи нарушается требование устойчивости (критерий Адамара), в результате чего даже минимальные искажения данных ведут к значительным ошибкам идентификации параметра.
В качестве метода решения задачи идентификации использован подход на основе физически информированных нейронных сетей (ФИНС), сочетающий возможности глубокого обучения с априорными знаниями о структуре дифференциального уравнения. Параметр включен в число обучаемых переменных, а функция потерь сформирована на основе дифференциального уравнения, граничных условий, начальных условий и зашумленных экспериментальных данных с точечного датчика. Представлены результаты вычислительных экспериментов, демонстрирующие высокую точность восстановления параметра (погрешность менее 0.03%) и устойчивость метода к наличию аддитивного гауссовского шума в данных. Метод ФИНС показал себя как эффективный инструмент решения некорректных обратных задач математической физики.

Ключевые слова: обратная задача, модель Грина – Нагди III типа, термоупругость, глубокое машинное обучение, физически информированные нейронные сети.

Информация о российских научных организациях в международных и русскоязычных источниках данных

756-769

Аннотация:

Рассмотрены международные и русскоязычные источники данных, предоставляющие информацию о российских научных организациях. Продемонстрировано, что русскоязычные источники данных содержат больше информации о русскоязычных научных организациях, чем англоязычные, но эта информация остается недоступной для англоязычных источников данных. Также описаны эксперименты по сопоставлению и интеграции информации о российских научных организациях в международных и российских источниках данных. Рассмотрены такие источники данных, как GRID, русскоязычная и англоязычная Wikipedia, Wikidata и eLIBRARY.ru. Работа является промежуточным этапом на пути к созданию открытого и расширяемого графа знаний.

Ключевые слова: разноязычные графы знаний, идентификация сущностей, научные организации, корректность.

Инструмент для оперативной диагностики памяти нейросетевых архитектур языковых моделей

Павел Андреевич Гавриков, Азамат Комилжон угли Усманов, Дмитрий Реваев, Сергей Николаевич Бузыканов

1346-1367

Аннотация:

Большие языковые модели (Large Language Models, LLM) прошли путь от простых N-граммных систем до современных универсальных архитектур, однако ключевым ограничением остается квадратичная сложность механизма самовнимания по длине входной последовательности. Это существенно увеличивает потребление памяти и вычислительных ресурсов, а с появлением задач, требующих рекордно длинных контекстов, создает необходимость разработки новых архитектурных решений. Поскольку для исследования предлагаемой архитектуры требуется длительное и дорогостоящее обучение полновесной сети, необходимо разработать инструмент, который позволял бы быстро дать предварительную оценку архитектуре с точки зрения внутренней памяти.

В настоящей работе предложен метод количественной оценки внутренней памяти нейросетевых архитектур на основе синтетических тестов, не требующих больших корпусов данных. Под внутренней памятью понимается объем информации, который модель способна воспроизвести без обращения к исходным входам.

Для верификации подхода разработан программный комплекс, апробированный на архитектурах GPT-2 и Mamba. Использованы задачи копирования, инверсии и извлечения значения по ключу. Проведенное сравнение по точности предсказаний, распределению ошибок и вычислительным затратам позволяет оперативно оценивать эффективность и перспективность архитектур LLM.

Ключевые слова: большие языковые модели, архитектура нейросетей, внутренняя память, долговременное хранение информации, обработка последовательностей, измерение функциональной памяти, сравнение архитектур.

Новый метод описания вихревых ковариационных экологических данных

Равиль Рашидович Нигматуллин, Александр Алексеевич Литвинов, Сергей Игоревич Осокин

41-75

Аннотация:

Предложены основы оригинальной теории квазивоспроизводимых экспериментов (КВЭ), основанной на проверяемой гипотезе о наличии существенной корреляции (памяти) между последовательными измерениями. На основе этой гипотезы, которую авторы для краткости определяют как верифицируемый принцип частичной корреляции (ВПЧК), можно доказать, что существует универсальная подгоночная функция (УПФ) для квазивоспроизводимых (КВ) измерений. Другими словами, существуют некая общая платформа или «мост», на котором, образно говоря, «встречаются» истинная теория (претендующая на описание данных из первых принципов или проверяемых моделей) и эксперимент, предлагающий эту теорию для проверки измеренных данных, максимально «очищенных» от влияния неконтролируемых факторов и аппаратно-программной функции. Фактически предлагаемая теория дает потенциальному исследователю способ очистки исходных данных и в конечном итоге предлагает подгоночную кривую, которая описывает данные, является периодической и очищенной от набора неконтролируемых факторов. Окончательная подгоночная кривая соответствует идеальному эксперименту.

Предложенная теория была проверена на вихревых ковариационных экологических данных по количеству/балансу CH₄, CO₂ и паров воды H₂O в атмосфере, где расположены соответствующие детекторы для измерения содержания искомых газов.

Для этих проверенных данных вихревой ковариации, связанных с наличием в атмосфере двух газов CH₄, CO₂ и паров H₂O, не существует простой гипотезы, содержащей минимальное число подгоночных параметров, и, следовательно, подгоночная функция, следующая из этой теории, может служить единственным и надежным средством количественного описания такого рода данных, принадлежащих сложной системе. Следует также отметить, что окончательная подгоночная функция, очищенная от неконтролируемых факторов, становится периодической и соответствует идеальному эксперименту.

Обсуждены приложения этой теории, ее место среди других альтернативных подходов (особенно затрагивающих профессиональные интересы экологов) и её дальнейшее развитие.

Ключевые слова: квазивоспроизводимые эксперименты, сложные системы, верифицируемый принцип частичной корреляции, универсальная подгоночная функция, квазипериодические измерения, квазивоспроизводимые измерения, эффекты памяти, вихревая ковариация.

Генерация временных сигналов из статических изображений для подачи на спайковые нейронные сети

Александр Сергеевич Тощев

1061-1077

Аннотация:

Спайковые нейронные сети (далее — СНС, т. е. нейросети, передающие информацию во времени с помощью импульсов) требуют временного входа, тогда как в задачах компьютерного зрения данные чаще заданы статическими изображениями. В работе рассмотрено преобразование вида «изображение – временной сигнал – импульсы» и исследовано влияние способа входного кодирования на динамику обучения СНС, плотность импульсной активности и вычислительную стоимость обработки. В экспериментальной части реализованы и сопоставлены два семейства кодирования: кодирование по времени первого импульса (Latency) и пуассоновское кодирование по интенсивности (Poisson); для них рассмотрены четыре режима: базовый Latency без подавления фона, модифицированный Latency с порогом тишины, стохастический Poisson и детерминированный Poisson. В качестве метрик использованы среднее число импульсов на пример, число синаптических операций, прокси-показатель энергозатрат и характеристики конкуренции нейронов скрытого слоя. Эксперименты на наборе MNIST (60000 обучающих и 10000 тестовых изображений) для сети со скрытым слоем из 100 нейронов и горизонтом моделирования 200 шагов показали, что все исследованные режимы обеспечивают устойчивое обучение без коллапса активности. При этом модифицированный Latency с порогом тишины
оказался наиболее эффективным по соотношению «полезная активность — вычислительная стоимость»: при количестве спайков на один пример 323.41 для него число синаптических операций составило 14295.09, тогда как базовый Latency без фильтрации фона при близкой выходной активности (311.22 импульса на пример) потребовал 78400 синаптических операций.

Ключевые слова: спайковые нейронные сети, распознавание изображений, кодирование сигнала, кодирование изображений.

Сильные и слабые связи в научно-образовательном вебе

Андрей Анатольевич Печников

526-542

Аннотация: Веб-граф является наиболее популярной моделью фрагментов реального Веба, применяемой в науке о Вебе. Исследование сообществ в веб-графе способствует лучшему пониманию организации фрагмента Веба и процессов, происходящих в нём. Предложено выделить в веб-графе коммуникационный граф, содержащий только те вершины (и дуги между ними), которые имеют встречные дуги, и в нём исследовать задачу разбиения на сообщества. По аналогии с социальными исследованиями связи, реализуемые через ребра в коммуникационном графе, предложено называть «сильными», а все остальные – «слабыми». На сильных связях строятся тематические сообщества, имеющие содержательную интерпретацию. В то же время слабые связи способствуют коммуникациям между сайтами, не имеющими общих признаков по сфере деятельности, географии, подчиненности и т. д., и в основном сохраняют связность фрагментов Веба даже при отсутствии сильных связей. Эксперименты, проведенные для фрагмента научно-образовательного Веба России, показали возможность содержательной интерпретации полученных результатов и перспективность такого подхода.

Ключевые слова: веб-граф, коммуникационный граф, сообщество в графе, сила связей.

Информационно-аналитическая система сегментации изображений с помощью нейро-нечеткого подхода

Максим Владимирович Бобырь, Богдан Андреевич Бондаренко

601-621

Аннотация:

Представлена информационно-аналитическая система (ИАС) для высокоскоростной сегментации изображений в градациях серого, основанной на модифицированном методе дефаззификации с использованием треугольных функций принадлежности. Цель исследования заключается в анализе влияния упрощения формулы дефаззификации на точность и контрастность выделения объектов. Предложенный подход включает адаптивное обучение весового коэффициента, позволяющее динамически корректировать процесс дефаззификации в зависимости от целевых значений. Проведено сравнение базового метода усреднения значений принадлежности и модифицированного варианта с учетом нелинейных весов. Эксперименты, проведенные на изображениях формата 1024x720, продемонстрировали, что разработанная ИАС обеспечивает высокую точность сегментации и улучшенную контрастность объектов при минимальных вычислительных затратах. Результаты подтверждают превосходство предложенного метода над традиционными подходами, подчеркивая перспективы применения искусственного интеллекта в задачах компьютерного зрения.

Ключевые слова: ИАС, нейро-нечеткий алгоритм, сегментация изображений, дефаззификация, искусственный интеллект, метод отношения площадей.

Сравнительный анализ производительности механизмов метапрограммирования в языке Java

Азат Фердинандович Галиуллин, Ирина Сергеевна Шахова

985-996

Аннотация: Использование определенных механизмов метапрограммирования при разработке программных библиотек на языке Java может негативно сказываться на времени сборки и работе конечного программного продукта, в котором они используются. Для того, чтобы нивелировать воздействие различных подходов, необходимо предложить комплексное решение, позволяющее регулировать их использование в зависимости от особенностей контекста, что, в свою очередь, требует проведения предварительного анализа. В данной статье рассмотрены существующие в языке Java механизмы метапрограммирования и представлены результаты сравнения влияния данных подходов на время сборки Android-приложений.

Ключевые слова: annotation processing, Reflection, обработка аннотаций, рефлексия, кодогенерация, производительность, Android, Java.

Применение методов компьютерного зрения к распознаванию старотатарского текста

Искандер Айратович Валишин

448-477

Аннотация:

Разработан инструмент, распознающий строки, слова и арабские символы с отсканированного изображения. Рассмотрены возможности и перспективы применения инструмента в исследовательской деятельности. Приведены результаты экспериментов по проверке работоспособности инструмента на примере старотатарских оцифрованных произведений.

Ключевые слова: YOLO, распознавание арабских символов, нейронные сети, компьютерное зрение.

Русско-английский набор данных и выравнивание сущностей в графах знаний с несопоставимыми сущностями

Зинаида Владимировна Апанович, Даниил Георгиевич Керного

332-352

Аннотация:

В последние годы кратно возрос интерес к графам знаний (ГЗ) как в научном, так и в промышленном сообществах. Интеграция различных графов знаний является одной из актуальнейших задач и используется, например, для разработки сложных цифровых двойников промышленных систем. Интеграция графов знаний также необходима при объединении графов знаний, извлеченных из текстов на естественном языке при помощи больших языковых моделей. Одной из компонент решения задачи интеграции ГЗ является задача выравнивания сущностей, пытающаяся идентифицировать в разных ГЗ сущности, описывающие один и тот же объект реального мира. К сожалению, в реальных графах знаний многие сущности не имеют эквивалентов в других графах знаний. В частности, каждый фрагмент графа знаний, извлеченный из отдельной публикации, может иметь свою собственную структуру имен сущностей и идентификаторов, что существенно усложняет задачу идентификации сущностей. В работе описаны эксперименты по выравниванию сущностей при наличии несопоставимых сущностей на примере русско-английского набора данных

Ключевые слова: графы знаний, выравнивание сущностей, несопоставимые сущности, двусторонний поиск ближайшего соседа с порогом.

1 - 25 из 40 результатов 1 2 > >>