• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Как эмбеддинги имен сущностей влияют на качество выравнивания сущностей

Даниил Иванович Гусев, Зинаида Владимировна Апанович
52-79
Аннотация:

Алгоритмы установления соответствия между сущностями осуществляют поиск эквивалентных сущностей в разноязычных графах знаний. Данная проблема возникает, как правило, при интеграции разноязычных графов знаний. В настоящее время решение этой проблемы становится весьма актуальным для практического решения проблем импортозамещения, например, чтобы найти информацию о лекарствах, выпускаемых в разных странах под разными названиями, или же решить проблему поиска эквивалентных запчастей.


В настоящее время известно несколько библиотек с открытым кодом, которые объединяют известные алгоритмы выравнивания сущностей, а также тестовые наборы данных для различных языков. В данной работе описан русско-английский набор данных для экспериментов с нескольким популярными алгоритмами выравнивания сущностей. Особое внимание уделено методам генерации векторных представлений для имен сущностей. В частности, рассмотрены комбинации различных методов генерации векторных представлений (эмбеддингов) имен сущностей с известными алгоритмами выравнивания сущностей. Таблицы с результатами экспериментов дополнены визуализациями. 

Ключевые слова: разноязычные графы знаний, идентификация сущностей, cross-lingual entity alignment, knowledge graphs, relational embeddings, name embeddings.

Пост-коррекция слабой расшифровки большими языковыми моделями в итерационном процессе распознавания рукописей

Валерий Павлович Зыков, Леонид Моисеевич Местецкий
1385-1414
Аннотация:

Рассмотрена задача ускорения построения точной редакторской разметки рукописных архивных текстов в рамках инкрементного цикла обучения на основе слабой расшифровки. В отличие от ранее опубликованных результатов, основное внимание уделено интеграции автоматической посткоррекции слабой расшифровки с помощью больших языковых моделей (Large Language Models, LLM). Предложен и реализован протокол применения LLM на уровне строк в режиме обучения на нескольких примерах с тщательно сконструированными промптами и контролем формата вывода (сохранение дореформенной орфографии, защита имен и числительных, запрет на изменение структуры строк). Эксперименты проведены на корпусе дневников А. В. Сухово-Кобылина. В качестве базовой модели распознавания использована строчная версия модели Vertical Attention Network. Результаты показали, что LLM-коррекция на примере сервиса ChatGPT-4o заметно улучшает читабельность слабой разметки и существенно снижает процент ошибок в словах (в нашем опыте – порядка −12 процентных пунктов), при этом не внося ухудшения в проценте ошибок в буквах. Другой исследуемый сервис – DeepSeek-R1 – показал менее стабильное поведение. Рассмотрены практические настройки промптов, ограничения (контекстные лимиты, риск «галлюцинаций») и даны рекомендации по безопасной интеграции LLM-коррекции в итерационный пайплайн разметки с целью сокращения трудозатрат эксперта-асессора и ускорения оцифровки исторических архивов.

Ключевые слова: распознавание рукописного текста, слабая разметка, Vertical Attention Network (VAN), большие языковые модели (LLM), посткоррекция, итерационное дообучение.

Искусственный интеллект в решении проблемы онкопрофилактики: ретроспективное исследование

Петр Александрович Филоненко, Владимир Николаевич Кох, Павел Дмитриевич Блинов
1253-1266
Аннотация:

Исследована возможность эффективного решения задачи популяционной онкопрофилактики с помощью методов искусственного интеллекта (ИИ), прогнозирующих риск злокачественных новообразований (ЗНО) на основе минимального набора данных из электронной медицинской карты (ЭМК) – кодов медицинских диагнозов и услуг. Для решения поставленной задачи рассмотрен широкий спектр современных подходов, включающих методы классического машинного обучения, анализа выживаемости, глубокого обучения и больших языковых моделей (LLM). Численные эксперименты показали, что наилучшей способностью ранжирования пациентов по уровню риска ЗНО обладает градиентный бустинг, использующий модели анализа выживаемости в качестве дополнительных предикторов, что позволяет учитывать как популяционные, так и индивидуальные факторы риска ЗНО. Из данных ЭМК были сконструированы предикторы, включающие демографические характеристики, паттерны обращений за медицинской помощью и клинические маркеры. Это решение было протестировано в ретроспективных экспериментах под контролем профильных врачей-онкологов. В ретроспективном эксперименте с участием более 1.9 млн пациентов установлено, что в группу риска попадает до 5.4 раза больше пациентов с ЗНО при том же уровне медицинских обследований. Предложенный метод представляет собой масштабируемое решение, использующее исключительно коды диагнозов и услуг, не требующее специализированной инфраструктуры и интегрируемое в процесс онконастороженности, что делает его применимым для решения задач популяционной онкопрофилактики.

Ключевые слова: ИИ в медицине, популяционная онкопрофилактика, ретроспективные эксперименты.

Оценка флуктуационных характеристик распределённых объектов на основе оптического потока

Александр Михайлович Синица
415-431
Аннотация:

Предложен метод оценки флуктуационных характеристик распределённых объектов на основе флуктуационного анализа в предположении, что оценка оптического потока является аналогом приращений случайного блуждания. Достоверность и применимость метода проверены в двух вычислительных экспериментах. Первый эксперимент посвящён анализу броуновского движения компактного объекта. Во втором подтверждена адекватность метода для оценки динамических характеристик пространственно-распределённого флуктуирующего объекта. В рамках обоих экспериментов контроль показателя Херста осуществлен методом флуктуационного анализа с исключением тренда. Полученные результаты указывают на потенциальную применимость метода и необходимость его дальнейшей оптимизации с целью повышения робастности.

Ключевые слова: флуктуационный анализ, компьютерное зрение, распределенные объекты.

Инструмент для оперативной диагностики памяти нейросетевых архитектур языковых моделей

Павел Андреевич Гавриков, Азамат Комилжон угли Усманов, Дмитрий Реваев, Сергей Николаевич Бузыканов
1346-1367
Аннотация:

Большие языковые модели (Large Language Models, LLM) прошли путь от простых N-граммных систем до современных универсальных архитектур, однако ключевым ограничением остается квадратичная сложность механизма самовнимания по длине входной последовательности. Это существенно увеличивает потребление памяти и вычислительных ресурсов, а с появлением задач, требующих рекордно длинных контекстов, создает необходимость разработки новых архитектурных решений. Поскольку для исследования предлагаемой архитектуры требуется длительное и дорогостоящее обучение полновесной сети, необходимо разработать инструмент, который позволял бы быстро дать предварительную оценку архитектуре с точки зрения внутренней памяти.


В настоящей работе предложен метод количественной оценки внутренней памяти нейросетевых архитектур на основе синтетических тестов, не требующих больших корпусов данных. Под внутренней памятью понимается объем информации, который модель способна воспроизвести без обращения к исходным входам.


Для верификации подхода разработан программный комплекс, апробированный на архитектурах GPT-2 и Mamba. Использованы задачи копирования, инверсии и извлечения значения по ключу. Проведенное сравнение по точности предсказаний, распределению ошибок и вычислительным затратам позволяет оперативно оценивать эффективность и перспективность архитектур LLM.

Ключевые слова: большие языковые модели, архитектура нейросетей, внутренняя память, долговременное хранение информации, обработка последовательностей, измерение функциональной памяти, сравнение архитектур.

Новый метод описания вихревых ковариационных экологических данных

Равиль Рашидович Нигматуллин, Александр Алексеевич Литвинов, Сергей Игоревич Осокин
41-75
Аннотация:

Предложены основы оригинальной теории квазивоспроизводимых экспериментов (КВЭ), основанной на проверяемой гипотезе о наличии существенной корреляции (памяти) между последовательными измерениями. На основе этой гипотезы, которую авторы для краткости определяют как верифицируемый принцип частичной корреляции (ВПЧК), можно доказать, что существует универсальная подгоночная функция (УПФ) для квазивоспроизводимых (КВ) измерений. Другими словами, существуют некая общая платформа или «мост», на котором, образно говоря, «встречаются» истинная теория (претендующая на описание данных из первых принципов или проверяемых моделей) и эксперимент, предлагающий эту теорию для проверки измеренных данных, максимально «очищенных» от влияния неконтролируемых факторов и аппаратно-программной функции. Фактически предлагаемая теория дает потенциальному исследователю способ очистки исходных данных и в конечном итоге предлагает подгоночную кривую, которая описывает данные, является периодической и очищенной от набора неконтролируемых факторов. Окончательная подгоночная кривая соответствует идеальному эксперименту.


Предложенная теория была проверена на вихревых ковариационных экологических данных по количеству/балансу CH4, CO2 и паров воды H2O в атмосфере, где расположены соответствующие детекторы для измерения содержания искомых газов.


Для этих проверенных данных вихревой ковариации, связанных с наличием в атмосфере двух газов CH4, CO2 и паров H2O, не существует простой гипотезы, содержащей минимальное число подгоночных параметров, и, следовательно, подгоночная функция, следующая из этой теории, может служить единственным и надежным средством количественного описания такого рода данных, принадлежащих сложной системе. Следует также отметить, что окончательная подгоночная функция, очищенная от неконтролируемых факторов, становится периодической и соответствует идеальному эксперименту.


Обсуждены приложения этой теории, ее место среди других альтернативных подходов (особенно затрагивающих профессиональные интересы экологов) и её дальнейшее развитие.

Ключевые слова: квазивоспроизводимые эксперименты, сложные системы, верифицируемый принцип частичной корреляции, универсальная подгоночная функция, квазипериодические измерения, квазивоспроизводимые измерения, эффекты памяти, вихревая ковариация.

Сильные и слабые связи в научно-образовательном вебе

Андрей Анатольевич Печников
526-542
Аннотация: Веб-граф является наиболее популярной моделью фрагментов реального Веба, применяемой в науке о Вебе. Исследование сообществ в веб-графе способствует лучшему пониманию организации фрагмента Веба и процессов, происходящих в нём. Предложено выделить в веб-графе коммуникационный граф, содержащий только те вершины (и дуги между ними), которые имеют встречные дуги, и в нём исследовать задачу разбиения на сообщества. По аналогии с социальными исследованиями связи, реализуемые через ребра в коммуникационном графе, предложено называть «сильными», а все остальные – «слабыми». На сильных связях строятся тематические сообщества, имеющие содержательную интерпретацию. В то же время слабые связи способствуют коммуникациям между сайтами, не имеющими общих признаков по сфере деятельности, географии, подчиненности и т. д., и в основном сохраняют связность фрагментов Веба даже при отсутствии сильных связей. Эксперименты, проведенные для фрагмента научно-образовательного Веба России, показали возможность содержательной интерпретации полученных результатов и перспективность такого подхода.
Ключевые слова: веб-граф, коммуникационный граф, сообщество в графе, сила связей.

Информационно-аналитическая система сегментации изображений с помощью нейро-нечеткого подхода

Максим Владимирович Бобырь, Богдан Андреевич Бондаренко
601-621
Аннотация:

Представлена информационно-аналитическая система (ИАС) для высокоскоростной сегментации изображений в градациях серого, основанной на модифицированном методе дефаззификации с использованием треугольных функций принадлежности. Цель исследования заключается в анализе влияния упрощения формулы дефаззификации на точность и контрастность выделения объектов. Предложенный подход включает адаптивное обучение весового коэффициента, позволяющее динамически корректировать процесс дефаззификации в зависимости от целевых значений. Проведено сравнение базового метода усреднения значений принадлежности и модифицированного варианта с учетом нелинейных весов. Эксперименты, проведенные на изображениях формата 1024x720, продемонстрировали, что разработанная ИАС обеспечивает высокую точность сегментации и улучшенную контрастность объектов при минимальных вычислительных затратах. Результаты подтверждают превосходство предложенного метода над традиционными подходами, подчеркивая перспективы применения искусственного интеллекта в задачах компьютерного зрения.

Ключевые слова: ИАС, нейро-нечеткий алгоритм, сегментация изображений, дефаззификация, искусственный интеллект, метод отношения площадей.

Сравнительный анализ производительности механизмов метапрограммирования в языке Java

Азат Фердинандович Галиуллин, Ирина Сергеевна Шахова
985-996
Аннотация: Использование определенных механизмов метапрограммирования при разработке программных библиотек на языке Java может негативно сказываться на времени сборки и работе конечного программного продукта, в котором они используются. Для того, чтобы нивелировать воздействие различных подходов, необходимо предложить комплексное решение, позволяющее регулировать их использование в зависимости от особенностей контекста, что, в свою очередь, требует проведения предварительного анализа. В данной статье рассмотрены существующие в языке Java механизмы метапрограммирования и представлены результаты сравнения влияния данных подходов на время сборки Android-приложений.
Ключевые слова: annotation processing, Reflection, обработка аннотаций, рефлексия, кодогенерация, производительность, Android, Java.

Применение методов компьютерного зрения к распознаванию старотатарского текста

Искандер Айратович Валишин
448-477
Аннотация:

Разработан инструмент, распознающий строки, слова и арабские символы с отсканированного изображения. Рассмотрены возможности и перспективы применения инструмента в исследовательской деятельности. Приведены результаты экспериментов по проверке работоспособности инструмента на примере старотатарских оцифрованных произведений.

Ключевые слова: YOLO, распознавание арабских символов, нейронные сети, компьютерное зрение.

Визуальный редактор сценариев для виртуальных лабораторий

Виталий Денисович Абрамов, Михаил Михайлович Абрамский, Влада Владимировна Кугуракова, Надир Ринатович Манахов, Азат Мунирович Маславиев
483-501
Аннотация:

Представлена реализация визуального редактора сценариев, позволяющего проектировать серии экспериментов для виртуальных образовательных лабораторий. Описана связь приведенного подхода с возможностью явного управления вовлеченностью студентов и методами ее оценки.

Ключевые слова: виртуальные лаборатории, виртуальные симуляции, node-based editor, графический редактор сценариев, оценка вовлеченности.

Нейронная сеть для генерации изображений на основе текста песен с применением моделей OpenAI и CLIP

Алсу Ришатовна Давлетгареева, Ксения Александровна Едкова
437-455
Аннотация:

Исследована эффективность моделей ImageNet diffusion model и CLIP для генерации изображений по текстовому описанию. С использованием различных текстовых вводов на разных параметрах проведены два эксперимента для определения лучших параметров при генерации изображений на основе текстового описания. Результаты показали, что, хотя ImageNet хорошо справляется с созданием изображений, CLIP лучше обеспечивает соединение текстовых подсказок с релевантными изображениями. Полученные результаты характеризуют высокий потенциал объединения названных моделей для создания высококачественных и контекстно релевантных изображений на основе текстового описания.

Ключевые слова: генерация изображений, ImageNet diffusion model, CLIP, глубокое обучение, нейронные сети, обработка естественного языка.

Опровержение слуха средствами массовой информации: Математическая модель и численные эксперименты

Александр Петрович Михайлов, Александр Пхоун Чжо Петров
371-386
Аннотация:

Рассмотрен процесс, при котором в социуме распространяется недостоверный слух, которому противодействует вещание средств массовой информации. Недостоверность слуха в данном случае понимается так, что информация СМИ содержит опровержение и тем самым инокулирует индивидов, то есть делает их невосприимчивыми к слуху. В то же время индивиды, успевшие принять слух, перестают доверять средствам массовой информации и тем самым становятся недоступными для переубеждения. Для данного процесса предложена математическая модель в двух вариантах. Вариант с непрерывным временем позволяет выявить некоторые математические свойства модели. Вариант с дискретным временем более удобен для анализа реальных процессов, так как позволяет оценить параметры модели. Для оценки этих параметров использованы данные о рейтингах основных социально-политических программ российских телеканалов. Приведено несколько сценарных расчетов модели с этими параметрами. Основной вывод состоит в том, что если информация, распространяемая средствами массовой информации, не является вирусной, то есть не пересказывается зрителями своим соседям по социуму, то СМИ оказываются не в состоянии противостоять слухам.

Ключевые слова: математическое моделирование, информационное противоборство, численный эксперимент, слухи.

Интеллектуальный робот-химик: на пути к автономной лаборатории

Муса Шамильевич Адыгамов, Антон Олегович Голубь, Эмиль Ринатович Сайфуллин, Тимур Рустемович Гимадиев, Никита Юрьевич Серов
997-1014
Аннотация:

Представлена программно-аппаратная платформа, которая позволяет проводить химические синтезы в автоматическом режиме, включая приготовление реакционных смесей, их нагрев и перемешивание, а также отбор проб с разбавлением после синтеза и отправку на анализ методом высокоэффективной жидкостной хроматографии с последующей автоматической обработкой результатов. Для управления отдельными элементами роботизированной установки создана собственная библиотека ChemBot на языке Python, а для управления всей системой – клиентский веб-сервер; для просмотра состояния установки и хода выполнения синтезов разработан веб-интерфейс. Работа всей платформы по выполнению экспериментов протестирована при выполнении синтезов по альдольной конденсации, где варьировались соотношение реагентов, катализатор и его количество, температура и время синтеза. Написание собственного кода для контроля и управления всей системой стало важным шагом на пути интеграции роботизированной установки и искусственного интеллекта (ИИ), что в перспективе позволит осуществить переход к автономной лаборатории, когда предсказание целевой молекулы и ее синтеза, экспериментальное осуществление и анализ, а также, при необходимости, уточнение или изменение использованной модели будут осуществляться в автоматическом режиме, без вмешательства человека.

Ключевые слова: искусственный интеллект, роботизация, химический синтез, автономная лаборатория, хемоинформатика.

Система автоматизации численной оценки сходства Android-приложений

Валерий Владимирович Петров
336-365
Аннотация:

Работа посвящена проектированию и разработке системы автоматизации численной оценки сходства Android-приложений. Задача оценки сходства приложений сведена к оценке сходства множеств графов потока управления, построенных на основе кода из classes.dex файлов приложений. Значение сходства вычислено на основе матрицы сходства. Для сравнения графов потока управления использованы алгоритмы редактирования графов и расстояние Левенштейна. Сформулированы критерии сходства приложений и исследованы формы их представления. Представлены виды моделей Android-приложений и методы их построения. Разработан прототип системы автоматизации численной оценки сходства Android-приложений. С помощью инструментов параллельного программирования выполнена оптимизация программного решения. Проведены эксперименты и сделан вывод о способности разработанной системы выявлять сходства между Android-приложениями.

Ключевые слова: сходство Android-приложений, сходство программ, матрица сходства, расстояние редактирования графов потока управления, визуализация матрицы сходства, граф потока управления.

Контроллер реалистичного поведения стай/стад животных

Влада Владимировна Кугуракова, Александр Михайлович Степанов
239-272
Аннотация:

Работа посвящена рассмотрению процесса моделирования реалистичного контроллера поведения групп объектов. Проведено исследование основных приемов и принципов, используемых при создании реалистичного контроллера поведения автономных агентов, объединенных в связанные группы. На основе этих данных создан контроллер поведения.

Исследована эффективность поведения групп автономных агентов, рассмотрены возможности использования системы локальных скалярных полей с целью построения максимально точной математической модели, проведён анализ возможности создания иерархической системы мультиагентных подгрупп в рамках группы, проведены эксперименты для оценки корректности разработанного контролера.

Ключевые слова: контроллер, группа, модель поведения.

Инструмент для распознавания языка жестов из видеопотока в режиме реального времени

Искандер Илгизарович Закирьянов, Изида Зуфаровна Хаялеева, Искандер Айратович Валишин, Егор Дмитриевич Курито, Азат Нафисович Фасхутдинов
760-777
Аннотация:

Разработан инструмент, распознающий из видеопотока слова или отдельные буквы в режиме реального времени. Рассмотрены возможности и перспективы его применения в современном обществе. Приведены результаты экспериментов по проверке работоспособности этого инструмента на примере английских слов и латинских букв.

Ключевые слова: распознавание жестов, нейронные сети, компьютерное зрение, YOLO.

Анализ моделей векторных представлений слов в задаче разметки семантических ролей в русскоязычных текстах

Лейсан Маратовна Кадермятова, Елена Викторовна Тутубалина
1026-1043
Аннотация: Изучено влияние использования векторных представлений слов на качество установления семантических ролей в русскоязычных текстах. Задача установления семантических ролей в русскоязычных текстах получила широкое распространение после выхода на свет корпуса FrameBank. Были исследованы модели векторных представлений слов word2vec, fastText и ELMo (Embeddings from Language Models). Анализировались метрики качества микро- и макро-F1 как оценочные показатели результатов автоматической разметки актантов. Был проведен ряд экспериментов, демонстрирующих, что модели ELMo, основанные на токенах предикатно-аргументных конструкций, показывают больший прирост качества по сравнению со всеми остальными моделями, в том числе, в сопоставлении с моделями ELMo, обученными на леммах, как по величине микро-F1, так и по величине макро-F1.
Ключевые слова: машинное обучение, обработка естественного языка, векторные представления слов, семантические роли.

Автоматическое извлечение аргументативных отношений из текстов научной коммуникации

Юрий Алексеевич Загорулько, Елена Анатольевна Сидорова, Ирина Равильевна Ахмадеева
1070-1084
Аннотация:

Сложность задачи извлечения аргументативных структур связана с такими проблемами, как выделение аргументативных сегментов, прогнозирование дальних связей между неконтактными сегментами, обучение на данных, размеченных с низкой степенью согласованности между аннотаторами. В настоящей работе рассмотрен подход к извлечению аргументативных отношений из достаточно больших текстов, относящихся к области научной коммуникации. Проведен сравнительный анализ методов тонкой настройки с использованием предобученной языковой модели типа Longformer, позволяющей учитывать длинные контексты, и двух методов, позволяющих учитывать расхождения аннотаторов в разметке аргументов за счет использования так называемых мягких меток, полученных путем равномерного сглаживания меток и усреднения экспертных оценок. Эксперименты проводились на четырех наборах данных, содержащих положительные и отрицательные примеры пар утверждений (посылка, заключение) и различающихся способами сегментации и средним размером текста. Наилучшие результаты получены на модели с усреднением экспертных оценок. В то же время отмечено, что модель, использующая сглаженные метки, также повышает точность классификаторов, но ухудшает полноту.

Ключевые слова: анализ аргументации, извлечение аргументативных отношений, научная коммуникация, проблемы сегментации, мягкая метка, сглаживание меток, языковая модель.

Классификация изображений с помощью сверточных нейронных сетей

Сергей Алексеевич Филиппов
366-382
Аннотация:

Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.


Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.


Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.


Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.

Ключевые слова: распознавание изображений, нейронная сеть, сверточная нейронная сеть, классификация изображений, машинное обучение.

Некоторые программные инструменты для автоматизированного пополнения терминологического словаря предметной области

Роман Анатольевич Румянцев, Ольга Авенировна Невзорова
91-122
Аннотация: Описано приложение OntoDictionary, которое предназначено для работы с научными математическими статьями и онтологиями, созданными в редакторе Protege. Приложение способно создавать словарь онтологии, разбивать его элементы на концепты и обрабатывать их в булевом поиске. Имеется функционал для выделения определённых именных групп из математических статей. Новизна заключается в создании и методе обработки именных групп, содержащих формулы. Формулы обрабатываются независимо от их типа. Построен отбор кандидатов в термины. По всему функционалу произведён ряд экспериментов с онтологией математического знания OntoMathPRO, которая также была разработана в Казанском федеральном университете.
Ключевые слова: математическое знание, онтология, концепт, поисковый индекс, именная группа, кандидаты в термины.

О вопросе измерения вклада программистских решений в производительность программ

Лидия Васильевна Городняя, Татьяна Анатольевна Андреева
738-759
Аннотация:

Статья нацелена на привлечение внимания к вопросам, возникающим в связи с проблемой оценки влияния программируемых решений на продуктивность программирования и производительность программ в процессе обучения программированию и улучшения программных приложений с сохранением их правильности. Проанализированы результаты некоторых экспериментов по этим вопросам. Рассматривается гипотеза, что функциональные модели могут быть полезны как метрическая шкала, позволяющая отделять особенности используемых языков и систем программирования от характеристик программ и запрограммированных решений. Описаны результаты небольшого демонстрационного эксперимента, направленного на исследование зависимости производительности программ от выбора компилятора и отдельно от представления программируемых решений на определённом языке программирования. Анализ полученных результатов позволяет наметить подход к созданию методики, позволяющей выяснять такие зависимости. При создании методики может быть учтён многолетний опыт оценки учебных и олимпиадных работ по программированию, проявивший ряд не вполне очевидных аспектов проблемы.

Ключевые слова: измерение качества программ, продуктивность программирования,, производительность программ, программистские решения, функциональное программирование.

Исследование устойчивости совместной модели к возмущению начальных данных

Константин Павлович Беляев, Гурий Михайлович Михайлов, Алексей Николаевич Сальников, Наталия Павловна Тучкова
615-633
Аннотация: Задача устойчивости рассматривается в терминах классического определения Ляпунова. Для этого задается множество начальных условий, состоящих их данных предварительных расчетов, и анализируется разброс траекторий, полученных в результате численного моделирования. Эта процедура реализована как серия ансамблевых экспериментов с совместной моделью MPI-ESM института метеорологии М. Планка (Германия). Для численного моделирования задавалась серия различных начальных значений полей характеристик, и модель интегрировалась, начиная с каждого из этих полей, на различные временные периоды. Изучались экстремальные характеристики уровня океана за период 30 лет. Строилось их статистическое распределение, оценивались параметры этого распределения, изучался статистический прогноз на 5 лет вперед. Показано, что статистический прогноз уровня соответствует расчетному прогнозу, полученному по модели. Изучалась локализация экстремальных значений уровня и проводился анализ этих результатов. Численные расчеты выполнялись на суперкомпьютере Ломоносов-2 Московского государственного университета имени М.В. Ломоносова.
Ключевые слова: нелинейные модели циркуляции, численные ансамблевые эксперименты, анализ устойчивости модельных траекторий.

Абстрактивная суммаризация новостей внешней торговли на основе нового специализированного корпуса данных

Дарья Андреевна Лютова, Валентин Андреевич Малых
1120-1137
Аннотация:

Представлен TradeNewsSum — корпус для абстрактивной генерации аннотаций к новостям внешней торговли, охватывающий русско- и англоязычные публикации из профильных источников. Все рефераты подготовлены вручную по унифицированным правилам. Проведены эксперименты с дообучением трансформерных и seq2seq-моделей и автоматическую оценку по схеме LLM-as-a-judge. Наилучшие результаты показала LLaMA 3.1 в режиме инструкционного промптинга, продемонстрировав высокие значения по метрикам, включая фактологическую полноту.

Ключевые слова: абстрактивное реферирование, многоязычный корпус, новости внешней торговли, санкции, торговые режимы, TradeNewsSum, трансформеры, большие языковые модели, LLM-as-a-judge, NER-оценка сущностей.

Квантование Vision Transformer: CPU-центричный анализ компромисса между размером модели и скоростью инференса

Амир Рамисович Нигматуллин, Рустам Арифович Лукманов, Ахмад Таха
262-286
Аннотация:

Использование моделей Vision Transformer (ViT) в реальной медицинской практике, например в больницах или диагностических центрах, часто затруднено, потому что на рабочих компьютерах врачей обычно нет мощных графических процессоров (GPU), а имеющиеся вычислительные ресурсы ограничены. В настоящей работе рассмотрен полный путь практической реализации модели на этапе применения (pipeline инференса), направленный на снижение вычислительных затрат без существенной потери качества.


Предложенный подход объединяет несколько методов оптимизации.
Во-первых, использована дистилляция знаний (knowledge distillation) – метод обучения, при котором компактная модель копирует поведение более крупной и точной модели-учителя. Во-вторых, применено экспоненциальное скользящее среднее (Exponential Moving Average, EMA) весов, позволяющее стабилизировать обучение и повысить обобщающую способность модели.
В-третьих, исследована посттренировочная квантизация до целочисленного формата INT8 (post-training quantization, PTQ), направленная на уменьшение размера модели и ускорение инференса. Дополнительно рассмотрен упрощенный вариант квантизации совместно с обучением (QAT-lite), при котором эффекты квантизации частично учитываются во время дообучения модели.


Эксперименты проведены на датасете ISIC, содержащем дерматоскопические изображения кожных новообразований. Оценка качества моделей включает стандартные метрики классификации: точность (accuracy), макроусредненную F1-меру и площадь под ROC-кривой (ROC-AUC). Проанализированы характеристики производительности на центральном процессоре (CPU), включая задержку инференса, пропускную способность, потребление памяти и итоговый размер модели.


Полученные результаты показали, что посттренировочная INT8-квантизация позволяет сохранить качество, близкое к модели в формате FP32, при существенном снижении требований к памяти и вычислительным ресурсам. В то же время использование QAT-lite не демонстрирует устойчивых и воспроизводимых улучшений по сравнению с PTQ.

Ключевые слова: Визуальный трансформер (ViT), дистилляция знаний, экспоненциальная скользящая средняя (EMA), посттренировочная квантизация, обучение с учетом квантования.
1 - 25 из 33 результатов 1 2 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества