Электронные библиотеки

Дорогой посетитель!

Вы находитесь на сайте электронного научного журнала «Электронные библиотеки», посвященного оперативному отражению новых результатов теории и практики использования в России и за рубежом электронных библиотек – распределенных информационных систем, позволяющих обрабатывать, хранить, распространять, анализировать и организовывать поиск в разнообразных коллекциях электронных документов (текст, графика, аудио, видео и др.) через глобальные сети передачи данных. Журнал нацелен на формирование российского сообщества учёных, развивающих названное научное направление, и является в настоящее время единственным российским изданием, последовательно и систематически освещающим наиболее актуальные вопросы, связанные с развитием технологий электронных библиотек, которые в настоящее время становятся всё более существенными для совершенствования стандартов науки, экономики, образования, здравоохранения и качества жизни вообще. Научные электронные библиотеки играют важную роль в реализации активно поддерживаемых научным сообществом инициатив открытого доступа к результатам исследований, формировании открытой науки и глобальных репозиториев представления знаний и данных. Материалы журнала направлены на формирование российского сообщества ученых, экспертов и практиков, целенаправленно занимающимися вопросами использования технологий электронных библиотек для социально-экономического развития.

Аудитория журнала включает широкий круг специалистов в сфере создания и использования информационно-коммуникационных технологий; ученых и исследователей; работников сфер образования и культуры; частных лиц, интересующихся проблемами развития современного информационного общества. Материалы, публикуемые в журнале, проходят строгую процедуру рецензирования и экспертного отбора.

Том 29 № 4 (2026)

Опубликован: 13.07.2026

PDF

Фреймворк для анализа безопасности кода, генерируемого большими языковыми моделями в мультиагентном режиме

Давид Арменович Авагян, Каринэ Арсеновна Айрапетьянц

1082-1117

Аннотация:

Большие языковые модели находят все более широкое применение в области генерации программного кода. Однако тщательного изучения на предмет безопасности требуют как генерируемые программы, так и сами системы на основе языковых моделей. Одной из популярных техник повышения качества генерации является построение мультиагентной системы, состоящей из нескольких моделей. В статье исследовано качество работы языковых моделей GPT-OSS 20B, GPT-OSS 120B и Qwen3-Coder 480B в одиночном и мультиагентном режимах с использованием двух наборов задач для анализа безопасности кода: SecurityEval и CyberSecEval. Практическим результатом работы является расширяемый и масштабируемый фреймворк SafeAICoder для тестирования больших языковых моделей, поддерживающий распределенный режим работы для генерации многомодульных программ и тестов на сервере, без участия клиентского кода.

Ключевые слова: большие языковые модели, мультиагентные системы, программная инженерия, генерация кода, качество кода, безопасность кода, метрики.

PDF

Большие языковые модели в задаче разрешения лексической многозначности на материале русского языка

Полина Андреевна Гусяцкая, Наталья Валентиновна Лукашевич

1118-1132

Аннотация:

Статья посвящена описанию результатов экспериментов в области автоматического разрешения неоднозначности (англ. Word Sense Disambiguation, WSD) на материале русского языка при помощи генеративных (decoder-only) моделей малого и среднего размеров. Использование генеративных моделей напрямую не является оптимальным подходом к решению данной задачи, однако такие модели имеют потенциал в роли семантических разметчиков необработанных данных. Автоматизация семантической разметки текстов при помощи генеративных моделей потенциально способна преодолеть ограничивающий фактор в виде недостатка размеченных данных для обучения энкодеров.

Как показали более ранние исследования, флагманские англоязычные и мультиязычные модели способны достичь более 90%-ной аккуратности на данной задаче, модели меньшего размера – 80%+. Настоящее исследование ставит своей целью установить, решаема ли аналогичная задача на материале русского языка с помощью русифицированных моделей малого и среднего размеров (до 32 B), не требующих большого количества вычислительных ресурсов для использования.

Эксперименты по разрешению неоднозначности проведены как в базовой постановке (one/few-shot prompting), так и в различных модификациях (обогащение контекста словарной информацией – гиперонимами, гипонимами, метками тематической области и т. д., анализ широкого и узкого контекстных окон неоднозначной лексемы, ансамблевые подходы, в которых одна модель валидирует и корректирует предсказания другой). В качестве материала исследования использован русскоязычный размеченный ресурс RuSemCor, семантическая разметка которого соответствует категориям семантической сети RuWordNet.

По результатам экспериментов модели показали себя пригодными для решаемой задачи: все модели выходят за уровень случайного предсказания, а наиболее мощные достигают 80%-ной аккуратности, что сопоставимо с результатами англоязычных моделей того же размера. Более информативным для моделей показал себя широкий контекст неоднозначной лексемы. Подходы с дообогащением входных данных и ансамблевые методы дали значительный прирост в качестве.

Ключевые слова: разрешение лексической неоднозначности, большие языковые модели, компьютерная семантика, классификация.

PDF

Большие языковые модели в задаче оценки семантической близости словоупотреблений

Денис Владиславович Кокосинский

1133-1154

Аннотация:

В работе исследована применимость больших языковых моделей (Large Language Model, LLM) для решения задачи оценки семантической близости значений слова в паре словоупотреблений, известная как Word-in-Context (WiC) с опорой на мультиязычный бенчмарк CoMeDi. Предложены новые подходы к построению автоматических WiC-систем на основе LLM, в частности, конфигурация в которой предсказания LLM корректируются по обучающей выборке, но дообучения LLM при этом не требуется. Выполнено систематическое сравнение пяти различных конфигураций WiC-систем на основе LLM с точки зрения качества и с учетом вычислительных затрат. Результаты на тестовых выборках из семи языков показали, что предложенные подходы позволяют LLM превзойти все существующие специализированные системы, установив новый уровень качества на бенчмарке CoMeDi. Тем не менее достигнутое высокое качество сопряжено со значительным ростом вычислительных затрат: системы на базе LLM требуют на несколько порядков больше вычислений по сравнению с компактными специализированными моделями (такими как XL-DURel). Настоящая работа является одним из шагов к пониманию компромисса между точностью и ресурсоемкостью при использовании современных LLM в задачах лексической семантики.

Ключевые слова: Word-in-Context, большая языковая модель, обработка естественного языка.

PDF

Уверенность LLM при построении семантических классификаций аргументов

Даниил Сергеевич Ларионов, Елена Николаевна Никитина, Иван Валентинович Смирнов

1155-1173

Аннотация:

Исследована проблема квантификации уверенности больших языковых моделей (Large Language Model, LLM) при автоматической семантической классификации аргументов при эмотивных предикатах. На материале русскоязычных сообщений социальных сетей проанализированы глаголы страха (пугать, бояться и др.) и эмоционального отношения (нравиться, любить) с семантическими ролями экспериенцера, каузатора и объекта. В работе дано сравнение самооценки уверенности LLM Claude Sonnet 4.5 с экспертной оценкой текстов рассуждений модели при классификации аргументов по тематической области «Здравоохранение». В эксперименте использована стратифицированная выборка из 300 примеров с применением цепочки рассуждений на русском языке и четырехступенчатой шкалы уверенности. Результаты показали умеренную корреляцию Спирмена между оценками эксперта и модели. Статистически значимая связь установлена только между самооценкой модели и фактической корректностью классификации, тогда как экспертная оценка лингвистических характеристик рассуждений не зависит от точности. Сделан вывод о том, что эксплицитные рассуждения LLM не связаны напрямую с самооценкой по степени уверенности и не влияют на процесс принятия решений; они могут являться важной функциональной частью пользовательского интерфейса, но не исследовательского.

Ключевые слова: семантическая роль, классификация аргументов, эмотивный предикат, большие языковые модели, рассуждение LLM, уверенность LLM.

PDF

Сравнение подходов к задаче автоматической генерации официальных ответных писем с помощью LLM

Иван Евгеньевич Николаев, Андрей Витальевич Мельников, Кирилл Евгеньевич Алексеев, Александр Сергеевич Белоногов, Михаил Александрович Русанов

1174-1188

Аннотация:

Одной из важных задач автоматизации деятельности органов государственной власти является подготовка официальных ответных писем. В статье представлено эмпирическое сравнение двух подходов к автоматической генерации официальных ответных писем – на основе шаблонов, определяющих структуру письма, и на основе релевантных примеров писем, отбираемых с помощью Retrieval-Augmented Generation (RAG). В качестве данных использован оригинальный датасет GovLetter, включающий реальные случаи деловой переписки из практики органов власти Ханты-Мансийского автономного округа – Югры.
Генерация осуществлялась с помощью локально развернутой языковой модели с открытыми весами. Качество результатов оценивалось по 12 критериям с применением схемы структурированного промптинга Schema-Guided Reasoning (SGR) и методологии LLM-as-a-Judge. Результаты экспериментов показали, что подход на основе примеров превосходит подход на основе шаблонов по большинству метрик, особенно в точности передачи аргументов, соблюдении официального тона и корректности оформления. Полученные результаты подтверждают потенциал решений, опирающихся на историю документооборота, для эффективной автоматизации подготовки официальных ответных писем.

Ключевые слова: генерация текста, официальная переписка, большая языковая модель, генерация с дополненным извлечением данных, оценка качества, рассуждение управляемой схемой.

PDF

Предсказание качества автоматического распознавания речи на основе больших языковых моделей

Антон Полевой

1189-1211

Аннотация:

Предложен подход к прогнозированию показателя качества распознавания речи Word Error Rate (WER) на основе акустических характеристик сигнала и вычисления перплексии языковых моделей. Предлагаемый метод включает в себя создание разнообразных наборов аудиоданных путем применения различных типов акустических искажений к чистым речевым образцам на различных уровнях качества и разборчивости. В отличие от предыдущих работ, извлекается и анализируется полный набор речевых признаков: прогнозирование значения отношения сигнал/шум (signal-to-noise ratio, SNR), нейросетевые метрики качества звука (NISQA и др.), метрики уверенности модели распознавания речи, а также перплексия текста гипотезы ASR по языковой модели в качестве дополнительного признака для обучения единой модели прогнозирования WER.

Проведены эксперименты с использованием современных архитектур распознавания речи для демонстрации эффективности предлагаемого метода в прогнозировании WER в различных акустических условиях. Показано, что включение перплексии существенно повышает качество прогноза WER, в частности для данных, где акустические признаки слабо коррелируют с ошибками распознавания. Результаты применимы для автоматической оценки ожидаемого качества распознавания речи и фильтрации аудиовходов.

Ключевые слова: прогнозирование WER, акустическая деградация при распознавании речи, перплексия, уверенность систем автоматического распознавания речи.

PDF

Исследование таксономии с помощью рассуждающих больших языковых моделей и вызова функций

Фёдор Алексеевич Садковский, Михаил Михайлович Тихомиров, Наталья Валентиновна Лукашевич

1212-1234

Аннотация:

Рассмотрена задача пополнения таксономий – иерархических структур для организации понятий. Предложена архитектура на основе подхода ReAct (Reasoning + Acting), позволяющая пополнять таксономию в режиме zero-shot без дообучения больших языковых моделей. Система реализована в двух сценариях: автономная навигация от корневых узлов и верификация гипотез, сгенерированных другими моделями. Эксперименты на материале диахронического датасета RuWordNet показали, что прямое исследование таксономии от корня сталкивается с ограничениями, связанными со сложностью графа (MAP@3 = 24.6%). В то же время использование системы в качестве верификатора позволило улучшить качество предсказаний базовых моделей: прирост MAP@3 составил 9.5 п.п. для FastText и 1.1 п.п. для TaxoYandexGPT-5-Lite. Ключевыми преимуществами подхода являются универсальность, отсутствие необходимости дообучения и интерпретируемость за счет явных цепочек рассуждений.

Ключевые слова: таксономия, пополнение таксономий, извлечение гиперонимов, LLM, цепочка рассуждений, вызов функций, RuWordNet, переранжирование, компьютерная семантика.

PDF

Проблема построения синтетических психологических данных: опыт моделирования реакций на фрустрацию

Анфиса Анваровна Чуганская, Данил Алексеевич Киреев, Иван Валентинович Смирнов, Олег Георгиевич Григорьев

1235-1252

Аннотация:

Вопрос генерации синтетических данных для психологических исследований остается актуальным и сложным. Проблемы конфиденциальности, надежности, достоверности, валидности выводов остаются неравномерно представленными для различных областей психологии и фактически оказываются взаимосвязанными с решением вопроса использования синтетических данных в смежных науках – медицине, социологии, истории, политологии, экономике. Изучение различных психологических феноменов в рамках исследований больших социальных групп сопряжено с проблемами анализа сложно формализуемых конструктов. Под синтетическими общем виде понимают данные, искусственно сгенерированные на основе алгоритмов и моделирования.

В качестве основы настоящего исследования была выбрана классификация типов реакции на фрустрацию С. Розенцвейга. При анализе сетевого дискурса существует проблема малочисленности некоторых типов. Особенно это касается класса импунитивных реакций. В работе проанализирована возможность создания корпуса синтетических данных (на примере корпуса текстов реакций на фрустрацию), сгенерированными с помощью больших языковых моделей. При проведении экспериментов экспертами были созданы промпты и выполнена генерация примеров импунитивных реакций с помощью четырех больших языковых моделей, по 10 примеров каждого типа реакций. Была также дана проведена оценка контекстной достоверности и качества генерации. Полученные результаты позволяют определить слабые стороны генерации текстов со сложными психологическими феноменами для обучения нейросетевых моделей.

Ключевые слова: фрустрация, большая языковая модель (LLM), синтетические данные, искусственный интеллект, промпт, сетевая дискуссия, классификация Розенцвейга.

PDF

Система ограничений генерации для устранения структурных ошибок при создании дерева зависимостей с помощью большой языковой модели

Елена Денисовна Шамаева

1269-1292

Аннотация:

Для синтаксического анализа естественного языка перспективным направлением является дообучение больших языковых моделей для генерации синтаксической структуры предложения в виде скобочной последовательности формата Grammatical Relation Centered Tree (GRCT). Существующие дообученные модели демонстрируют высокие значения метрик оценки качества синтаксического анализа, однако в некоторых случаях генерируют некорректную скобочную последовательность (например, с несбалансированным числом открывающих и закрывающих скобок). В работе разработан метод, позволяющий уменьшить количество некорректно сгенерированых последовательностей. Для этого создана многоэтапная система ограничений субтокенов, генерируемых на каждом этапе работы большой языковой модели. Реализация этого метода протестирована на 4 моделях (адаптированные и неадаптированные модели размерами 4 и 8 млрд параметров) на датасете деревьев зависимостей SynTagRus. Для всех моделей количество некорректно сгенерированных последовательностей уменьшилось. Дополнительно установлено, что такие ограничения на генерацию влияют на качество собственно синтаксического анализа (может происходить повышение или понижение метрик оценки качества синтаксического анализа). Реализованная система ограничений может быть использована для повышения надежности работы любой большой языковой модели, дообученной для синтаксического анализа в формате скобочной последовательности GRCT. Полученные результаты опубликованы в открытом доступе.

Ключевые слова: синтаксический анализ, большие языковые модели, дообучение, ограничение вывода, автоматическая обработка текстов.

PDF

Семантический анализ корпуса научных статей на основе графового представления

Вадим Андреевич Чунихин, Сергей Александрович Зайцев, Ольга Муратовна Атаева

1253-1268

Аннотация:

Проблема эффективной навигации и поиска релевантной информации в постоянно растущем объеме научных публикаций требует перехода от классических методов полнотекстового поиска к семантическим моделям. В работе предложен подход к структурированию гетерогенного корпуса научных текстов путем построения графа знаний. Разработан конвейер обработки данных, включающий извлечение метаданных, ключевых слов и структурных элементов статей, а затем их интеграцию в единый граф. На основе построенного графа знаний реализованы методы анализа явных и извлечения неявных связей между публикациями. Результаты исследования демонстрируют эффективность графового представления научной информации для выявления скрытых закономерностей в предметных областях и поддержки интеллектуальной навигации.

Ключевые слова: семантический анализ, корпус научных статей, граф знаний, онтология, RDF, SPARQL, большие языковые модели, извлечение информации, графовые базы данных.

PDF

HaRuCo: новый русскоязычный корпус научно-популярных текстов с разметкой кореференции

Роман Денисович Шувалов, Елена Анатольевна Сидорова

1293-1303

Аннотация:

Представлен новый русскоязычный корпус с разметкой кореференции HaRuCo (Habr Russian Coreference Corpus). В качестве основы для корпуса взяты научно-популярные статьи, относящиеся к предметной области «Компьютерная лингвистика». Предложена методика разметки кореференции для текстов узких предметных областей, которая включает четыре основных этапа: синтаксический анализ текста; сборку именных групп и выделение местоимений для построения упоминаний (спанов); классификацию упоминаний классами предметной области; кластеризацию упоминаний в соответствии с цепочками кореферентно-связанных спанов. Аннотирование кореферентных связей осуществлено с применением синтаксического парсера и большой языковой модели, оно прошло ручную проверку и корректировку. Созданный корпус включает 3727 сущностей, 9905 упоминаний и 2683 кореферентных цепочек. Он может быть использован для обучения и оценки моделей разрешения кореференции для русского языка.

Ключевые слова: разрешение кореференции, разметка кореференции, корпус текстов, научно-популярный текст, методика разметки, разметка упоминаний, кластеризация упоминаний, кореферентная связь.

PDF

Определение эффективных механических характеристик нелинейного композиционного материала со сферическими наполнителями

Наиль Рашатович Батталов, Ислам Рамилевич Гарифуллин, Ленар Усманович Султанов, Ленар Рустамович Фахрутдинов

1304-1317

Аннотация:

Ключевые слова: нелинейно-упругий материал, материал Муни – Ривлина, RVE, метод наименьших квадратов, армированный композит.

PDF

Нечетко-логическая адаптация параметров скользящего окна при подготовке данных для больших языковых моделей

Максим Владимирович Бобырь, Наталья Анатольевна Милостная, Светлана Юрьевна Бельская

1318-1337

Аннотация:

Предложен нечеткий регулятор вычисления параметров скользящего окна для подготовки обучающих данных больших языковых моделей. Традиционный подход задает параметры «шаг окна» и «длина контекста» фиксированными константами, одинаковыми для всего текста, и не учитывает такие лингвистические характеристики отдельных фрагментов, как насыщенный научный текст и монотонный повторяющийся текст. Предлагаемый метод использует два автоматически вычисляемых признака фрагмента – лексическое разнообразие и среднюю длину BPE-токена. На основе алгоритма Мамдани с базой из 9 нечетко-логических правил и дефаззификацией методом центра тяжести нечеткий регулятор адаптивно вычисляет значения параметров «шаг окна» и «длина контекста» для каждого фрагмента. Предложенный подход имеет когнитивную интерпретацию, поскольку воспроизводит механизм адаптивного внимания человека при чтении, например, сложные фрагменты обрабатываются более внимательно при малом размере шага.

Ключевые слова: нечеткий вывод, алгоритм Мамдани, скользящее окно, LLM, Type-Token Ratio, BPE-токенизация, когнитивное моделирование, адаптивная обработка текста.

PDF

Адаптивная RAG-архитектура для задачи интеллектуального поиска в корпусе документов образовательных учреждений

Анна Дмитриевна Будревич, Михаил Михайлович Абрамский, Искандер Айратович Валишин

1338-1360

Аннотация:

Решена задача повышения качества интеллектуального поиска в корпусе документов образовательных учреждений, включающем учебные планы, рабочие программы дисциплин и нормативные акты. Классические архитектуры подхода «генерация, дополненная поиском» (Retrieval-Augmented Generation, RAG), основанные на единственном модуле поиска по обычному тексту, демонстрируют низкую точность работы на документах, включающих таблицы, логические связи между сущностями и строгие формулировки нормативных документов. Предложена адаптивная RAG-архитектура из четырех слоев, каждый из которых учитывает специфику хранения данных в подобных документах. Результаты показали, что учет структуры документов и адаптивная маршрутизация запросов существенно повышают фактическую корректность ответов. Предложенная архитектура может быть использована при проектировании интеллектуальных ассистентов для административных и учебно-методических сервисов высших учебных заведений.

Ключевые слова: RAG, RAG-архитектура, документы образовательных учреждений, интеллектуальный поиск, искусственный интеллект, обработка документов, семантические модели.

PDF

Разработка цифровой интеллектуальной сферы геологических знаний

Вера Викторовна Наумова

1361-1380

Аннотация:

На основе проведенного анализа цифровых технологий будущего, а также современных решений для поддержки научных исследований в геологии коллектива авторов Государственного геологического музея им. В. И. Вернадского РАН разработана и предложена архитектура цифровой интеллектуальной сферы геологических знаний. Основная концепция работы заключается в создании интегрированной цифровой экосистемы, где геологические коллекции, научные данные и экспертиза естественно-научных музеев становятся частью единого, доступного и интерактивного пространства. Это не просто оцифровка экспонатов, а построение связной среды для науки, образования и популяризации.

Ключевые слова: Единое цифровое пространство геологических знаний, цифровая геологическая среда будущего, геологические коллекции, научные данные, экспертиза естественно-научных музеев, цифровые инструменты, ИИ-ассистенты для геологии.

PDF

Применение графовых нейронных сетей для автоматической проверки информационных моделей зданий

Ольга Владимировна Полёткина, Ольга Муратовна Атаева

1381-1398

Аннотация:

Автоматизация проверки информационной модели здания на соответствие нормам пожарной безопасности остается актуальной задачей для архитектурно‑строительной отрасли. Существующие системы такой автоматизированной проверки ориентированы на подходы, основанные на правилах, которые не учитывают топологический контекст здания и плохо адаптируются к новым проектам.

В работе предложены и экспериментально проверены методы прогнозирования параметров противопожарной защиты дверей в информационных моделях зданий с использованием графовых нейронных сетей, а также валидация подхода на реальных проектных данных семи жилых зданий крупного застройщика. Предложена методология прогнозирования класса огнестойкости дверей на основе реляционных графовых сверточных сетей, а также разработан пайплайн извлечения данных из специального формата с построением графа и формированием признаков с учетом геометрических, семантических и топологических характеристик. Проведены эксперименты по прогнозированию наличия и класса огнестойкости с кросс-проектной валидацией по принципу «одно здание вне выборки». Разработанный подход позволяет автоматизировать проверку параметров противопожарной защиты и сократить время анализа моделей зданий. Применение графовых нейронных сетей обеспечивает учет топологического контекста и высокую точность прогнозирования, а использование реальных данных подтверждает практическую применимость метода.

Ключевые слова: информационная модель зданий, графовые нейронные сети, реляционная графовая нейросеть, огнестойкость дверей, открытый стандарт обмена данными IFC, автоматизированная проверка, графовое машинное обучение, кросс-проектная валидация.

PDF

Построение отображения «активность нейронов – класс» в сверточной спайковой нейронной сети с обучением по правилу STDP

Александр Сергеевич Тощев

1399-1417

Аннотация:

Исследована задача построения отображения между спайковой активностью сверточной спайковой нейронной сети и классом входного изображения. Такая задача появляется после обучения сети без учителя: сверточный слой формирует событийное представление изображения, но сама сеть не содержит готового механизма выдачи метки класса. В работе проведена проверка, насколько информативны счетчики спайков сверточного слоя после обучения по правилу STDP (пластичность, зависящая от времени возникновения импульсов, – биологически правдоподобное правило обучения для импульсных (спайковых) нейронных сетей), и оценено качество линейного считывающего классификатора при увеличении числа обучающих предъявлений.

Эксперименты проведены на наборе MNIST – стандартном наборе изображений рукописных цифр. Использована однослойная архитектура: один сверточный слой с 32 картами признаков, ядром 5 × 5 и выходной размерностью 32 × 24 × 24, что соответствует 18432 нейронам LIF (модель «интегратор с утечкой и порогом»). Входные изображения кодировались детерминированным пуассоновским кодировщиком; мультипликатор пуассоновского кодирования был равен 0.006. Длительность предъявления (время демонстрации объекта сети) составляла 100 тактов. Обучение выполнялось по правилу STDP с нуля, без возобновления из ранее сохраненного состояния. Для оценки использовался протокол сбора счетчиков спайков на 10000 обучающих и 10000 тестовых изображениях.

В основном эксперименте при 15000 обучающих предъявлениях STDP достигнута точность 0.8883. Базовый способ по карте меток, близкий к методу Diehl и Cook, в той же конфигурации дал около 0,48. Покрытие калиброванной карты меток составило 219 из 18432 нейронов, средняя активность – 4146.9416 спайка на изображение. Соседняя точка масштаба при 10000 обучающих предъявлениях дала точность 0.8876. Полученные результаты показывают, что выбранный способ считывания активности существенно влияет на итоговое качество классификации: линейный считывающий классификатор по полному вектору счетчиков сети извлекает распределенную информацию, которая теряется при простом назначении меток отдельным нейронам.

Ключевые слова: спайковые нейронные сети, сверточные спайковые сети, считывающий классификатор, счетчики спайков, классификация изображений.

PDF

Применение квантованных алгоритмов для адаптации языковых моделей в задаче верификации хода решения квадратных уравнений

Алмаз Наилевич Хайбуллин, Дмитрий Николаевич Тумаков

1418-1444

Аннотация:

Работа посвящена исследованию квантованных подходов к адаптации языковых моделей для задачи автоматической пошаговой проверки корректности хода решения квадратных уравнений. Рассмотрена результативность подходов параметрически эффективного дообучения (PEFT) при адаптации языковых моделей DeepSeek-R1-Distill-Qwen-1.5B и InternLM2-Math-Plus-1.8B для создания математического верификатора (Process-supervised Reward Models, PRM). Эксперименты проведены на синтетическом наборе данных квадратных уравнений, дополненном негативным сэмплированием для имитации ошибок обучающихся. Выполнено сравнительное тестирование стандартных (LoRA, DoRA, rsLoRA) и квантованных (QLoRA, QDoRA, LoftQ) алгоритмов тонкой настройки.
Дополнительно изучена обобщающая способность нейросетей (Zero-shot Transfer) на структурно отличающемся наборе линейных уравнений. Результаты показали, что квантование решает проблемы численной стабильности вычислений для нестандартных архитектур (InternLM2), обеспечивая при этом качество, сопоставимое со стандартными методами. Для модели DeepSeek-R1 метод QLoRA достиг точности (Accuracy) 97.77%, а методы QDoRA и LoftQ – по 98%, что лишь незначительно уступает классическому алгоритму LoRA (98.67%). Аналогично для нестандартной архитектуры InternLM2 применение QLoRA позволило достичь точности 92.67% (против 93% у базового LoRA). Однако алгоритмы без понижения разрядности весов (LoRA) склонны сохранять более богатое представление выученных паттернов, обеспечивая хорошую способность к переносу знаний для моделей класса Reasoning (Accuracy DeepSeek-R1 66.8% против 61.4% у QLoRA на новых данных).

Ключевые слова: языковые модели, параметрически эффективное дообучение, квантованные методы обучения, математическое рассуждение, автоматизированная проверка решений, модели вознаграждения с контролем за процессом.

PDF

Археометрия медных монет золотоордынского времени с болгарского городища как инструмент искусственного интеллекта

Резида Хавиловна Храмченкова, Джамиль Габдрахимович Мухаметшин, Артем Александрович Елизаров , Айрат Габитович Ситдиков, Павел Владимирович Федан

1445-1476

Аннотация:

Представлена пионерская работа в области изучения химического состава на микропримесном уровне медных археологических монет как информационной основы для выявления особенностей денежного обращения в средневековом государстве.

Проведено междисциплинарное исследование нумизматического материала с Болгарского городища из 98 медных монет, представленного 91 золотоордынской, шестью иноземными монетами того же периода и одной монетой домонгольского времени династии Зенгидов. Статья содержит атрибуцию с изображениями аверса и реверса монет, а также данные археометрического изучения денежных артефактов на предмет химического состава двумя независимыми методами – рентгенофлуоресцентным и эмиссионным спектральным.

На настоящий момент это первое междисциплинарное исследование в нашей стране, охватившее представительную коллекцию медных денег различных правителей и монетных дворов из археологических материалов Болгарского городища. В результате изучения химического состава монет были определены соотношения примесей в медных сплавах, что позволило разделить коллекцию на десять основных групп, включающих монеты различных чеканных дворов и правителей определенной датировки. Определение примесного состава позволяет не только классифицировать монеты по группам, но и выдвигать обоснованные гипотезы о географическом расположении месторождений меди, использовавшейся для чеканки.

База данных, сформированная по результатам исследования и объединяющая нумизматическую атрибуцию, изображения монет и данные об их химическом составе, опубликована как открытый набор данных в репозитории Zenodo и предназначена для применения методов машинного обучения и искусственного интеллекта в задачах автоматической идентификации и провениенс-анализа средневековых монет.

Ключевые слова: медные монеты династии Джучидов, химический состав, нумизматические данные, Болгарское городище, эмиссионный спектральный анализ, рентгенофлуоресцентный анализ, провениенс-анализ, археологические датасеты, машинное обучение, цифровая нумизматика.

PDF

Показать все выпуски

Электронные библиотеки

Текущий выпуск

Весь выпуск

Часть 1 Большие языковые модели в задачах анализа неструктурированной информации

Фреймворк для анализа безопасности кода, генерируемого большими языковыми моделями в мультиагентном режиме

Большие языковые модели в задаче разрешения лексической многозначности на материале русского языка

Большие языковые модели в задаче оценки семантической близости словоупотреблений

Уверенность LLM при построении семантических классификаций аргументов

Сравнение подходов к задаче автоматической генерации официальных ответных писем с помощью LLM

Предсказание качества автоматического распознавания речи на основе больших языковых моделей

Исследование таксономии с помощью рассуждающих больших языковых моделей и вызова функций

Проблема построения синтетических психологических данных: опыт моделирования реакций на фрустрацию

Система ограничений генерации для устранения структурных ошибок при создании дерева зависимостей с помощью большой языковой модели

Семантический анализ корпуса научных статей на основе графового представления

HaRuCo: новый русскоязычный корпус научно-популярных текстов с разметкой кореференции

Часть 2. Оригинальные статьи

Определение эффективных механических характеристик нелинейного композиционного материала со сферическими наполнителями

Нечетко-логическая адаптация параметров скользящего окна при подготовке данных для больших языковых моделей

Адаптивная RAG-архитектура для задачи интеллектуального поиска в корпусе документов образовательных учреждений

Разработка цифровой интеллектуальной сферы геологических знаний

Применение графовых нейронных сетей для автоматической проверки информационных моделей зданий

Построение отображения «активность нейронов – класс» в сверточной спайковой нейронной сети с обучением по правилу STDP

Применение квантованных алгоритмов для адаптации языковых моделей в задаче верификации хода решения квадратных уравнений

Археометрия медных монет золотоордынского времени с болгарского городища как инструмент искусственного интеллекта

Интересные сведения