Том 29 № 2 (2026) | Электронные библиотеки

Опубликован: 20.04.2026

Русско-английский набор данных и выравнивание сущностей в графах знаний с несопоставимыми сущностями

Зинаида Владимировна Апанович, Даниил Георгиевич Керного

332-352

Аннотация:

В последние годы кратно возрос интерес к графам знаний (ГЗ) как в научном, так и в промышленном сообществах. Интеграция различных графов знаний является одной из актуальнейших задач и используется, например, для разработки сложных цифровых двойников промышленных систем. Интеграция графов знаний также необходима при объединении графов знаний, извлеченных из текстов на естественном языке при помощи больших языковых моделей. Одной из компонент решения задачи интеграции ГЗ является задача выравнивания сущностей, пытающаяся идентифицировать в разных ГЗ сущности, описывающие один и тот же объект реального мира. К сожалению, в реальных графах знаний многие сущности не имеют эквивалентов в других графах знаний. В частности, каждый фрагмент графа знаний, извлеченный из отдельной публикации, может иметь свою собственную структуру имен сущностей и идентификаторов, что существенно усложняет задачу идентификации сущностей. В работе описаны эксперименты по выравниванию сущностей при наличии несопоставимых сущностей на примере русско-английского набора данных

Ключевые слова: графы знаний, выравнивание сущностей, несопоставимые сущности, двусторонний поиск ближайшего соседа с порогом.

PDF

Моделирование фрагментов контента Единого цифрового пространиства научных знаний

Светлана Александровна Власова, Николай Евгеньевич Каленов, Александр Николаевич Сотников

353-368

Аннотация:

Представлены новые результаты исследований, связанных с формированием Единого цифрового пространства научных знаний (ЕЦПНЗ). Работы в этом направлении ведутся с 2019 г. в ряде академических организаций, в том числе в Межведомственном суперкомпьютерном центре Российской академии наук (ныне Отделение суперкомпьютерных систем и параллельных вычислений Научно-исследовательского центра «Курчатовский институт»). В рамках этих исследований предложены структура онтологии ЕЦПНЗ и язык для ее описания, а также разработан ряд унифицированных программных средств, обеспечивающих формирование онтологии отдельных подпространств и ввод в ЕЦПНЗ различных типов и видов атрибутов объектов и именованных связей. В настоящее время проводится моделирование формирования контента ЕЦПНЗ на примере универсального и ряда тематических подпространств. В работе представлены результаты этого моделирования. Приведены атрибуты и связи объектов класса «Административные единицы», относящихся к подпространству «География», классов «Организации и их подразделения» и «Классификационные системы» универсального подпространства. Продемонстрирована возможность навигации по загруженным реальным ресурсам.

Ключевые слова: пространство научных знаний, онтология, именованные связи, загрузка данных, российские административные единицы, гербы городов.

PDF

Препринты ИПМ им. М. В. Келдыша: конвертация из MS Word в HTML

Андрей Артурович Воробьев, Римма Юрьевна Скорнякова

369-398

Аннотация:

В последние годы широкое распространение получило представление полных текстов научных статей в формате HTML, обладающем для онлайн-публикаций рядом преимуществ по сравнению с традиционно используемым форматом PDF за счет имеющихся в HTML более развитых средств для структуризации материала, встраивания мультимедийного контента и реализации разного рода интерактивных и динамических возможностей. В связи с этим актуальной становится задача преобразования рукописей из традиционно используемых авторами форматов MS Word и LaTeX в полноценную HTML-версию, способную реализовать преимущества такого формата. В работе представлены результаты применения к препринтам ИПМ им. М. В. Келдыша подхода к конвертации научных статей из формата MS Word в HTML, предложенного в предыдущих работах. Описаны интерактивные возможности полученных HTML-версий.

Ключевые слова: HTML-версия научной статьи, преобразование научных статей из формата .docx в .html, препринты ИПМ им. М. В. Келдыша, JATS XML.

PDF

Виртуальная выставка «Наука СССР в годы Великой Отечественной войны» как элемент Единого цифрового пространства научных знаний

Анастасия Геннадьевна Калина, Сергей Александрович Кириллов, Анна Валерьевна Лопухина, Ирина Николаевна Соболевская

399-413

Аннотация:

В работе представлен анализ виртуальной выставки «Наука СССР в годы Великой Отечественной войны», созданной в рамках Электронной библиотеки «Научное наследие России» (ЭБ ННР) как элемента формируемого Единого цифрового пространства научных знаний. Рассматривается создание и организация данной выставки в качестве модели интеграции разнородных цифровых ресурсов для систематизированного представления историко-научного контента. На основе комплексного подхода исследуются принципы формирования междисциплинарной коллекции. Проведен количественный и структурный анализ массива данных с выделением ключевых параметров: распределение материалов по языкам, годам выпуска, типам и научным дисциплинам с использованием рубрикатора ГРНТИ.

Описывается архитектура пользовательского интерфейса выставки. Показано, как технологические решения, реализованные на платформе ЭБ ННР, способствуют не только сохранению, но и актуализации научного наследия, обеспечивая его доступность для исследователей, преподавателей и широкой публики.

Ключевые слова: виртуальные выставки, цифровое наследие, научные коллекции, электронные книги, мультимедийные ресурсы, электронная библиотека «Научное наследие России», Единое цифровое пространство научных знаний.

PDF

Поиск точного решения задачи нескольких коммивояжеров

Олег Александрович Клименко, Борис Яковлевич Штейнберг

414-427

Аннотация:

В работе рассмотрена задача нескольких коммивояжеров. Она состоит в том, чтобы на графе со взвешенными дугами найти набор из заранее заданного количества непересекающихся циклов, у которого сумма весов дуг наибольшего цикла будет минимальной. Разработан точный алгоритм решения поставленной задачи, основанный на методе ветвей и границ. В построенном алгоритме, как и в известном алгоритме Балаша – Кристофидеса решения задачи одного коммивояжера, использован венгерский алгоритм решения задачи о назначениях. Представлены результаты численных экспериментов со случайными графами большой размерности.

Ключевые слова: задача коммивояжера, задача о назначениях, венгерский алгоритм, метод ветвей и границ, графы, дискретная оптимизация, гамильтонов цикл.

PDF

Ошибки искусственного интеллекта при решении комбинаторных задач

Елена Владимировна Крутенко, Борис Яковлевич Штейнберг

428-441

Аннотация:

Рассмотрено несколько упражнений по комбинаторике, которые искусственный интеллект (ИИ) решает с ошибками. Для тестирования были взяты системы ChatGPT и DeepSeek. Представлены вопросы (промпты) к этим системам и проанализированы полученные ответы. Выдвинуты гипотезы о причинах ошибок ИИ при решении рассматриваемых задач. Предположено, что подобные ошибки могут иметь место при использовании ИИ для разработки программного обеспечения и других применений.

Ключевые слова: нейросеть, искусственный интеллект, ошибки, комбинаторика, техническое задания.

PDF

Искусственный интеллект в нескольких фрагментах

Юрий Евгеньевич Поляк

442-485

Аннотация:

Работа представляет собой мозаику ярких фрагментов, описывающих отдельные аспекты искусственного интеллекта (ИИ). Это наброски общей картины, которая, вероятно, никогда не будет дописана, поскольку каждый день приносит информацию о новых достижениях, идеях и разработках, опасностях и угрозах. Обсуждение касается вопросов влияния ИИ на сокращения рабочих мест, разработки алгоритмов интеллектуальных игр, угроз и опасностей, исходящих от ИИ, этики ИИ, стандартов и международного регулирования ИИ. Каждый такой фрагмент – это обзор новейших (на середину января 2026 г.) российских и иностранных источников, включая цитаты, переводы, скриншоты и ссылки на оригинальные документы.

Ключевые слова: искусственный интеллект, Дартмутский семинар, предшественники ИИ, разработка алгоритмов интеллектуальных игр, угрозы и опасности, этика ИИ, регулирование искусственного интеллекта.

PDF

Разделение процессов потоков тепла в Северной Атлантике на различные составляющие и их анализ

Наталия Павловна Тучкова, Константин Павлович Беляев, Гурий Михайлович Михайлов, Ксения Алексеевна Ромашина

486-502

Аннотация:

Изучено распределение потоков тепла в Северной Атлантике, рассчитанное по схеме стохастического разностного уравнения, а именно по авторегрессионной схеме первого порядка со случайными коэффициентами. Использована база данных ERA 5, содержащая геофизические данные за 40 лет, с 1979 по 2018 г. Коэффициенты для последовательности авторегрессии определены на основе этих данных ранее и показано, что условия на коэффициенты обеспечивают существование и единственность решения этого разностного уравнения. Метод расчета распределений основан на последовательном интегрировании с использованием авторегрессионной схемы. Выполнены численные эксперименты и проведен их анализ. Установлено, что теоретически рассчитанные распределения хорошо соответствуют своим эмпирическим аналогам. Кроме того, при разбиении исходного временного ряда на выделенное среднее (тренд) и остаток, последний проанализирован как стационарный случайный процесс. Построены выборочные корреляционные функции и показано, что они хорошо аппроксимируются известными аналитическими выражениями, которые допускают фильтрацию и прогноз искомого процесса в явном виде. Численные расчеты выполнены на суперкомпьютере «Ломоносов-2» Московского государственного университета имени М. В. Ломоносова.

Ключевые слова: анализ данных наблюдений, диффузионный стохастический процесс, изменчивость теплового потока, уравнение Фоккера–Планка–Колмогорова, стохастическое разностное уравнение, уравнение Фредгольма.

PDF

Место языка Lisp при преподавании функционального программирования

Борис Леонидович Файфель, Лидия Васильевна Городняя

503-531

Аннотация:

Рассмотрены ключевые проблемы преподавания функционального программирования обучаемым, уже знакомым с императивной парадигмой. Описаны модель обучаемого и основные сложности, возникающие при преподавании функционального программирования в этом случае (изменяемые переменные, циклы, последовательные вычисления). Приведен развернутый пример перехода от императивной к функциональной парадигме. Подробно рассмотрен возврат функционального значения на примерах численного дифференцирования и интерполяции. Рассмотрена реализация отложенных вычислений, основанная на анонимных функциях. Показано, что использование мультипарадигменного языка Lisp удобно для первого знакомства с функциональной парадигмой.

Ключевые слова: язык программирования, Lisp, Common Lisp, HomeLisp, функциональное программирование.

PDF

Использование общедоступных архивов данных обработки ионограмм вертикального радиозондирования в роли первоначальной разметки для машинного обучения

Андрей Олегович Щирый

532-545

Аннотация:

В работе выдвинута идея использования имеющихся больших массивов результатов обработки ионограмм вертикального радиозондирования ионосферы в качестве обучающих датасетов для построения предиктивных моделей методами машинного обучения. Рассмотрены наиболее популярные форматы сохранения результатов обработки ионограмм, а также некоторые интернет-ресурсы с архивами свободно доступных файлов этих форматов. Указанные датасеты используются для построения предиктивных моделей, в том числе временных рядов критических частот ионосферных слоев. Отмечена также возможность использования некоторых датасетов результатов обработки ионограмм для обучения моделей, предназначенных для автоматической обработки ионограмм.

Ключевые слова: ионосфера, радиозондирование, вертикальное зондирование ионосферы, ионограмма, характеристики ионосферы, метаданные.

PDF

Анализ эффективности субсловных токенизаторов в малоресурсной лингвистической среде: опыт реализации на таджикском языке

Муллошараф Курбонович Арабов, Светлана Сергеевна Хайбуллина

546-564

Аннотация:

Рассмотрены современные подходы к субсловной токенизации текстов применительно к малоресурсному таджикскому языку, характеризуемому сложной морфологической структурой и высокой вариативностью словоформ. В ходе исследования был сформирован и предварительно обработан масштабный разнородный корпус, включающий 99 книг и 134497 текстовых статей различных жанров и тематик, общий объем которого превышает 33 млн токенов. Корпус был очищен от шумов, нормализован и использован в качестве основы для обучения и последующего тестирования субсловных моделей.

На базе названного корпуса были обучены и проанализированы пять моделей токенизации, реализующих алгоритмы BPE, WordPiece и Unigram с использованием библиотек Hugging Face Tokenizers и SentencePiece. Сравнительная оценка проведена по ряду ключевых показателей, включая долю неизвестных слов (OOV), степень сжатия текстового представления, скорость токенизации, а также характеристики распределения n-грамм, позволяющие оценить способность моделей отражать морфологическую и структурную организацию языка. Результаты экспериментов позволили выявить сильные и слабые стороны различных подходов к субсловной сегментации и определить наиболее эффективные стратегии токенизации в условиях морфологической сложности
таджикского языка. Полученные выводы могут быть использованы при разработке языковых моделей и прикладных NLP-инструментов для таджикского и других малоресурсных языков, способствуя расширению их присутствия в цифровой среде.

Ключевые слова: таджикский язык, субсловная токенизация, малоресурсные языки, BPE, Word-Piece, Unigram, Hugging Face Tokenizers, SentencePiece, корпусная лингвистика, обработка естественного языка (NLP).

PDF

Научные публикации и эмбеддинг-пространство знаний

Андреас Хачатурович Мариносян, Сергей Георгиевич Григорьев

565-594

Аннотация:

Рассмотрены актуальные проблемы наукометрии, возникающие на фоне роста публикационной активности и широкого внедрения технологий генеративного искусственного интеллекта. Проанализирован существующий наукометрический инструментарий анализа научной деятельности, подразделяемый на количественные метрики и методы картографирования науки (анализ сетей цитирований, академическая генеалогия, семантический анализ и др.). Сделана попытка преодоления ограничений традиционного цитатного анализа, таких как «семантическая слепота» и уязвимость к манипуляциям. В качестве возможного решения предложена концептуальная модель, в которой единицей анализа выступает не публикация в целом, а отдельное «ключевое утверждение». Такой подход предполагает фиксацию не только содержания тезиса, но и его типа, области релевантности и характера связей с другими утверждениями (подтверждение, опровержение, уточнение, обобщение и т. д.). В контексте данного подхода предложены принципы расчета модифицированных наукометрических метрик.

Представлены результаты апробации предложенной модели на массиве из 728 статей журнала «Информатика и образование» (2016–2025 гг.). С использованием больших языковых моделей проведен анализ, результаты которого показали, что ретроспективное извлечение утверждений сталкивается с трудностями, связанными со сложившейся культурой научной коммуникации; поэтому отмечено преимущество самостоятельного формулирования ключевых утверждений (как особого типа метаданных) непосредственно авторами публикаций. Намечены возможные пути развития концепции «эмбеддинг-пространства знаний», которая в перспективе могла бы дополнить существующие подходы анализа динамики развития научных идей и теорий.

Ключевые слова: наукометрия, академическая генеалогия, цитатный анализ, семантический анализ, большие языковые модели, карта науки, индекс Хирша, нанопубликации.

PDF

Методы искусственного интеллекта для решения интегрального уравнения с дробным интегралом Грюнвальда–Летникова

Тиен Дык Нгуен, Татьяна Юрьевна Горская

597-608

Аннотация:

Построена вычислительная схема приближенного решения интегрального уравнения с дробным интегралом Грюнвальда – Летникова, основанная на методе наименьших квадратов. Особенностью вычислительной схемы является использование нейронной сети при вычислении коэффициентов для метода наименьших квадратов. Актуальность исследования обусловлена тем, что в настоящее время искусственный интеллект все чаще применяется для решения многих практических задач, связанных с различными физическими процессами. Найдена оценка сходимости приближенных решений к точному решению. Рассмотрены возможные пути дальнейшего применения искусственного интеллекта для решения физических задач.

Ключевые слова: искусственный интеллект, нейронные сети, численные методы, интегральные уравнения, уравнения дробного порядка.

PDF

Моделирование и метод расчета усиливаемых нагруженных стержневых конструкций

Мурат Нуриевич Серазутдинов, Маджид Насриевич Убайдуллоев

611-626

Аннотация:

Представлены разработанные математические модели и вариационный метод расчета пространственных стержневых конструкций, усиленных в нагруженном состоянии. Эти модели и метод расчета имеют более широкие возможности по сравнению с существующими. Их использование позволяет выполнять расчеты стержневых систем, усиливаемых способами наращивания поперечных сечений стержней, изменения расчетной схемы и деформированного состояния. Рассмотрены сложные стержневые конструкции с различными формами поперечного сечения. В основе расчетов лежат гипотезы теории стержней Тимошенко. Для тонкостенных стержней дополнительно использованы положения теории тонкостенных стержней с учетом сдвиговых деформаций. Предполагается, что материал стержневого элемента следует диаграмме линейно упрочняющегося материала. Расчет напряжено-деформированного состояния (НДС) усиленной конструкции выполняется поэтапно. На начальной стадии вычисляются перемещения и напряжения в элементах конструкции под действием исходных нагрузок. На втором этапе определяются величины монтажных сил и напряжений, возникающих при присоединении усиливающих элементов к основным элементам конструкции. На последнем этапе выполняется расчет усиленной конструкции от воздействий дополнительных нагрузок, прикладываемых к конструкции после усиления. Рассмотрены примеры расчета эксплуатируемых конструкций, усиленных различными способами, с использованием предложенных моделей и метода расчета.

Ключевые слова: стержневая система, математическая модель, вариационный метод, напряженно-деформированное состояние, ремонт и усиление.

PDF

Онтологическая модель интеграции когнитивных и социологических данных для оценки персонала

Юрий Алексеевич Халин, Анна Алексеевна Ильина

627-650

Аннотация:

В условиях цифровой трансформации организаций и роста объемов данных появляется запрос на более прозрачные и объяснимые подходы к оценке сотрудников. Цель проведенного исследования состояла в проектировании и верификации онтологической модели (OWL 2/SHACL), которая интегрирует когнитивные показатели и социологические характеристики работников в единое пространство знаний для поддержки HR (Human Resources)-процессов – процессор управления человеческими ресурсами. Научная новизна работы заключается в разработке единой семантической модели, связывающей данные когнитивных тестов, опросников, контекста труда и показателей результативности; в формулировании компетентностных вопросов, запускающих механизм вывода в графе знаний; и в разработке паттернов для прогнозирования дефицитов компетенций, выявления риска перегрузки/выгорания с контролем этики и недискриминации. Предлагаемый подход опирается на методологии инженерии онтологий – METHONTOLOGY и NeOn, концепции семантического веба и методы психометрики.

Ключевые слова: онтология, OWL 2, SHACL, компетентностные вопросы (CQ), HR‑оценка, компетенции, когнитивные тесты, социологические опросники, reasoning, SPARQL, KPI/OKR, fairness, выгорание.

PDF

Весь выпуск

Часть 1. Тематический выпуск "Научный сервис в сети Интернет 2025", II

Русско-английский набор данных и выравнивание сущностей в графах знаний с несопоставимыми сущностями

Моделирование фрагментов контента Единого цифрового пространиства научных знаний

Препринты ИПМ им. М. В. Келдыша: конвертация из MS Word в HTML

Виртуальная выставка «Наука СССР в годы Великой Отечественной войны» как элемент Единого цифрового пространства научных знаний

Поиск точного решения задачи нескольких коммивояжеров

Ошибки искусственного интеллекта при решении комбинаторных задач

Искусственный интеллект в нескольких фрагментах

Разделение процессов потоков тепла в Северной Атлантике на различные составляющие и их анализ

Место языка Lisp при преподавании функционального программирования

Использование общедоступных архивов данных обработки ионограмм вертикального радиозондирования в роли первоначальной разметки для машинного обучения

Часть 2. Оригинальные статьи

Анализ эффективности субсловных токенизаторов в малоресурсной лингвистической среде: опыт реализации на таджикском языке

Научные публикации и эмбеддинг-пространство знаний

Методы искусственного интеллекта для решения интегрального уравнения с дробным интегралом Грюнвальда–Летникова

Моделирование и метод расчета усиливаемых нагруженных стержневых конструкций

Онтологическая модель интеграции когнитивных и социологических данных для оценки персонала