Дорогой посетитель!
Вы находитесь на сайте электронного научного журнала «Электронные библиотеки», посвященного оперативному отражению новых результатов теории и практики использования в России и за рубежом электронных библиотек – распределенных информационных систем, позволяющих обрабатывать, хранить, распространять, анализировать и организовывать поиск в разнообразных коллекциях электронных документов (текст, графика, аудио, видео и др.) через глобальные сети передачи данных. Журнал нацелен на формирование российского сообщества учёных, развивающих названное научное направление, и является в настоящее время единственным российским изданием, последовательно и систематически освещающим наиболее актуальные вопросы, связанные с развитием технологий электронных библиотек, которые в настоящее время становятся всё более существенными для совершенствования стандартов науки, экономики, образования, здравоохранения и качества жизни вообще. Научные электронные библиотеки играют важную роль в реализации активно поддерживаемых научным сообществом инициатив открытого доступа к результатам исследований, формировании открытой науки и глобальных репозиториев представления знаний и данных. Материалы журнала направлены на формирование российского сообщества ученых, экспертов и практиков, целенаправленно занимающимися вопросами использования технологий электронных библиотек для социально-экономического развития.
Аудитория журнала включает широкий круг специалистов в сфере создания и использования информационно-коммуникационных технологий; ученых и исследователей; работников сфер образования и культуры; частных лиц, интересующихся проблемами развития современного информационного общества. Материалы, публикуемые в журнале, проходят строгую процедуру рецензирования и экспертного отбора.
Текущий выпуск
Том 29 № 2 (2026)
Опубликован: 20.04.2026
Весь выпуск
Часть 1. Тематический выпуск "Научный сервис в сети Интернет 2025", II
Русско-английский набор данных и выравнивание сущностей в графах знаний с несопоставимыми сущностями
В последние годы кратно возрос интерес к графам знаний (ГЗ) как в научном, так и в промышленном сообществах. Интеграция различных графов знаний является одной из актуальнейших задач и используется, например, для разработки сложных цифровых двойников промышленных систем. Интеграция графов знаний также необходима при объединении графов знаний, извлеченных из текстов на естественном языке при помощи больших языковых моделей. Одной из компонент решения задачи интеграции ГЗ является задача выравнивания сущностей, пытающаяся идентифицировать в разных ГЗ сущности, описывающие один и тот же объект реального мира. К сожалению, в реальных графах знаний многие сущности не имеют эквивалентов в других графах знаний. В частности, каждый фрагмент графа знаний, извлеченный из отдельной публикации, может иметь свою собственную структуру имен сущностей и идентификаторов, что существенно усложняет задачу идентификации сущностей. В работе описаны эксперименты по выравниванию сущностей при наличии несопоставимых сущностей на примере русско-английского набора данных
Моделирование фрагментов контента Единого цифрового пространиства научных знаний
Представлены новые результаты исследований, связанных с формированием Единого цифрового пространства научных знаний (ЕЦПНЗ). Работы в этом направлении ведутся с 2019 г. в ряде академических организаций, в том числе в Межведомственном суперкомпьютерном центре Российской академии наук (ныне Отделение суперкомпьютерных систем и параллельных вычислений Научно-исследовательского центра «Курчатовский институт»). В рамках этих исследований предложены структура онтологии ЕЦПНЗ и язык для ее описания, а также разработан ряд унифицированных программных средств, обеспечивающих формирование онтологии отдельных подпространств и ввод в ЕЦПНЗ различных типов и видов атрибутов объектов и именованных связей. В настоящее время проводится моделирование формирования контента ЕЦПНЗ на примере универсального и ряда тематических подпространств. В работе представлены результаты этого моделирования. Приведены атрибуты и связи объектов класса «Административные единицы», относящихся к подпространству «География», классов «Организации и их подразделения» и «Классификационные системы» универсального подпространства. Продемонстрирована возможность навигации по загруженным реальным ресурсам.
Препринты ИПМ им. М. В. Келдыша: конвертация из MS Word в HTML
В последние годы широкое распространение получило представление полных текстов научных статей в формате HTML, обладающем для онлайн-публикаций рядом преимуществ по сравнению с традиционно используемым форматом PDF за счет имеющихся в HTML более развитых средств для структуризации материала, встраивания мультимедийного контента и реализации разного рода интерактивных и динамических возможностей. В связи с этим актуальной становится задача преобразования рукописей из традиционно используемых авторами форматов MS Word и LaTeX в полноценную HTML-версию, способную реализовать преимущества такого формата. В работе представлены результаты применения к препринтам ИПМ им. М. В. Келдыша подхода к конвертации научных статей из формата MS Word в HTML, предложенного в предыдущих работах. Описаны интерактивные возможности полученных HTML-версий.
Виртуальная выставка «Наука СССР в годы Великой Отечественной войны» как элемент Единого цифрового пространства научных знаний
В работе представлен анализ виртуальной выставки «Наука СССР в годы Великой Отечественной войны», созданной в рамках Электронной библиотеки «Научное наследие России» (ЭБ ННР) как элемента формируемого Единого цифрового пространства научных знаний. Рассматривается создание и организация данной выставки в качестве модели интеграции разнородных цифровых ресурсов для систематизированного представления историко-научного контента. На основе комплексного подхода исследуются принципы формирования междисциплинарной коллекции. Проведен количественный и структурный анализ массива данных с выделением ключевых параметров: распределение материалов по языкам, годам выпуска, типам и научным дисциплинам с использованием рубрикатора ГРНТИ.
Описывается архитектура пользовательского интерфейса выставки. Показано, как технологические решения, реализованные на платформе ЭБ ННР, способствуют не только сохранению, но и актуализации научного наследия, обеспечивая его доступность для исследователей, преподавателей и широкой публики.
Поиск точного решения задачи нескольких коммивояжеров
В работе рассмотрена задача нескольких коммивояжеров. Она состоит в том, чтобы на графе со взвешенными дугами найти набор из заранее заданного количества непересекающихся циклов, у которого сумма весов дуг наибольшего цикла будет минимальной. Разработан точный алгоритм решения поставленной задачи, основанный на методе ветвей и границ. В построенном алгоритме, как и в известном алгоритме Балаша – Кристофидеса решения задачи одного коммивояжера, использован венгерский алгоритм решения задачи о назначениях. Представлены результаты численных экспериментов со случайными графами большой размерности.
Ошибки искусственного интеллекта при решении комбинаторных задач
Рассмотрено несколько упражнений по комбинаторике, которые искусственный интеллект (ИИ) решает с ошибками. Для тестирования были взяты системы ChatGPT и DeepSeek. Представлены вопросы (промпты) к этим системам и проанализированы полученные ответы. Выдвинуты гипотезы о причинах ошибок ИИ при решении рассматриваемых задач. Предположено, что подобные ошибки могут иметь место при использовании ИИ для разработки программного обеспечения и других применений.
Искусственный интеллект в нескольких фрагментах
Работа представляет собой мозаику ярких фрагментов, описывающих отдельные аспекты искусственного интеллекта (ИИ). Это наброски общей картины, которая, вероятно, никогда не будет дописана, поскольку каждый день приносит информацию о новых достижениях, идеях и разработках, опасностях и угрозах. Обсуждение касается вопросов влияния ИИ на сокращения рабочих мест, разработки алгоритмов интеллектуальных игр, угроз и опасностей, исходящих от ИИ, этики ИИ, стандартов и международного регулирования ИИ. Каждый такой фрагмент – это обзор новейших (на середину января 2026 г.) российских и иностранных источников, включая цитаты, переводы, скриншоты и ссылки на оригинальные документы.
Разделение процессов потоков тепла в Северной Атлантике на различные составляющие и их анализ
Изучено распределение потоков тепла в Северной Атлантике, рассчитанное по схеме стохастического разностного уравнения, а именно по авторегрессионной схеме первого порядка со случайными коэффициентами. Использована база данных ERA 5, содержащая геофизические данные за 40 лет, с 1979 по 2018 г. Коэффициенты для последовательности авторегрессии определены на основе этих данных ранее и показано, что условия на коэффициенты обеспечивают существование и единственность решения этого разностного уравнения. Метод расчета распределений основан на последовательном интегрировании с использованием авторегрессионной схемы. Выполнены численные эксперименты и проведен их анализ. Установлено, что теоретически рассчитанные распределения хорошо соответствуют своим эмпирическим аналогам. Кроме того, при разбиении исходного временного ряда на выделенное среднее (тренд) и остаток, последний проанализирован как стационарный случайный процесс. Построены выборочные корреляционные функции и показано, что они хорошо аппроксимируются известными аналитическими выражениями, которые допускают фильтрацию и прогноз искомого процесса в явном виде. Численные расчеты выполнены на суперкомпьютере «Ломоносов-2» Московского государственного университета имени М. В. Ломоносова.
Место языка Lisp при преподавании функционального программирования
Рассмотрены ключевые проблемы преподавания функционального программирования обучаемым, уже знакомым с императивной парадигмой. Описаны модель обучаемого и основные сложности, возникающие при преподавании функционального программирования в этом случае (изменяемые переменные, циклы, последовательные вычисления). Приведен развернутый пример перехода от императивной к функциональной парадигме. Подробно рассмотрен возврат функционального значения на примерах численного дифференцирования и интерполяции. Рассмотрена реализация отложенных вычислений, основанная на анонимных функциях. Показано, что использование мультипарадигменного языка Lisp удобно для первого знакомства с функциональной парадигмой.
Использование общедоступных архивов данных обработки ионограмм вертикального радиозондирования в роли первоначальной разметки для машинного обучения
В работе выдвинута идея использования имеющихся больших массивов результатов обработки ионограмм вертикального радиозондирования ионосферы в качестве обучающих датасетов для построения предиктивных моделей методами машинного обучения. Рассмотрены наиболее популярные форматы сохранения результатов обработки ионограмм, а также некоторые интернет-ресурсы с архивами свободно доступных файлов этих форматов. Указанные датасеты используются для построения предиктивных моделей, в том числе временных рядов критических частот ионосферных слоев. Отмечена также возможность использования некоторых датасетов результатов обработки ионограмм для обучения моделей, предназначенных для автоматической обработки ионограмм.
Часть 2. Оригинальные статьи
Анализ эффективности субсловных токенизаторов в малоресурсной лингвистической среде: опыт реализации на таджикском языке
Рассмотрены современные подходы к субсловной токенизации текстов применительно к малоресурсному таджикскому языку, характеризуемому сложной морфологической структурой и высокой вариативностью словоформ. В ходе исследования был сформирован и предварительно обработан масштабный разнородный корпус, включающий 99 книг и 134497 текстовых статей различных жанров и тематик, общий объем которого превышает 33 млн токенов. Корпус был очищен от шумов, нормализован и использован в качестве основы для обучения и последующего тестирования субсловных моделей.
На базе названного корпуса были обучены и проанализированы пять моделей токенизации, реализующих алгоритмы BPE, WordPiece и Unigram с использованием библиотек Hugging Face Tokenizers и SentencePiece. Сравнительная оценка проведена по ряду ключевых показателей, включая долю неизвестных слов (OOV), степень сжатия текстового представления, скорость токенизации, а также характеристики распределения n-грамм, позволяющие оценить способность моделей отражать морфологическую и структурную организацию языка. Результаты экспериментов позволили выявить сильные и слабые стороны различных подходов к субсловной сегментации и определить наиболее эффективные стратегии токенизации в условиях морфологической сложности
таджикского языка. Полученные выводы могут быть использованы при разработке языковых моделей и прикладных NLP-инструментов для таджикского и других малоресурсных языков, способствуя расширению их присутствия в цифровой среде.
Научные публикации и эмбеддинг-пространство знаний
Рассмотрены актуальные проблемы наукометрии, возникающие на фоне роста публикационной активности и широкого внедрения технологий генеративного искусственного интеллекта. Проанализирован существующий наукометрический инструментарий анализа научной деятельности, подразделяемый на количественные метрики и методы картографирования науки (анализ сетей цитирований, академическая генеалогия, семантический анализ и др.). Сделана попытка преодоления ограничений традиционного цитатного анализа, таких как «семантическая слепота» и уязвимость к манипуляциям. В качестве возможного решения предложена концептуальная модель, в которой единицей анализа выступает не публикация в целом, а отдельное «ключевое утверждение». Такой подход предполагает фиксацию не только содержания тезиса, но и его типа, области релевантности и характера связей с другими утверждениями (подтверждение, опровержение, уточнение, обобщение и т. д.). В контексте данного подхода предложены принципы расчета модифицированных наукометрических метрик.
Представлены результаты апробации предложенной модели на массиве из 728 статей журнала «Информатика и образование» (2016–2025 гг.). С использованием больших языковых моделей проведен анализ, результаты которого показали, что ретроспективное извлечение утверждений сталкивается с трудностями, связанными со сложившейся культурой научной коммуникации; поэтому отмечено преимущество самостоятельного формулирования ключевых утверждений (как особого типа метаданных) непосредственно авторами публикаций. Намечены возможные пути развития концепции «эмбеддинг-пространства знаний», которая в перспективе могла бы дополнить существующие подходы анализа динамики развития научных идей и теорий.
Методы искусственного интеллекта для решения интегрального уравнения с дробным интегралом Грюнвальда–Летникова
Построена вычислительная схема приближенного решения интегрального уравнения с дробным интегралом Грюнвальда – Летникова, основанная на методе наименьших квадратов. Особенностью вычислительной схемы является использование нейронной сети при вычислении коэффициентов для метода наименьших квадратов. Актуальность исследования обусловлена тем, что в настоящее время искусственный интеллект все чаще применяется для решения многих практических задач, связанных с различными физическими процессами. Найдена оценка сходимости приближенных решений к точному решению. Рассмотрены возможные пути дальнейшего применения искусственного интеллекта для решения физических задач.
Моделирование и метод расчета усиливаемых нагруженных стержневых конструкций
Представлены разработанные математические модели и вариационный метод расчета пространственных стержневых конструкций, усиленных в нагруженном состоянии. Эти модели и метод расчета имеют более широкие возможности по сравнению с существующими. Их использование позволяет выполнять расчеты стержневых систем, усиливаемых способами наращивания поперечных сечений стержней, изменения расчетной схемы и деформированного состояния. Рассмотрены сложные стержневые конструкции с различными формами поперечного сечения. В основе расчетов лежат гипотезы теории стержней Тимошенко. Для тонкостенных стержней дополнительно использованы положения теории тонкостенных стержней с учетом сдвиговых деформаций. Предполагается, что материал стержневого элемента следует диаграмме линейно упрочняющегося материала. Расчет напряжено-деформированного состояния (НДС) усиленной конструкции выполняется поэтапно. На начальной стадии вычисляются перемещения и напряжения в элементах конструкции под действием исходных нагрузок. На втором этапе определяются величины монтажных сил и напряжений, возникающих при присоединении усиливающих элементов к основным элементам конструкции. На последнем этапе выполняется расчет усиленной конструкции от воздействий дополнительных нагрузок, прикладываемых к конструкции после усиления. Рассмотрены примеры расчета эксплуатируемых конструкций, усиленных различными способами, с использованием предложенных моделей и метода расчета.
Онтологическая модель интеграции когнитивных и социологических данных для оценки персонала
В условиях цифровой трансформации организаций и роста объемов данных появляется запрос на более прозрачные и объяснимые подходы к оценке сотрудников. Цель проведенного исследования состояла в проектировании и верификации онтологической модели (OWL 2/SHACL), которая интегрирует когнитивные показатели и социологические характеристики работников в единое пространство знаний для поддержки HR (Human Resources)-процессов – процессор управления человеческими ресурсами. Научная новизна работы заключается в разработке единой семантической модели, связывающей данные когнитивных тестов, опросников, контекста труда и показателей результативности; в формулировании компетентностных вопросов, запускающих механизм вывода в графе знаний; и в разработке паттернов для прогнозирования дефицитов компетенций, выявления риска перегрузки/выгорания с контролем этики и недискриминации. Предлагаемый подход опирается на методологии инженерии онтологий – METHONTOLOGY и NeOn, концепции семантического веба и методы психометрики.