• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Применение машинного обучения к задаче генерации поисковых запросов

Александр Михайлович Гусенков, Алина Рафисовна Ситтикова
272-293
Аннотация:

Исследованы две модификации рекуррентных нейронных сетей: сети с долгой краткосрочной памятью и сети с управляемым рекуррентным блоком с добавлением механизма внимания к обеим сетям, а также модель Transformer в задаче генерации запросов к поисковым системам. В качестве модели Transformer использована модель GPT-2 от OpenAI, которая обучалась на запросах пользователей. Проведен латентно-семантический анализ для определения семантических сходств между корпусом пользовательских запросов и запросов, генерируемых нейронными сетями. Для проведения анализа корпус был переведен в формат bag of words, к нему применена модель TFIDF, проведено сингулярное разложение. Семантическое сходство вычислялось на основе косинусной меры. Также для более полной оценки применимости моделей к задаче был проведен экспертный анализ для оценки связности слов в искусственно созданных запросах.

Ключевые слова: обработка естественного языка, генерация естественного языка, машинное обучение, нейронные сети.

Использование матриц смежности для визуализации больших графов

Зинаида Владимировна Апанович
2-36
Аннотация: Экспоненциальный рост размеров таких графов, как социальные сети, интернет-графы и др., требует новых подходов к их визуализации. Наряду с представлениями типа «диаграммы связей вершин» все чаще используются визуализации матриц смежностей, а также разнообразные комбинации этих представлений. В данном обзоре рассмотрены новые подходы к визуализации графов большого объема при помощи матриц смежностей и приведены примеры приложений, где эти подходы применяются. Описаны различные типы шаблонов, возникающие при упорядочении матриц смежностей, соответствующих современным сетям, и алгоритмы, позволяющие выделять эти шаблоны. В частности, продемонстрировано, как использование методов упорядочения матриц совместно с алгоритмами поиска таких шаблонов, как звезды, ложные звезды, цепи, почти клики, полные клики, двудольные ядра и почти двудольные ядра, позволяют создавать понятные визуализации графов, имеющих миллионы вершин и ребер. Также приведены примеры гибридных визуализаций, использующих диаграммы связей вершин для представления неплотных частей графа, а матрицы смежностей – для представления плотных частей и их приложений. Гибридные методы используются для визуализации сетей соавторства, глубоких нейронных сетей, сравнения сетей связности человеческого мозга и др.
Ключевые слова: графы большого объема, визуализация, матрицы смежности, жгуты ребер, гибридная визуализация.

Cемантические сервисы цифровой экосистемы ontomath для математического образования

Ольга Авенировна Невзорова, Евгений Константинович Липачёв, Константин Сергеевич Николаев
538-569
Аннотация:

Представлен набор семантических сервисов, разработанных с целью поддержки образовательного процесса в области математики. Функционал этих сервисов основан на использовании математических онтологий OntoMathEdu и OntoMathPRO. Онтология профессионального математического знания OntoMathPRO предназначена для классификации и систематизации математических понятий и включает несколько важнейших областей математики. Образовательная математическая онтология OntoMathEdu системно представляет знания по учебному курсу «Планиметрия». Для применения онтологий в образовательных приложениях разработан подход к проектированию пререквизитных отношений в названных онтологиях. Для поддержки математического образования разработаны сервисы семантического поиска по математическим формулам, семантического аннотирования учебных материалов, визуализации подграфов семантической сети онтологии OntoMathEdu, а также параллельный формальный/неформальный корпус математических утверждений и система автоматической генерации тестовых вопросов по математическим дисциплинам.


Приведены примеры успешного применения разработанных программных инструментов. Эти инструменты встроены в цифровую экосистему OntoMath, в рамках которой осуществляется взаимодействие семантических сервисов управления математическим знанием.  

Ключевые слова: Цифровая экосистема, экосистема OntoMath, предметная онтология, математическая онтология OntoMathPRO, образовательная онтология OntoMathEdu, пререквизитное отношение, семантический сервис.

Использование микроразметок для добавления в контент веб-страницы данных внешних ресурсов

Евгений Львович Китаев, Римма Юрьевна Скорнякова
494-513
Аннотация: В семантических разметках Всемирной паутины накоплено большое число данных, и их количество продолжает расти. Однако потенциал этих данных реализуется, на наш взгляд, не в полной мере. Данные, заключенные в семантических разметках, или микроразметках, широко используются поисковыми системами, отчасти социальными сетями, использование же этих данных разработчиками приложений, как правило, основано на приведении данных к стандарту RDF и выполнении SPARQL-запросов, что требует хорошего знания этого языка и умения программировать. В настоящей работе предложено использовать имеющиеся в Сети семантические разметки для автоматического включения их содержимого в контент других веб-страниц и описан инструмент для реализации такого включения, не требующий от разработчика веб-страницы владения какими-либо языками программирования помимо широко известных HTML и CSS. Инструмент не требует установки, работу выполняют подключаемые стартовые скрипты. В настоящий момент инструмент поддерживает семантические данные, заключенные в популярных типах разметок «микроданные» и JSON-LD, в тегах HTML-документов и свойствах документов Word и PDF.
Ключевые слова: семантическая паутина, семантические технологии, семантическая разметка, микроразметка, микроданные, JSON-LD, веб-разработка, веб-технологии.

Методы и средства визуализации сетей соавторства и сетей цитирования больших научных порталов

З.В. Апанович, П.С. Винокуров
Аннотация: Благодаря быстрому развитию направления Semantic Web и его новой ветви Linked Open Data, в Интернете становятся доступными большие объемы структурированной информации, размещенной на научных порталах, посвященных различным научным направлениям. Наиболее достоверным источником информации, посвященной любому научному направлению, являются собственно научные публикации, составляющие основное наполнение таких порталов. Эти данные нуждаются в средствах анализа, которые могли бы способствовать упрощению их понимания и оптимизации научного менеджмента. В данной работе описываются новые алгоритмы визуализации графов, реализованные в ИСИ СО РАН, и демонстрируется применение этих алгоритмов для визуализации сетей соавторства и сетей цитирования, извлеченных из научных порталов, входящих в облако Linked Open Data.
Ключевые слова: онтология, информационное наполнение, методы визуализации информации, силовой алгоритм, радиальный алгоритм, иерархические жгуты ребер, поуровневое изображение ориентированного графа, сети цитирования, Open Linked Data.

О модели поиска синонимов

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
1006-1022
Аннотация:

Рассмотрена задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для ее решения предложены модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использован подход «сначала индексация, затем обучение», что позволяет получить более точные результаты поиска. Обучение модели проводилось на базе контента библиотеки для предметной области «Математика». Приведены примеры расширенного запроса с использованием синонимов.

Ключевые слова: модель поиска, алгоритм word2vec, синонимы, информационный запрос, расширение запроса.

Разработка программного комплекса генерации вопросов по заданным субъектам при помощи семантической сети

Михаил Дмитриевич Андреичев, Александр Андреевич Ференец
68-94
Аннотация: Представлен подход к автоматическому построению вопросов для тестов или викторин при помощи графа знаний DBPedia. Выбранный граф знаний имеет около 5 млн. сущностей и дает возможность делать запросы к семантической сети при помощи языка SPARQL. В статье представлены алгоритм, основные запросы к графу знаний для построения вопросов и нестандартный подход к поиску сущностей.
Ключевые слова: семантическая сеть, генерация вопросов, связанные данные, онтология, граф знаний, RDF, SPARQL, DBPedia.

Метод автоматического пополнения метаданных электронных коллекций цифровой математической библиотеки

Полина Олеговна Гафурова
164-186
Аннотация:

Предложены подходы к дополнению метаданных документов электронных коллекций цифровой математической библиотеки. В качестве источников информации для пополнения метаданных использованы открытые ресурсы семантической сети. Для этой цели разработаны программные инструменты, обеспечивающие поиск необходимых данных и их включение в набор метаданных.


Предложен алгоритм пополнения метаданных аффилиации авторов научной статьи. Как правило, представленная в документе аффилиация содержит недостаточное количество информации, необходимой для формирования набора метаданных. Метод пополнения метаданных аффилиации авторов основан на данных, извлеченных из открытого реестра идентификаторов научных организаций Research Organization Registry (ROR). Также в методе использованы разработанные инструменты извлечения связей между ROR и открытыми семантическими сетями. Этот метод апробирован на электронной коллекции статей журнала «Электронные библиотеки» за 2021–2022 годы.


На основе предложенного метода разработан программный сервис, включенный в фабрику метаданных цифровой библиотеки Lobachevskii-DML. Также результатом работы является включение в цифровую библиотеку Lobachevskii-DML новых электронных коллекций. Кроме того, описан метод трансформации метаданных в формат, доступный для загрузки в библиотеку.

Ключевые слова: ROR, Wikidata, цифровые библиотеки, метаданные аффилиации, Lobachevskii-DML.

Формализация процессов формирования пользовательских коллекций в цифровом пространстве научных знаний

Николай Евгеньевич Каленов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
433-450
Аннотация: Исследована задача формирования цифрового пространства научных знаний (ЦПНЗ). Рассмотрено отличие этого понятия от общего понятия пространства знаний. ЦПНЗ представлено как множество, содержащее объекты, верифицированные мировым научным сообществом. Формой структурированного представления цифрового пространства знаний является семантическая сеть, основной принцип организации которой основан на системе классификации объектов и последующем построении их иерархии, в частности, по принципу наследования. Введена классификация объектов, составляющих контент ЦПНЗ. Предложена модель ЦПНЗ как совокупности непересекающихся множеств, содержащих цифровые образы реальных объектов и их характеристики, обеспечивающие отбор и визуализацию объектов в соответствии с многоаспектными пользовательскими запросами. Определено понятие пользовательской коллекции, предложена иерархическая классификация типов пользовательских коллекций. Использование понятий теории множеств при построении ЦПНЗ позволяет разбивать информацию по уровням детализации и формализовать алгоритмы обработки пользовательских запросов, что проиллюстрировано конкретными примерами.
Ключевые слова: семантическая сеть, информационное пространство, научные знания, электронная библиотека, уровни детализации, иерархия информационных объектов.
1 - 9 из 9 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества