• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров
61-85
Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.
Ключевые слова: семантический анализ, издательские системы.

Анализ моделей векторных представлений слов в задаче разметки семантических ролей в русскоязычных текстах

Лейсан Маратовна Кадермятова, Елена Викторовна Тутубалина
1026-1043
Аннотация: Изучено влияние использования векторных представлений слов на качество установления семантических ролей в русскоязычных текстах. Задача установления семантических ролей в русскоязычных текстах получила широкое распространение после выхода на свет корпуса FrameBank. Были исследованы модели векторных представлений слов word2vec, fastText и ELMo (Embeddings from Language Models). Анализировались метрики качества микро- и макро-F1 как оценочные показатели результатов автоматической разметки актантов. Был проведен ряд экспериментов, демонстрирующих, что модели ELMo, основанные на токенах предикатно-аргументных конструкций, показывают больший прирост качества по сравнению со всеми остальными моделями, в том числе, в сопоставлении с моделями ELMo, обученными на леммах, как по величине микро-F1, так и по величине макро-F1.
Ключевые слова: машинное обучение, обработка естественного языка, векторные представления слов, семантические роли.

Использование микроразметок для добавления в контент веб-страницы данных внешних ресурсов

Евгений Львович Китаев, Римма Юрьевна Скорнякова
494-513
Аннотация: В семантических разметках Всемирной паутины накоплено большое число данных, и их количество продолжает расти. Однако потенциал этих данных реализуется, на наш взгляд, не в полной мере. Данные, заключенные в семантических разметках, или микроразметках, широко используются поисковыми системами, отчасти социальными сетями, использование же этих данных разработчиками приложений, как правило, основано на приведении данных к стандарту RDF и выполнении SPARQL-запросов, что требует хорошего знания этого языка и умения программировать. В настоящей работе предложено использовать имеющиеся в Сети семантические разметки для автоматического включения их содержимого в контент других веб-страниц и описан инструмент для реализации такого включения, не требующий от разработчика веб-страницы владения какими-либо языками программирования помимо широко известных HTML и CSS. Инструмент не требует установки, работу выполняют подключаемые стартовые скрипты. В настоящий момент инструмент поддерживает семантические данные, заключенные в популярных типах разметок «микроданные» и JSON-LD, в тегах HTML-документов и свойствах документов Word и PDF.
Ключевые слова: семантическая паутина, семантические технологии, семантическая разметка, микроразметка, микроданные, JSON-LD, веб-разработка, веб-технологии.

Семантический фрагмент онлайновой научной инфраструктуры: необходимые информационные объекты, средства и сервисы

С.И. Паринов
Аннотация: Техника создания семантических связей обычно используется в информационных системах для указания в машиночитаемом виде известных фактов или отношений, существующих между связываемыми информационными объектами. Например, семантические связи устанавливаются между персональными профилями ученых, профилями организаций, доступными в сети результатами исследований и т.п. В последнее время разработчики научных информационных систем стали также использовать данную технику для визуализации в контенте информационных систем мнений, предположений и гипотез ученых об отношениях, существующих между научными объектами (например, о гипотезах научного вывода/дедукции, данные о влиянии/использовании результатов исследований, иерархические отношения между научными теориями и т.п.). Исходя из предположения, что научное использование результатов исследований обычно означает установление исследователями определенных отношений между этими результатами, в статье предлагается общее описание конструкции семантического фрагмента онлайновой научной инфраструктуры, необходимого для полноценной работы техники семантических связей в режиме ее децентрализованного использования учеными. Технически предлагаемая конструкция базируется на спецификациях CERIF относительно типа данных Link и Semantic Layer.После некоторых доработок стандартная техника семантических связей позволяет ученым устанавливать связи между парой любых доступных им объектов научного информационного пространства. Предлагаемая конструкция позволяет также децентрализованное развитие онтологий и семантических словарей, что гарантирует применимость этих средств при появлении новых типов научных отношений. В статье обсуждаются необходимые для нормального функционирования семантического фрагмента информационные объекты, средства и сервисы, а также рассматривается проблема контроля качества со стороны научного сообщества за создаваемыми учеными семантическими связями.
Ключевые слова: научные информационные объекты, семантические связи, CERIF, научная онлайновая инфраструктура, семантический фрагмент.

Формализация процессов формирования пользовательских коллекций в цифровом пространстве научных знаний

Николай Евгеньевич Каленов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
433-450
Аннотация: Исследована задача формирования цифрового пространства научных знаний (ЦПНЗ). Рассмотрено отличие этого понятия от общего понятия пространства знаний. ЦПНЗ представлено как множество, содержащее объекты, верифицированные мировым научным сообществом. Формой структурированного представления цифрового пространства знаний является семантическая сеть, основной принцип организации которой основан на системе классификации объектов и последующем построении их иерархии, в частности, по принципу наследования. Введена классификация объектов, составляющих контент ЦПНЗ. Предложена модель ЦПНЗ как совокупности непересекающихся множеств, содержащих цифровые образы реальных объектов и их характеристики, обеспечивающие отбор и визуализацию объектов в соответствии с многоаспектными пользовательскими запросами. Определено понятие пользовательской коллекции, предложена иерархическая классификация типов пользовательских коллекций. Использование понятий теории множеств при построении ЦПНЗ позволяет разбивать информацию по уровням детализации и формализовать алгоритмы обработки пользовательских запросов, что проиллюстрировано конкретными примерами.
Ключевые слова: семантическая сеть, информационное пространство, научные знания, электронная библиотека, уровни детализации, иерархия информационных объектов.

Визуализация цифровых 3D-объектов при формировании виртуальных выставок

Николай Евгеньевич Каленов, Сергей Александрович Кириллов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
418-432
Аннотация: Представлены подходы к решению задачи создания реалистичных интерактивных 3D веб-коллекций музейных экспонатов. Рассмотрено представление 3D-моделей объектов на основе ориентированных полигональных структур. Описан метод создания виртуальной коллекции 3D-моделей по технологии интерактивной анимации. Также показано, как на основе отдельных кадров экспозиции с помощью методов фотограмметрии строится высококачественная 3D-модель. Приведены результаты расчетов для построения 3D-моделей реальных музейных экспонатов. Для создания 3D-моделей с целью предоставления их широкому кругу пользователей через интернет использована технология интерактивной анимации. Приведены различия между представлениями цифровых 3D-моделей. Описана технология создания цифровых 3D-моделей объектов из фондов Государственного биологического музея им. К.А. Тимирязева и формирования на их основе средствами электронной библиотеки «Научное наследие России» виртуальной выставки, посвященной научной деятельности М.М. Герасимова и его антропологическим реконструкциям. Выставка наглядно продемонстрирована возможности интеграции информационных ресурсов средствами электронной библиотеки. Формат виртуальных выставок позволил объединить ресурсы партнеров для предоставления широкому кругу пользователей коллекций, хранящихся в музейных, архивных и библиотечных фондах.
Ключевые слова: фотограмметрия, 3D-моделирование, интерактивная мультипликация, веб-дизайн, полигональное моделирование.

Система для создания, поддержания и публикации электронных архивов

А.Г. Марчук
Аннотация: В работе представлен подход к формированию цифровых архивов документов. Он отличается тем, что кроме основных единиц хранения электронных образов документов, создается база данных неспецифических сущностей, к которой «привязываются» документы. Такой способ позволяет улучшить описание документов и привнести естественные формы поиска и изучения материала. В работах [1, 3] определены принципы электронной фиксации фактов, а также общие положения реализации распределенных архивных фактографических систем. Усилиями последних лет было создано платформенное решение Фактограф, позволяющее создавать, сопровождать и публиковать электронные архивы. Систему также можно использовать и в других прикладных областях: цифровые библиотеки, музеи, простые системы научного делопроизводства.
Ключевые слова: цифровые архивы документов, фактограф, онтология BONE, хранение документов.

Систематизации парадигм программирования по приоритетам принятия решений

Лидия Васильевна Городняя
666-696
Аннотация: Цель статьи – описание методики сравнения парадигм и языков программирования, отражающей выразительную силу языков, трудоёмкость реализации систем программирования и приспособленность к обоснованию практичных, объективных критериев декомпозиции программ, что можно рассматривать как подход к решению проблемы факторизации весьма усложнённых определений языков программирования и систем их поддержки. Представлены результаты анализа наиболее известных основных парадигм программирования и намечен подход к навигации в современном расширяющемся пространстве языков программирования. Систематизация парадигм учитывает особенности постановок задач программирования и семантические характеристики языков и систем программирования с акцентом на критерии качества программ и приоритеты в принятии решений при их реализации и обучении программистов.
Ключевые слова: определение языков программирования, парадигмы программирования, классификация сложных определений, семантические системы.

V Международная Конференция «Информационные технологии для наук о земле и приложения для геологии, горной промышленности и экономики. Ites&Mp-2019»

Вера Викторовна Наумова
1279-1300
Аннотация:

Охарактеризованы материалы, представленные на V международной конференции «Информационные технологии для наук о Земле и приложения для геологии, горной промышленности и экономики. ITES&MP-2019». Названная конференция описывает результаты последних лет в следующих областях:


  • открытый доступ к научным данным в области наук о Земле; особенности данных в науках о Земле: новые концепции и методы, инструменты их сбора, интеграции и обработки в различных информационных системах, в том числе в системах с интенсивным использованием данных;

  • анализ данных и математическое моделирование природных процессов в науках о Земле: новые подходы. Эволюция классических ГИС-приложений;

  • применение информационных технологий в области металлогении критических полезных ископаемых;

  • социальные аспекты горно-геологической отрасли;

  • прогнозные построения в области геологической разведки и землепользования;

  • интеллектуальный анализ данных, извлечение фактов и знаний из научных публикаций. Тезаурусы, онтологии, концептуальное моделирование. Семантический веб, связанные данные. Сервисы. Семантическое структурирование контента. Применение в науках о Земле;

  • применение методов и технологий дистанционного зондирования в науках о Земле и горной промышленности: от спутников до беспилотных летательных аппаратов;

  • информационные технологии для создания систем демонстрации и популяризации достижений в науках о Земле;

  • приложения: прогноз месторождений, экологические риски, опасные природные явления, управление водными ресурсами, геотермальная энергия и др.

Ключевые слова: информационные технологии, науки о Земле.

Цифровая экосистема OntoMath как подход к построению пространства математических знаний

Александр Михайлович Елизаров, Александр Витальевич Кириллович, Евгений Константинович Липачёв, Ольга Авенировна Невзорова
154-202
Аннотация:

Представлены результаты по созданию методов управления математическим знанием в контексте цифровых математических библиотек. Программные инструменты, разработанные на основе этих методов, являются частью цифровой экосистемы OntoMath, в рамках которой осуществляется их взаимодействие. Приведено краткое описание архитектуры экосистемы OntoMath, выделены уровни предметных онтологий и внешних онтологий, а также уровень программных инструментов и сервисов. В отдельную категорию выделены семантические сервисы. Этим термином обозначены программные инструменты, в функционале которых используются запросы к предметным онтологиям для обеспечения управления объектами знаний. Даны общие описания разрабатываемых предметных онтологий: образовательной математической онтологии OntoMathEdu и онтологии профессиональной математики OntoMathPRO. Отражено развитие образовательной онтологии в направлении включения образовательных пререквизитных связей между классами. Среди программных инструментов цифровой экосистемы выделены сервисы поиска по математическим электронным коллекциям, сервис семантического аннотирования математических документов, инструменты семантической разметки образовательных математических документов, а также система автоматической генерации проверочных тестов по математическим образовательным дисциплинам.


В рамках цифровой экосистемы OntoMath развиваются рекомендательные системы специального назначения. В текущей версии экосистемы представлены рекомендательная система формирования списка близких статей, основанная на онтологии OntoMathPRO, рекомендательная система назначения экспертов для поддержки процесса научного рецензирования и рекомендательные системы подбора предметных классификаторов УДК и кодов Mathematics Subject Classification для математических документов. Приведены также результаты, полученные в направлении создания фабрики метаданных цифровой библиотеки, включающей сервисы и инструменты извлечения, уточнения, пополнения и нормализации метаданных документов электронных математических коллекций. Отметим, что экосистема OntoMath разрабатывается как технологическая основа цифровой математической библиотеки Lobachevskii-DML.

Ключевые слова: цифровая экосистема, экосистема OntoMath, цифровая математическая библиотека, Lobachevskii-DML, онтология, математическая онтология OntoMathPRO, образовательная онтология OntoMathEdu.

Технология наполнения предметных онтологий пространства научных знаний

Николай Евгеньевич Каленов
101-115
Аннотация:

Под предметной онтологией в контексте этой статьи понимается совокупность ключевых понятий, относящихся к некоторой области науки, с их семантическими связями, дополненная индексами различных классификационных систем, описывающих данную научную область. Предметные онтологии являются необходимой составляющей каждого подпространства, входящего в Единое цифровое пространство научных знаний (ЕЦПНЗ). В данной статье приводятся результаты исследований, связанных с построением предметных онтологий на базе созданной автоматизированной системы поддержки терминологических словарей и предлагается методология выделения новых ключевых терминов отдельной области науки. Предлагаемая методология базируется на использовании существующих классификационных систем в совокупности с базами данных цитирования (БДЦ), такими как Web of Science и Scopus для англоязычных публикаций и Российский индекс цитирования (РИНЦ) – для русскоязычных. Методология предполагает разбиение научной области на ряд разделов в соответствии с выбранной классификационной системой, выделение из БДЦ ядра статей, относящихся к каждому разделу, а из статей – новых авторских ключевых терминов, которые и должны составлять, в совокупности с соответствующими разделами классификационных систем, основу предметной онтологии данной научной области.

Ключевые слова: пространство научных знаний, предметная онтология, базы данных цитирования, ключевые термины, тезаурус для онтологии знаний, классификационные системы.

Рекомендательная система текстовой аналитики юридических документов

Денис Сергеевич Зуев, Марат Фаритович Насрутдинов, Айрат Фаридович Хасьянов
435-449
Аннотация:

Обсуждено использование механизмов машинного обучения, анализа естественного языка и интеллектуального поиска в области юриспруденции. Основные ожидаемые результаты – методология применения алгоритмов текстовой аналитики и семантического анализа естественного языка (NLP) в задачах управления знаниями в судебном делопроизводстве, а также других видах юридической практики. Полученные результаты могут быть применены в области образования и управления знаниями в более широком контексте, поскольку исследование лежит на стыке юриспруденции, математической и компьютерной лингвистики.

Описан прототип многоагентной системы интеллектуального анализа текстов в юриспруденции, способной на имеющейся базе данных судебных документов выявлять общие зависимости, предоставлять для ознакомления юридические дела, близкие по тематике, рекомендовать наиболее вероятные исходы судебного рассмотрения или помечать важные места, на которые следует обращать внимание при процессуальных действиях с использованием инструментов текстовой аналитики.
Ключевые слова: аналитика и управление данными, интенсивное использование данных, электронные библиотеки, кластеризация, классификация судебных актов, рекомендательная система, микросервисная архитектура.

Разработка программного комплекса генерации вопросов по заданным субъектам при помощи семантической сети

Михаил Дмитриевич Андреичев, Александр Андреевич Ференец
68-94
Аннотация: Представлен подход к автоматическому построению вопросов для тестов или викторин при помощи графа знаний DBPedia. Выбранный граф знаний имеет около 5 млн. сущностей и дает возможность делать запросы к семантической сети при помощи языка SPARQL. В статье представлены алгоритм, основные запросы к графу знаний для построения вопросов и нестандартный подход к поиску сущностей.
Ключевые слова: семантическая сеть, генерация вопросов, связанные данные, онтология, граф знаний, RDF, SPARQL, DBPedia.

Эволюция методов визуализации коллекций научных публикаций

Зинаида Владимировна Апанович
2-42
Аннотация: Методы визуализации информации давно зарекомендовали себя как инструмент, позволяющий понимать данные большого объема. Визуализация коллекций научных публикаций является частным случаем визуализации информации. В статье рассмотрены задачи, решаемые при помощи визуализации, модели и методы анализа текстовой информации, а также новые подходы к визуализации документов. Особое внимание уделено тому, каким образом методы визуализации связаны с методами анализа коллекций научных публикаций.
Ключевые слова: визуализация коллекций документов, анализ текстов, алгоритмы визуализации текстов и метаданных, LDA, NMF, word2vec.

Семантическое сходство в задаче аспектно-эмоционального анализа

Евгений Вячеславович Котельников, Павел Дмитриевич Блинов
120-137
Аннотация:

Исследуется проблема аспектно-эмоционального анализа текста. По сравнению с общим анализом тональности такой вариант является более сложным по причине наличия ряда сопутствующих подзадач, таких, как выделение аспектных терминов, определение тональности по отношению к этим терминам и аспектным категориям. Однако решение данной проблемы значительно расширяет возможности систем автоматического анализа неструктурированного текста.

Приведен обзор предыдущих работ в области аспектно-эмоционального анализа, описаны обучающие и тестовые данные семинара SentiRuEval. Для задачи извлечения аспектных терминов использовано векторное пространство распределенных представлений слов. Тональность аспектных терминов определяется на основе функций совместной информации и семантического сходства. Приведены сравнительные результаты на тестовых данных и заключительные выводы.

Ключевые слова: аспектно-эмоциональный анализ текста, взаимная информация, распределённые представления слов, машинное обучение, SentiRuEval.

Использование матриц смежности для визуализации больших графов

Зинаида Владимировна Апанович
2-36
Аннотация: Экспоненциальный рост размеров таких графов, как социальные сети, интернет-графы и др., требует новых подходов к их визуализации. Наряду с представлениями типа «диаграммы связей вершин» все чаще используются визуализации матриц смежностей, а также разнообразные комбинации этих представлений. В данном обзоре рассмотрены новые подходы к визуализации графов большого объема при помощи матриц смежностей и приведены примеры приложений, где эти подходы применяются. Описаны различные типы шаблонов, возникающие при упорядочении матриц смежностей, соответствующих современным сетям, и алгоритмы, позволяющие выделять эти шаблоны. В частности, продемонстрировано, как использование методов упорядочения матриц совместно с алгоритмами поиска таких шаблонов, как звезды, ложные звезды, цепи, почти клики, полные клики, двудольные ядра и почти двудольные ядра, позволяют создавать понятные визуализации графов, имеющих миллионы вершин и ребер. Также приведены примеры гибридных визуализаций, использующих диаграммы связей вершин для представления неплотных частей графа, а матрицы смежностей – для представления плотных частей и их приложений. Гибридные методы используются для визуализации сетей соавторства, глубоких нейронных сетей, сравнения сетей связности человеческого мозга и др.
Ключевые слова: графы большого объема, визуализация, матрицы смежности, жгуты ребер, гибридная визуализация.

Методы и средства визуализации сетей соавторства и сетей цитирования больших научных порталов

З.В. Апанович, П.С. Винокуров
Аннотация: Благодаря быстрому развитию направления Semantic Web и его новой ветви Linked Open Data, в Интернете становятся доступными большие объемы структурированной информации, размещенной на научных порталах, посвященных различным научным направлениям. Наиболее достоверным источником информации, посвященной любому научному направлению, являются собственно научные публикации, составляющие основное наполнение таких порталов. Эти данные нуждаются в средствах анализа, которые могли бы способствовать упрощению их понимания и оптимизации научного менеджмента. В данной работе описываются новые алгоритмы визуализации графов, реализованные в ИСИ СО РАН, и демонстрируется применение этих алгоритмов для визуализации сетей соавторства и сетей цитирования, извлеченных из научных порталов, входящих в облако Linked Open Data.
Ключевые слова: онтология, информационное наполнение, методы визуализации информации, силовой алгоритм, радиальный алгоритм, иерархические жгуты ребер, поуровневое изображение ориентированного графа, сети цитирования, Open Linked Data.

Построение онтологии предметной области на основе логической модели данных

Александр Михайлович Гусенков, Наиль Раисович Бухараев, Евгений Васильевич Биряльцев
390-417
Аннотация: Представлена технология автоматизированного построения онтологии предметной области на основе информации, извлекаемой из комментариев реляционных баз данных ПАО «Татнефть». Технология основана на построении конвертора (компилятора), транслирующего логическую модель данных Epicentre Petrotechnical Open Software Corporation (POSC), представленную в виде ER-диаграмм и набора описаний на объектно-ориентированном языке EXPRESS, в язык описания онтологий OWL, рекомендованный консорциумом W3C. Описаны основные синтаксические и семантические аспекты преобразования.
Ключевые слова: онтология предметной области, реляционные базы данных, POSC, OWL.
1 - 18 из 18 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества