• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров
61-85
Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.
Ключевые слова: семантический анализ, издательские системы.

Извлечение знаний из Wikidata для формирования метаданных документов электронных математических коллекций

Полина Олеговна Гафурова, Александр Михайлович Елизаров, Евгений Константинович Липачёв
1023-1059
Аннотация:

Представлены методы создания цифровых математических коллекций, включающих неструктурированные наборы документов. Эти наборы содержат материалы сборников научных конференций, а также статьи из архивов математических журналов «доцифрового» периода.


Формирование обязательного набора метаданных названных документов произведено с помощью программных инструментов фабрики метаданных цифровой математической библиотеки Lobachevskii DML. Для уточнения и пополнения наборов метаданных документов цифровых коллекций использованы методы извлечения знаний из Wikidata.


Разработана система SPARQL-запросов для поиска в Wikidata информации о документах электронных коллекций и их авторах. Обозначен набор сущностей Wikidata, определяющих признаки поиска, а также последующую фильтрацию полученных результатов.


Предложены методы уточнения и дополнения библиографических ссылок, приведенных в статьях. При формировании метаданных документов ретро-коллекций произведен поиск в Wikidata сведений о годах жизни авторов статей, а также URL веб-страниц с информацией о статьях и их авторах. Приведены результаты формирования нескольких новых электронных коллекций цифровой библиотеки Lobachevskii-DML.

Ключевые слова: Wikidata, метаданные, фабрика метаданных, цифровая математическая коллекция, цифровая математическая ретро коллекция, цифровые математические библиотеки, Lobachevskii-DML.

Базовые сервисы фабрики метаданных цифровой математической библиотеки Lobachevskii-DML

Полина Олеговна Гафурова, Александр Михайлович Елизаров, Евгений Константинович Липачёв
336-381
Аннотация: Решен ряд задач, связанных с построением фабрики метаданных цифровой математической библиотеки Lobachevskii-DML. Под фабрикой метаданных понимается система взаимосвязанных программных инструментов, направленных на создание, обработку, хранение и управление метаданными объектов цифровых библиотек и позволяющих интегрировать создаваемые электронные коллекции в агрегирующие цифровые научные библиотеки. С целью выбора оптимальных таких программных инструментов из существующих и их модернизации: обсуждены особенности представления метаданных документов различных электронных коллекций, связанные как с применяемыми форматами, так и с изменениями состава и полноты набора метаданных в течение всего времени издания соответствующего научного журнала;представлены и охарактеризованы программные инструменты управления научным контентом и методы организации автоматизированной интеграции репозиториев математических документов с другими информационными системами;обсуждена такая важная функция фабрики метаданных цифровой библиотеки, как нормализация метаданных в соответствии с форматами других агрегирующих библиотек.В результате разработки фабрики метаданных цифровой математической библиотеки Lobachevskii-DML предложена система сервисов автоматизированного формирования метаданных электронных математических коллекций; разработан xml-язык представления метаданных, основанный на Journal Archiving and Interchange Tag Suite (NISO JATS); созданы программные инструменты нормализации метаданных электронных коллекций научных документов в форматах, разработанных международными организациями – агрегаторами ресурсов по математике и Computer Science; разработан алгоритм приведения метаданных к формату oai_dc и генерации структуры архивов для импорта в цифровое хранилище DSpace; предложены и реализованы методы интеграции электронных математических коллекций Казанского университета в отечественные и зарубежные цифровые математические библиотеки.
Ключевые слова: цифровые библиотеки, цифровая математическая библиотека, формирование метаданных, извлечение метаданных, нормализация метаданных, фабрика метаданных, NISO JATS, семантические связи, Lobachevskii-DML.

Принципы формирования и представления междисциплинарных коллекций в цифровом пространстве научных знаний

Сергей Александрович Кириллов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
294-314
Аннотация:

Исследованы вопросы формирования междисциплинарных тематических коллекций в цифровом пространстве научных знаний. Рассмотрены содержание работ по формированию и представлению междисциплинарной коллекции, правила организации и представления междисциплинарных цифровых коллекций в информационной среде электронной библиотеки «Научное наследие России». Отмечено, что организация работ по формированию междисциплинарной коллекции в цифровом пространстве знаний предполагает следующие этапы: определение тематики междисциплинарной коллекции, определение структуры разделов междисциплинарной коллекции, определение источников для представления в междисциплинарной коллекции, диспетчеризацию работ с источниками, формирование метаданных, формирование цифровых копий объектов (включая оцифровку и верстку электронного объекта), размещение созданных цифровых копий на специализированной странице междисциплинарной коллекции. Показаны типы и виды междисциплинарных коллекций. Разработаны основные типы разделов, присутствующих в большинстве междисциплинарных проектов. Отмечено, что информация, представляемая в междисциплинарной коллекции, включает две составляющие – метаданные, описывающие характеристики ресурсов, и собственно цифровые информационные ресурсы, а именно, представленные в цифровой форме объекты библиотечного, музейного и архивного хранения – это печатные и рукописные издания, графика, фото-, аудио-, видео-материалы, музейные предметы. Предложена методика отбора материалов для формирования междисциплинарной коллекции на примере создания коллекции, посвященной нобелевским лауреатам, гражданам России и СССР, а также родившимся на территории России и СССР.

Ключевые слова: виртуальная выставка, электронная библиотека, научное наследие, базы данных, электронные фонды, цифровые копии.

Формализация процессов формирования пользовательских коллекций в цифровом пространстве научных знаний

Николай Евгеньевич Каленов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
433-450
Аннотация: Исследована задача формирования цифрового пространства научных знаний (ЦПНЗ). Рассмотрено отличие этого понятия от общего понятия пространства знаний. ЦПНЗ представлено как множество, содержащее объекты, верифицированные мировым научным сообществом. Формой структурированного представления цифрового пространства знаний является семантическая сеть, основной принцип организации которой основан на системе классификации объектов и последующем построении их иерархии, в частности, по принципу наследования. Введена классификация объектов, составляющих контент ЦПНЗ. Предложена модель ЦПНЗ как совокупности непересекающихся множеств, содержащих цифровые образы реальных объектов и их характеристики, обеспечивающие отбор и визуализацию объектов в соответствии с многоаспектными пользовательскими запросами. Определено понятие пользовательской коллекции, предложена иерархическая классификация типов пользовательских коллекций. Использование понятий теории множеств при построении ЦПНЗ позволяет разбивать информацию по уровням детализации и формализовать алгоритмы обработки пользовательских запросов, что проиллюстрировано конкретными примерами.
Ключевые слова: семантическая сеть, информационное пространство, научные знания, электронная библиотека, уровни детализации, иерархия информационных объектов.

Цифровая экосистема OntoMath как подход к построению пространства математических знаний

Александр Михайлович Елизаров, Александр Витальевич Кириллович, Евгений Константинович Липачёв, Ольга Авенировна Невзорова
154-202
Аннотация:

Представлены результаты по созданию методов управления математическим знанием в контексте цифровых математических библиотек. Программные инструменты, разработанные на основе этих методов, являются частью цифровой экосистемы OntoMath, в рамках которой осуществляется их взаимодействие. Приведено краткое описание архитектуры экосистемы OntoMath, выделены уровни предметных онтологий и внешних онтологий, а также уровень программных инструментов и сервисов. В отдельную категорию выделены семантические сервисы. Этим термином обозначены программные инструменты, в функционале которых используются запросы к предметным онтологиям для обеспечения управления объектами знаний. Даны общие описания разрабатываемых предметных онтологий: образовательной математической онтологии OntoMathEdu и онтологии профессиональной математики OntoMathPRO. Отражено развитие образовательной онтологии в направлении включения образовательных пререквизитных связей между классами. Среди программных инструментов цифровой экосистемы выделены сервисы поиска по математическим электронным коллекциям, сервис семантического аннотирования математических документов, инструменты семантической разметки образовательных математических документов, а также система автоматической генерации проверочных тестов по математическим образовательным дисциплинам.


В рамках цифровой экосистемы OntoMath развиваются рекомендательные системы специального назначения. В текущей версии экосистемы представлены рекомендательная система формирования списка близких статей, основанная на онтологии OntoMathPRO, рекомендательная система назначения экспертов для поддержки процесса научного рецензирования и рекомендательные системы подбора предметных классификаторов УДК и кодов Mathematics Subject Classification для математических документов. Приведены также результаты, полученные в направлении создания фабрики метаданных цифровой библиотеки, включающей сервисы и инструменты извлечения, уточнения, пополнения и нормализации метаданных документов электронных математических коллекций. Отметим, что экосистема OntoMath разрабатывается как технологическая основа цифровой математической библиотеки Lobachevskii-DML.

Ключевые слова: цифровая экосистема, экосистема OntoMath, цифровая математическая библиотека, Lobachevskii-DML, онтология, математическая онтология OntoMathPRO, образовательная онтология OntoMathEdu.

Алгоритмы формирования метаданных математических ретро-коллекций на основе анализа структурных особенностей документов

Полина Олеговна Гафурова, Александр Михайлович Елизаров, Евгений Константинович Липачёв
238-271
Аннотация:

Представлены решения основных задач, связанных с формированием цифровых математических коллекций из документов, изданных в доцифровой период, – такие коллекции обозначены в работе как ретро-коллекции. Приведены алгоритмы создания метаописания ретро-коллекций, основанные на анализе структуры математических документов и применении программных инструментов выделения метаданных. Дано описание ретро-коллекций, сформированных с помощью разработанных алгоритмов и включенных в состав фабрики метаданных цифровой математической библиотеки Lobachevskii-DML. Указаны схемы формирования метаданных и методы нормализации извлеченных метаданных в соответствии со схемами и требованиями интегрирующих математических библиотек.

Ключевые слова: Lobachevskii-DML, фабрика метаданных, управление метаданными, цифровая ретро-коллекция.

Метод автоматического пополнения метаданных электронных коллекций цифровой математической библиотеки

Полина Олеговна Гафурова
164-186
Аннотация:

Предложены подходы к дополнению метаданных документов электронных коллекций цифровой математической библиотеки. В качестве источников информации для пополнения метаданных использованы открытые ресурсы семантической сети. Для этой цели разработаны программные инструменты, обеспечивающие поиск необходимых данных и их включение в набор метаданных.


Предложен алгоритм пополнения метаданных аффилиации авторов научной статьи. Как правило, представленная в документе аффилиация содержит недостаточное количество информации, необходимой для формирования набора метаданных. Метод пополнения метаданных аффилиации авторов основан на данных, извлеченных из открытого реестра идентификаторов научных организаций Research Organization Registry (ROR). Также в методе использованы разработанные инструменты извлечения связей между ROR и открытыми семантическими сетями. Этот метод апробирован на электронной коллекции статей журнала «Электронные библиотеки» за 2021–2022 годы.


На основе предложенного метода разработан программный сервис, включенный в фабрику метаданных цифровой библиотеки Lobachevskii-DML. Также результатом работы является включение в цифровую библиотеку Lobachevskii-DML новых электронных коллекций. Кроме того, описан метод трансформации метаданных в формат, доступный для загрузки в библиотеку.

Ключевые слова: ROR, Wikidata, цифровые библиотеки, метаданные аффилиации, Lobachevskii-DML.

Цифровая инфраструктура электронного научного журнала: автоматизация редакционно-издательских процессов и система сервисов

Миляуша Салахутдиновна Галявиева, Александр Михайлович Елизаров, Евгений Константинович Липачёв
408-465
Аннотация:

Описаны современные модели и средства публикации и распространения научных знаний. Охарактеризованы современные информационные системы управления научными изданиями и сервисы, определяющие их функциональность.

Введено понятие цифровой инфраструктуры электронного научного журнала как комплекса, который объединяет программную платформу, реализующую основные рабочие процессы управления электронным журналом, и информационные системы, которые обеспечивают функционирование как основных, так и дополнительных сервисов, учитывающих, в частности, специфику предметной области журнала.

Представлен подход к организации цифровой инфраструктуры электронного научного журнала на основе открытой программной системы Open Journal Systems (OJS). Предложены сервисы, расширяющие функциональные возможности этой системы и учитывающие специфику предметной области научных журналов. На основе технологии расширения функционала OJS созданы программные модули, обеспечивающие автоматизацию ряда редакционных процессов электронного научного журнала.

Представлена система сервисов автоматической обработки коллекций научных документов. Эти сервисы обеспечивают проверку соответствия документов коллекций принятым правилам формирования коллекций и преобразования документов в установленные форматы; структурный анализ документов и извлечение метаданных, а также их интеграцию в научное информационное пространство. Система сервисов позволяет автоматически выполнять набор операций, который не реализуем за практически приемлемое время при традиционной «ручной» обработке электронного контента, и предназначена для обработки больших коллекций научных документов.

Охарактеризованы алгоритмы автоматической стилевой валидации текстов на этапе регистрации статьи в информационной системе электронного научного журнала, автоматического подбора рецензентов, рассылки уведомлений и контроля сроков рецензирования.

Представлены методы обработки документов, содержащих математические формулы, в частности, алгоритм поиска по формулам в коллекциях математических документов. Указаны основные идеи, подходы и уже полученные результаты по разработке семантических технологий управления математическими знаниями, в том числе, подход к построению рекомендательных систем на основе онтологий математического знания и метод автоматизации процесса первичной обработки научной статьи, использующей TеX-нотацию.

Охарактеризована проблема построения системы анализа и оценки информационного и социального воздействия публикуемого научного контента на его пользователей. Проведено сопоставление традиционных (библиометрических и наукометрических) и альтернативных показателей такой оценки. Описан мировой опыт использования информетрических сервисов на сайтах научных журналов. Обсуждены варианты реализации этих подходов в рамках цифровой инфраструктуры электронного научного журнала.

Ключевые слова: издательские системы, современные модели публикации и распространения научных знаний, информационное общество, электронный научный журнал, информационные системы управления научными изданиями и публикациями, интеграция электронных ресурсов.

Электронные ресурсы Российской государственной библиотеки для развития науки и образования

Нина Владимировна Авдеева
357-367
Аннотация:

Электронные ресурсы Российской государственной библиотеки (РГБ) включают Электронную библиотеку, состоящую из 11 коллекций, самой крупной и востребованной из которых является Электронная библиотека диссертаций, Интернет-магазин услуг РГБ и другие цифровые сервисы. РГБ постоянно расширяет электронные фонды и модернизирует систему удаленного обслуживания пользователей. Таким образом, РГБ способствует улучшению качества российского образования и науки, культурному просвещению граждан и созданию единого библиотечно-информационного пространства России.

Ключевые слова: Российская государственная библиотека (РГБ), электронные ресурсы, коллекции, полнотекстовый документ, пользователь, расширенный по-иск, диссертация, автореферат, информационные технологии.

Визуализация цифровых 3D-объектов при формировании виртуальных выставок

Николай Евгеньевич Каленов, Сергей Александрович Кириллов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
418-432
Аннотация: Представлены подходы к решению задачи создания реалистичных интерактивных 3D веб-коллекций музейных экспонатов. Рассмотрено представление 3D-моделей объектов на основе ориентированных полигональных структур. Описан метод создания виртуальной коллекции 3D-моделей по технологии интерактивной анимации. Также показано, как на основе отдельных кадров экспозиции с помощью методов фотограмметрии строится высококачественная 3D-модель. Приведены результаты расчетов для построения 3D-моделей реальных музейных экспонатов. Для создания 3D-моделей с целью предоставления их широкому кругу пользователей через интернет использована технология интерактивной анимации. Приведены различия между представлениями цифровых 3D-моделей. Описана технология создания цифровых 3D-моделей объектов из фондов Государственного биологического музея им. К.А. Тимирязева и формирования на их основе средствами электронной библиотеки «Научное наследие России» виртуальной выставки, посвященной научной деятельности М.М. Герасимова и его антропологическим реконструкциям. Выставка наглядно продемонстрирована возможности интеграции информационных ресурсов средствами электронной библиотеки. Формат виртуальных выставок позволил объединить ресурсы партнеров для предоставления широкому кругу пользователей коллекций, хранящихся в музейных, архивных и библиотечных фондах.
Ключевые слова: фотограмметрия, 3D-моделирование, интерактивная мультипликация, веб-дизайн, полигональное моделирование.

Коллекция открыток В.И. Адо в цифровой библиотеке Казанского университета

Е.А. Ивайкина
Аннотация: Представлен опыт создания цифровой коллекции почтовых открыток начала XX-го века в библиотеке им. Н.И. Лобачевского Казанского (Приволжского) федерального университета. Рассмотрены основные проблемы и особенности библиографического описания такого вида изобразительных материалов.
Ключевые слова: изобразительные материалы, коллекция открыток В.

Электронный архив наблюдательных данных астрофизической обсерватории

О.П. Желенкова, В.В. Витковский, Т.А. Пляскина
Аннотация: Архивная система обсерватории включает в себя хранилище цифровых данных и информационно-поисковую систему (ИПС) с динамическим веб-интерфейсом и http-доступом. На текущий момент в систему включены 16 цифровых коллекций наблюдательных данных (локальных архивов), полученных на разных приборах, работающих или работавших на телескопах обсерватории. Самые ранние данные относятся к концу 1994 года. В настоящее время активно пополняются 6 локальных архивов. Хранилище данных включает область временного хранения, расположенную на файл-сервере БТА, и область постоянного хранения. Область постоянного хранения это - CD/DVD-диски, жесткий диск выделенного архивного сервера и USB-диск большой емкости. Для сохранности данных при аварийных ситуациях и при возникающих дефектах носителей мы обеспечиваем хранение 2 полных копий на CD/DVD?дисках и двух копий архива на винчестере. Одна копия (A0) повторяет оптические диски, другая (A1), несколько по структуре каталогов модифицированная, используется ИПС. Цифровые носители и устройства чтения-записи данных нельзя отнести к устройствам длительного хранения, поэтому при долговременном хранении цифровых данных необходимо обеспечивать перенос информации на новый тип носителей каждые 5-10 лет. Копии архива A0 и A1 поддерживаются и для этой процедуры переписывания. Вариант архивных данных (A1) повторен на USB-диске с добавлением дампа таблиц и программ. Это резервная копия для восстановления информационной системы при аварийной ситуации на сервере. Для обеспечения модернизации ИПС мы поддерживаем две схемы базы данных — тестовую и рабочую. Разработки ведутся на тестовой схеме. При модификациях схемы после проведенного тестирования ИПС переключается на обновленную версию БД. Оригинальная копия A0 и наличие тестовой схемы позволяют выполнять модернизацию ИПС даже на уровне схемы таблиц. В настоящее время ИПС реализована на СУБД PostgreSQL 8.3.7.
Ключевые слова: цифровые коллекции экспериментальных данных, веб-доступ к архивам наблюдений, виртуальная обсерватория, предметно-ориентированные базы данных.

Архитектура цифровых объектов

Роберт Канн, Роберт Канн
Аннотация: A repository is a network-accessible storage system in which digital objects may be stored for possible subsequent access or retrieval. The repository has mechanisms for adding new digital objects to its collection (depositing) and for making them available (accessing), using, at a minimum, the repository access protocol. The repository may contain other related information, services and management systems.

Автоматизация процессов сбора и анализа данных о взаимодействии с интерактивными прототипами мобильных приложений

Айнур Ринатович Динмухаметов, Ирина Сергеевна Шахова
185-199
Аннотация: Представлено описание разработанной программной платформы для сбора и автоматического анализа данных о взаимодействии пользователей с интерактивными прототипами, позволяющей организовать непрерывную и оперативную связь между целевой аудиторией и проектировщиками интерфейсов мобильных приложений. Программная платформа включает в себя десктопное и мобильное приложения, а также серверную часть для осуществления анализа данных, хранения информации и организации взаимодействия между клиентскими приложениями.
Ключевые слова: UI, UX, пользовательский интерфейс, мобильные приложения, прототипирование.

Цифровой репозиторий "geologyscience.ru": открытый доступ к научным публикациям по геологии России

Михаил Иванович Патук , Вера Викторовна Наумова, Виталий Сергеевич Ерёменко
1324-1338
Аннотация:

Описаны новые подходы, связанные со сбором данных из разнородных информационных систем доступа к научным публикациям с использованием открытых международных стандартов и протоколов для формирования систем открытого доступа к научным геологическим публикациям. На основе разработанных и адаптированных подходов и технологических решений реализован комплекс программ информационно-аналитической системы доступа к научным публикациям, реализующей функции сбора, поиска, каталогизации, фильтрации и управления научными публикациями и их метаданными.

Ключевые слова: информационные технологии, науки о Земле, репозиторий, научные публикации.

Электронные коллекции в зоологии и электронные библиотеки

И.С. Смирнов, А.Л. Лобанов, О.Н. Пугачев, А.Ф. Алимов, Е.П. Воронина
Аннотация: Создание электронных зоологических коллекций и развитие технологий электронных библиотек - во многом сопряженные процессы, хотя первоначально они были достаточно независимы. В статье делается попытка взглянуть на электронные коллекции в зоологии с точки зрения теории и практики электронных библиотек, найти некоторые точки соприкосновения, определить специфику электронных зоологических коллекций.
Работа по теме осуществляется частично при поддержке грантов РФФИ 05-07-90179-в, 05-07-90354-в и 06-04-08020-офи, проекта N11 «Исследование Антарктики. Проведение комплексного изучения антарктической биоты», Федеральной Программы «Мировой Океан» и программы «Биоразнообразие».

О взаимодействии единого цифрового пространства научных знаний с национальной электронной библиотекой

Анна Валерьевна Лопухина, Сергей Александрович Кириллов, Анастасия Геннадьевна Калина
1031-1054
Аннотация:

Статья посвящена вопросам взаимодействия Единого цифрового пространства научных знаний (ЕЦПНЗ) с Национальной электронной библиотекой (НЭБ). Приведены основные архитектурные особенности ЕЦПНЗ и задачи, решаемые в его рамках. Исследованы особенности структуры Национальной электронной библиотеки (НЭБ), технологии ее наполнения, проанализирован актуальный состав фондов. Рассмотрены правовые основы создания и функционирования НЭБ. Предложены направления взаимодействия ЕЦПНЗ с НЭБ.

Ключевые слова: ЕЦПНЗ, НЭБ, оператор НЭБ, информационные ресурсы, цифровой контент, электронные библиотеки.

Издания XIX-XX века о телеграфе (по материалам электронных библиотек)

Юрий Евгеньевич Поляк
1157-1183
Аннотация:

В позапрошлом столетии произошли революционные изменения в передаче информации. Для функционирования оптического телеграфа, появившегося в конце XVIII века, были необходимы громоздкие башни для прямой видимости сигналов семафора. Сто лет спустя протяжённость телеграфных линий составляла сотни тысяч километров; на рубеже веков начались первые опыты применения беспроводного телеграфа. Информация об этом отражена в многочисленных брошюрах, книгах, периодических изданиях того времени. Ещё через сто лет многие из этих материалов стали общедоступными благодаря развитию интернета и электронных библиотек; они интенсивно сканируются и выкладываются в Сеть. Взрывной рост количества электронных библиотек и их информационного наполнения сделал возможным появление данной работы. Её цель – проследить эволюцию технологий и процессов передачи информации, отражённую в литературе, с помощью самых разнообразных электронных библиотек – от грандиозных проектов Библиотеки Конгресса и Google Books с их миллионами оцифрованных книг до скромных частных собраний, посвящённых локальным темам. Использованы материалы более 20 электронных библиотек.

Ключевые слова: электронные библиотеки, история техники, оптический телеграф, электромагнитный телеграф, трансатлантический кабель, радио.

Cемантическое аннотирование математических формул в PDF-документах

Ольга Авенировна Невзорова, Константин Сергеевич Николаев
616-639
Аннотация:

Дан обзор существующих решений по семантическому анализу математических документов, а также описан метод автоматического семантического анализа документов, представленных в формате PDF. Разработанный метод позволяет выделять математические формулы внутри документа, анализировать их структуру, выполнять поиск локальных переменных формулы и их определений в документе, а также связывать переменные формулы и понятия из онтологии. Преимуществом разработанного метода перед другими существующими является независимость от разметки исходного PDF-документа, что расширяет область применения метода. Приведены оценки полноты, точности и F-меры для алгоритмов поиска переменных и связывания локальных переменных с формулами. Полученная семантическая разметка документа позволяет создавать коллекции документов, пригодных для сервиса семантического поиска формул, который является одним из сервисов цифровой библиотеки Lobachevskii-DML.

Ключевые слова: семантический анализ, PDF, обработка документов, научные журналы, Lobachevskii-DML.

Обнаружение заимствований в научных документах на опыте Российской государственной библиотеки

Нина Владимировна Авдеева, Татьяна Александровна Блинова, Игорь Александрович Груздев, Вера Михайловна Ледовская, Галина Андреевна Лобанова, Ирина Валерьевна Сусь
285-297
Аннотация: Статья посвящена опыту Российской государственной библиотеки (РГБ) по проверке научных документов на наличие некорректных заимствований. Наличие актуальной электронной коллекции научных трудов, использование специализированного программного обеспечения и экспертного анализа рассматриваются как необходимые условия для реализации подобных проверок. В статье описаны их основные результаты, а также наиболее распространенные недостатки, выявленные в научных документах.
Ключевые слова: научный текст, некорректные заимствования, электронная коллекция, экспертный анализ, диссертация, Российская государственная библиотека.
1 - 21 из 21 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества