• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Методика сравнения программных решений распознавания текстов научных публикаций по качеству извлечения метаданных

Илия Игоревич Кузнецов, Олег Пантелеевич Новиков, Дмитрий Юрьевич Ильин
654-680
Аннотация:

Метаданные научных публикаций используются для построения каталогов, определения цитируемости публикаций и решения других задач. Автоматизация извлечения метаданных из PDF-файлов позволяет ускорить выполнение обозначенных задач, а от качества извлеченных данных зависит возможность их дальнейшего использования. Проанализированы существующие программные решения, в итоге отобраны три: GROBID, CERMINE, ScientificPdfParser. Предложена методика сравнения этих программных решений распознавания текстов научных публикаций по качеству извлечения метаданных. На основе методики проведен эксперимент по извлечению четырех типов метаданных (название, аннотация, дата публикации, имена авторов). Для сравнения программных решений использован набор из 112457 публикаций с разбиением на 23 предметные области, сформированный на основе данных Semantic Scholar. Приведен пример выбора эффективного программного решения извлечения метаданных в условиях заданных приоритетов для предметных областей и типов метаданных с использованием взвешенной суммы. Определено, что для приведенного примера CERMINE показывает эффективность на 10,5% выше, чем GROBID, и на 9,6% выше, чем ScientificPdfParser.

Ключевые слова: распознавание текста, научные публикации, метаданные, качество извлечения данных, методика.

Повышение качества метаданных научных публикаций с помощью отчетов Crossref

Алексей Викторович Ермаков
1117-1136
Аннотация:

Рассмотрены вопросы, связанные с повышением качества метаданных научных публикаций, размещаемых в библиографической базе данных Crossref. Всю информацию, содержащуюся в метаданных, полученных от издателей научных публикаций, Crossref анализирует и отображает в различных отчетах. Отчеты дают издателям представление о полноте и корректности представленных библиографических данных. Качество метаданных прямо или косвенно влияет на количество просмотров и ссылок на публикацию, соответственно, на рейтинги научных изданий, авторов и организаций.

Ключевые слова: метаданные публикаций, отчеты Crossref, цитирование, рейтинги научных изданий.

Метод автоматического пополнения метаданных электронных коллекций цифровой математической библиотеки

Полина Олеговна Гафурова
164-186
Аннотация:

Предложены подходы к дополнению метаданных документов электронных коллекций цифровой математической библиотеки. В качестве источников информации для пополнения метаданных использованы открытые ресурсы семантической сети. Для этой цели разработаны программные инструменты, обеспечивающие поиск необходимых данных и их включение в набор метаданных.


Предложен алгоритм пополнения метаданных аффилиации авторов научной статьи. Как правило, представленная в документе аффилиация содержит недостаточное количество информации, необходимой для формирования набора метаданных. Метод пополнения метаданных аффилиации авторов основан на данных, извлеченных из открытого реестра идентификаторов научных организаций Research Organization Registry (ROR). Также в методе использованы разработанные инструменты извлечения связей между ROR и открытыми семантическими сетями. Этот метод апробирован на электронной коллекции статей журнала «Электронные библиотеки» за 2021–2022 годы.


На основе предложенного метода разработан программный сервис, включенный в фабрику метаданных цифровой библиотеки Lobachevskii-DML. Также результатом работы является включение в цифровую библиотеку Lobachevskii-DML новых электронных коллекций. Кроме того, описан метод трансформации метаданных в формат, доступный для загрузки в библиотеку.

Ключевые слова: ROR, Wikidata, цифровые библиотеки, метаданные аффилиации, Lobachevskii-DML.

Построение цифровой системы управления геологическими знаниями для поддержки научных исследований

Михаил Иванович Патук, Вера Викторовна Наумова
148-158
Аннотация:

Описаны новые подходы к сбору данных о научных публикациях из систем открытого доступа с тематикой «Науки о земле». На основе разработанных и адаптированных подходов созданы архив научных публикаций (репозиторий) и комплекс программ доступа к научным публикациям для сбора, поиска, фильтрации, каталогизации и управления публикациями и их метаданными. Для улучшения доступности публикаций и других связанных с ними данных, находящихся на сайтах Государственного геологического музея им. В.И. Вернадского РАН, разработана система Wiki – Геология России. Эта система является тематическим рубрикатором по направлению «Месторождения полезных ископаемых России», с дополнительной тематикой «Минералогия». Все статьи имеют ссылку на источник информации из архива научных публикаций и, опционально, дополнительные ссылки по сходной тематике. Wiki – Геология России являются первым шагом в создании базы знаний по месторождениям полезных ископаемых.

Ключевые слова: Wiki – Геология России, системы управления знаниями, репозиторий.

Цифровой репозиторий "geologyscience.ru": открытый доступ к научным публикациям по геологии России

Михаил Иванович Патук , Вера Викторовна Наумова, Виталий Сергеевич Ерёменко
1324-1338
Аннотация:

Описаны новые подходы, связанные со сбором данных из разнородных информационных систем доступа к научным публикациям с использованием открытых международных стандартов и протоколов для формирования систем открытого доступа к научным геологическим публикациям. На основе разработанных и адаптированных подходов и технологических решений реализован комплекс программ информационно-аналитической системы доступа к научным публикациям, реализующей функции сбора, поиска, каталогизации, фильтрации и управления научными публикациями и их метаданными.

Ключевые слова: информационные технологии, науки о Земле, репозиторий, научные публикации.

Развитие информационной системы регистрации результатов интеллектуальной деятельности сотрудников научного учреждения

Светлана Александровна Власова, Николай Евгеньевич Каленов
770-793
Аннотация:

Описана разработанная авторами веб-система, реализующая сервисы, связанные с формированием и предоставлением многоаспектной информации о результатах научной деятельности (публикациях, авторских свидетельствах и докладах на научных мероприятиях) сотрудников организации или группы организаций. Система ориентирована как на конечного пользователя, заинтересованного в получении конкретных данных, так и на административный персонал, формирующий отчетные материалы для вышестоящей организации. Информационная база системы содержит связанные данные о следующих классах объектов: персоны (авторы), организации и их подразделения; публикации на аналитическом, монографическом и сводном уровнях; авторские свидетельства; научные мероприятия (конференции, симпозиумы, семинары); доклады. В состав системы входят два модуля – административный, предназначенный для ввода и редактирования данных, и пользовательский, который представляет собой специальный поисковый аппарат, осуществляющий поиск информации, ее визуализацию, навигацию по связанным ресурсам и экспорт данных. Отличительной особенностью системы является введенное понятие «эквивалентных» объектов. Эквивалентными считаются объекты, представленные в системе различными метаданными, но относящимися к одной физической сущности. Такими объектами являются «персоны», соответствующие одному автору с различными написаниями фамилии в библиографических описаниях публикаций; организации, имеющие различные варианты названий; статьи, опубликованные без изменений на различных языках. В соответствии с современными требованиями к отчетности по публикациям в системе отражаются источники финансирования научных исследований, а также аффилиации каждого автора, указанные в статьях.

Ключевые слова: научные труды, научная деятельность, автоматизированная система, база данных, отчеты, сетевые технологии.

Об описании некоторых краевых задач в семантической библиотеке LibMeta

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
2-21
Аннотация:

Использован подход онтологического проектирования для описания семантики некоторых краевых задач в цифровой библиотеке LibMeta.


Для описания задач в библиотеке LibMeta установлены связи терминов и понятий с классическими определениями математической энциклопедии и других первоисточников. Установление связей позволяет сформировать словарь и тезаурус прикладной предметной области краевых задач и поместить результаты в семантическую среду цифровой библиотеки. Примеры такого подхода продемонстрированы с использованием возможностей семантической библиотеки LibMeta, в которую в процессе развития интегрированы в оцифрованном виде версия математической энциклопедии, энциклопедии математической физики, классификаторы, прикладные математические тезаурусы и словари. Новые термины из публикаций после добавления в контент библиотеки отразились со связями в математической энциклопедии. Тезаурус для задач предметной области теории упругости был впервые создан путем интеграции предметных словарей, классификаторов, метаданных публикаций профильного журнала и энциклопедического контента библиотеки LibMeta. Цель таких исследований состоит в предоставлении пользователю дополнительных сервисов в поиске публикаций в прикладной научной области.

Ключевые слова: прикладная онтология, тезаурус предметной области, источники данных, разработка онтологии, цифровая семантическая библиотека LibMeta.

Аналитическая статистика о научных публикациях казанского федерального университета на Scilit

Алексей Викторович Ермаков
878-896
Аннотация:

Рассмотрены вопросы, связанные с представлением информации о публикациях научных сотрудников, преподавателей, аспирантов и студентов Казанского федерального университета (КФУ), а также научных изданиях Университета в информационно-аналитических материалах системы Scilit. На конкретных примерах показаны преимущества полного и корректного задания метаданных научных публикаций, а также возникающие проблемы при небрежном обращении с библиографической информацией.

Ключевые слова: аналитическая статистика, библиографические базы данных, метаданные публикаций, Scilit.

Наукометрические измерения в электронных библиотеках на основе рубрикаторов научной информации

М.Р. Когаловский, С.И. Паринов
Аннотация: Ряд научных систем электронных библиотек располагает средствами статистических измерений востребованности (количества просмотров и загрузок) содержащихся в них информационных объектов. Результаты этих измерений могут агрегироваться по их авторам и организациям, в которых созданы эти информационные объекты. Вместе с тем, большой интерес представляет также тематически структурированная статистика востребованности. Для идентификации тематики информационных объектов могут использоваться широко признанные научные классификационные системы или рубрикаторы научной информации. В данной статье рассматриваются функции сервиса системы Соционет, обеспечивающего указанные тематически структурированные статистические измерения.
Ключевые слова: электронная библиотека, наукометрия, рубрикатор научной информации, система Соционет, наукометрический сервис, тематический запрос, ГРНТИ, JEL.

Цифровая инфраструктура электронного научного журнала: автоматизация редакционно-издательских процессов и система сервисов

Миляуша Салахутдиновна Галявиева, Александр Михайлович Елизаров, Евгений Константинович Липачёв
408-465
Аннотация:

Описаны современные модели и средства публикации и распространения научных знаний. Охарактеризованы современные информационные системы управления научными изданиями и сервисы, определяющие их функциональность.

Введено понятие цифровой инфраструктуры электронного научного журнала как комплекса, который объединяет программную платформу, реализующую основные рабочие процессы управления электронным журналом, и информационные системы, которые обеспечивают функционирование как основных, так и дополнительных сервисов, учитывающих, в частности, специфику предметной области журнала.

Представлен подход к организации цифровой инфраструктуры электронного научного журнала на основе открытой программной системы Open Journal Systems (OJS). Предложены сервисы, расширяющие функциональные возможности этой системы и учитывающие специфику предметной области научных журналов. На основе технологии расширения функционала OJS созданы программные модули, обеспечивающие автоматизацию ряда редакционных процессов электронного научного журнала.

Представлена система сервисов автоматической обработки коллекций научных документов. Эти сервисы обеспечивают проверку соответствия документов коллекций принятым правилам формирования коллекций и преобразования документов в установленные форматы; структурный анализ документов и извлечение метаданных, а также их интеграцию в научное информационное пространство. Система сервисов позволяет автоматически выполнять набор операций, который не реализуем за практически приемлемое время при традиционной «ручной» обработке электронного контента, и предназначена для обработки больших коллекций научных документов.

Охарактеризованы алгоритмы автоматической стилевой валидации текстов на этапе регистрации статьи в информационной системе электронного научного журнала, автоматического подбора рецензентов, рассылки уведомлений и контроля сроков рецензирования.

Представлены методы обработки документов, содержащих математические формулы, в частности, алгоритм поиска по формулам в коллекциях математических документов. Указаны основные идеи, подходы и уже полученные результаты по разработке семантических технологий управления математическими знаниями, в том числе, подход к построению рекомендательных систем на основе онтологий математического знания и метод автоматизации процесса первичной обработки научной статьи, использующей TеX-нотацию.

Охарактеризована проблема построения системы анализа и оценки информационного и социального воздействия публикуемого научного контента на его пользователей. Проведено сопоставление традиционных (библиометрических и наукометрических) и альтернативных показателей такой оценки. Описан мировой опыт использования информетрических сервисов на сайтах научных журналов. Обсуждены варианты реализации этих подходов в рамках цифровой инфраструктуры электронного научного журнала.

Ключевые слова: издательские системы, современные модели публикации и распространения научных знаний, информационное общество, электронный научный журнал, информационные системы управления научными изданиями и публикациями, интеграция электронных ресурсов.

Цифровой геологический репозиторий и информация о стратиграфическом возрасте (на примере DSpace)

Михаил Иванович Патук, Вера Викторовна Наумова
465-473
Аннотация:

Описан новый подход, связанный с извлечением терминов относительного геологического возраста из метаданных научных геологических публикаций. На основе разработанных и адаптированных подходов и технологических решений реализован комплекс макросов, реализующий функции поиска, извлечения и добавления новых метаданных к научным публикациям.

Ключевые слова: информационные технологии, науки о Земле, репозиторий, научные публикации, стратиграфический возраст.

Алгоритм определения переводов статей с использованием статистических данных

Александр Сергеевич Козицын, Сергей Александрович Афонин, Андрей Александрович Зензинов
494-505
Аннотация: В настоящее время происходит активное внедрение наукометрических систем для автоматизации процесса анализа эффективности деятельности научных организаций с целью применения различных методов стимулирования научной деятельности. Одними из наиболее важных индикаторов являются количество публикаций и их цитируемость. Для оценки этих показателей необходимы средства автоматизированного построения связей между оригинальными статьями и их переводами. В настоящей работе проанализированы существующие методы оценки близости оригинального текста и его возможного перевода, показана их недостаточная эффективность для построения связей между статьями и описаня разработанный авторами метод автоматического поиска переводов статей в больших коллекциях библиографических данных. Особенностью разработанного алгоритма является использование статистических данных о публикации статей в различных журналах и информации о соавторах анализируемых статей. Представленный в настоящей работе алгоритм позволяет осуществлять поиск переводов статей без предварительной настройки на заданные пары языков оригинала и перевода статьи, а также не требует использования больших коллекций обучающих выборок. Апробация программной реализации алгоритма проводилась в наукометрической системе Московского государственного университета (МГУ) им. М.В. Ломоносова. Результаты тестирования показали ее достаточную эффективность и возможность использования разработанного алгоритма для автоматического построения рекомендаций пользователям для отметки в системе переводных версий статей.
Ключевые слова: библиографические данные, анализ графов, перевод, статья, статистика, наукометрия, цитирование, автоматизированные системы.

Информационная система регистрации результатов интеллектуальной деятельности сотрудников научного учреждения

Светлана Александровна Власова, Николай Евгеньевич Калёнов
218-237
Аннотация:

Представлена разработанная авторами объектно-ориентированная веб-система, предназначенная для формирования метаданных, описывающих результаты научной деятельности сотрудников учреждения (группы учреждений), и предоставления различных справочно-статистических данных о публикациях и докладах, сделанных ими на научных конференциях, симпозиумах, семинарах. Система ориентирована на работу с объектами таких связанных между собой классов, как «автор», «организация», «публикация», «доклад», «мероприятие». Профиль метаданных объектов каждого класса включает атрибуты, необходимые для получение развернутой информации как об отдельном объекте данного класса, так и о группе объектов, связанных заданными значениями атрибутов объектов других классов (например, перечень статей сотрудников заданного подразделения данной организации, опубликованных в заданном журнале за заданный промежуток времени). Отличительной особенностью системы является введенное понятие «эквивалентных» объектов. Эквивалентными считаются объекты, представленные в системе различными метаданными, но относящимися к одной физической сущности. Такими объектами являются «персоны», соответствующие одному автору с различными написаниями фамилии в библиографических описаниях публикаций; организации, имеющие различные варианты названий; статьи, опубликованные без изменений на различных языках. Подробно охарактеризованы возможности системы, ее пользовательский интерфейс, приведены примеры выполнения конкретных запросов.

Ключевые слова: базы данных, учет результатов научной деятельности, веб-ориентированная система, сетевые технологии, анализ публикационной активности, программное обеспечение.

Формирование метаданных для международных баз цитирования в системе управления электронными научными журналами

Алексей Николаевич Герасимов, Александр Михайлович Елизаров, Евгений Константинович Липачев
6-31
Аннотация:

Предложен алгоритм автоматического извлечения библиографических данных из однородного массива публикаций (в частности, выпусков научного журнала) и формирования блоков метаданных для экспорта в международные информационно-аналитические системы. Развиты методы интеграции платформы управления электронными научными журналами Open Journal Systems и международных баз научного цитирования.

Ключевые слова: издательские системы, электронный научный журнал, интеграция электронных ресурсов, базы данных научного цитирования, экстракция метаданных.

Принципы формирования и представления междисциплинарных коллекций в цифровом пространстве научных знаний

Сергей Александрович Кириллов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
294-314
Аннотация:

Исследованы вопросы формирования междисциплинарных тематических коллекций в цифровом пространстве научных знаний. Рассмотрены содержание работ по формированию и представлению междисциплинарной коллекции, правила организации и представления междисциплинарных цифровых коллекций в информационной среде электронной библиотеки «Научное наследие России». Отмечено, что организация работ по формированию междисциплинарной коллекции в цифровом пространстве знаний предполагает следующие этапы: определение тематики междисциплинарной коллекции, определение структуры разделов междисциплинарной коллекции, определение источников для представления в междисциплинарной коллекции, диспетчеризацию работ с источниками, формирование метаданных, формирование цифровых копий объектов (включая оцифровку и верстку электронного объекта), размещение созданных цифровых копий на специализированной странице междисциплинарной коллекции. Показаны типы и виды междисциплинарных коллекций. Разработаны основные типы разделов, присутствующих в большинстве междисциплинарных проектов. Отмечено, что информация, представляемая в междисциплинарной коллекции, включает две составляющие – метаданные, описывающие характеристики ресурсов, и собственно цифровые информационные ресурсы, а именно, представленные в цифровой форме объекты библиотечного, музейного и архивного хранения – это печатные и рукописные издания, графика, фото-, аудио-, видео-материалы, музейные предметы. Предложена методика отбора материалов для формирования междисциплинарной коллекции на примере создания коллекции, посвященной нобелевским лауреатам, гражданам России и СССР, а также родившимся на территории России и СССР.

Ключевые слова: виртуальная выставка, электронная библиотека, научное наследие, базы данных, электронные фонды, цифровые копии.

Электронные научные издания: переход на технологии семантического Веба

В.А. Глухов, А.М. Елизаров, Е.К. Липачёв, М.А. Малахальцев
Аннотация: Рассмотрено применение технологий семантического Веба в электронных научных коллекциях. Изложе-ны подходы к поддержке электронных коллекций на основе XML, RDF и других технологий семантического Веба. В частности, решены вопросы генерации метаданных, организации хранения и поиска данных. Эти под-ходы реализованы в проекте Научная электронная библиотека (НЭБ) eLibrary.ru и электронном журнале «Lo-bachevskii Journal of Mathematics» (http://ljm.ksu.ru).

Разработка веб-приложений на основе технологий, ресурсов и сервисов геопортала ИВМ СО РАН

О.Э. Якубайлик, А.А. Кадочников, А.В. Токарев
Аннотация: Геопортал – это картографический веб-сайт; специализированное программно-технологическое обеспечение для работы с пространственными данными. Его основная задача – обеспечение пользователя средствами и сервисами хранения и каталогизации, публикации и загрузки пространственных (географических) данных, поиска и фильтрации по метаданным, интерактивной веб-визуализации, прямого доступа к геоданным на основе картографических веб-сервисов. Геопортал ИВМ СО РАН, набор его компонентов и сервисов, стал геоинформационной платформой для создания семейства прикладных геоинформационных веб-приложений. В статье рассматриваются опыт проектирования и разработки этих систем.
Ключевые слова: геопортал, пространственные данные, интерактивная веб-визуализация.

Рейтинги библиографической базы и «белые списки»

Татьяна Алексеевна Полилова
640-670
Аннотация:

В настоящее время российские учреждения практически полностью отключены от западных информационных ресурсов и сервисов, связанных с изданием научных журналов. В таких условиях особую актуальность приобрела задача замещения ушедших сервисов, переориентация на отечественные научные журналы, российские библиотечные онлайновые ресурсы. В наиболее крупной библиографической базе eLibrary.ru, ориентированной на русскоязычные научные издания, собрана информация почти о 15 тысячах русскоязычных журналов. В eLibrary.ru действует аналитическая система «Российский индекс научного цитирования» (РИНЦ), обрабатывающая метаданные статей более чем 5 тысяч российских научных журналов. Насколько eLibrary.ru и РИНЦ готовы взять на себя функции национальной библиографической базы? По какой причине в российских организациях появляются «белые списки» журналов?


Основная проблема РИНЦ состоит в качестве построенных рейтингов научных журналов. Методики расчета рейтингов все прошедшие годы вызывали определенные критические замечания. В работе приводится пример построенного в РИНЦ рейтинга журналов из раздела «Математика». На первых позициях оказались журналы, малоизвестные в среде профессиональных математиков. Серьезные деформации в рейтингах РИНЦ подрывают доверие ученых к предлагаемым РИНЦ оценкам авторитетности российских журналов. Реакция некоторых вузов и научных организаций вполне ожидаемая: организации начинают вводить свои критерии успешности публикационной деятельности сотрудников, связанные с публикацией статей в журналах из так называемых «белых списков». Белый список журналов составляется, как правило, экспертными советами организации прицельно по каждой дисциплине и научному направлению. При составлении белых списков наукометрические показатели могут учитываться, но они не являются преимущественным критерием для отбора журналов. Белые списки в настоящее время могут стать разумным дополнением рейтингов библиографических баз.

Ключевые слова: научная публикация, рейтинг журналов, тематическая классификация, импакт-фактор, мультидисциплинарность, библиографическая ссылка, белый список научных журналов.
1 - 18 из 18 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества