Automatic Replenishment of Metadata of Digital Publications using Semantic Services of the Internet

Main Article Content

Polina Olegovna Gafurova

Abstract

The article describes approaches to replenishing metadata of documents in electronic collections of a digital mathematical library. An open resource of the semantic network is used as a replenishment. For this purpose, software tools have been developed to search for the necessary data and include it in a metadata set. A separate block of metadata in a scientific article is formed from the affiliation of the authors presented in the document. Typically, the ownership that occurs in a document does not contain sufficient data to generate a set of metadata. A method has been developed for providing author affiliation metadata, providing an open register of scientific organization identifiers (ROR), as well as means for making connections between ROR and other semantic chains. This method was applied to the collections of articles of the journal “Digital Libraries” for 2021–2022.


The article describes a method for connecting the Lobachevsky digital mathematical library-DML to new electronic collections, and describes a method for transforming metadata into a digital format available for downloading.

Article Details

References

1. Elizarov A.M., Lipachev E.K. Lobachevskii DML: Towards a Semantic Digital Mathematical Library of Kazan University // International Conference on Data Analytics and Management in Data Intensive Domains. 2017. P. 326–333.
2. Елизаров А.М., Липачёв Е.К. Цифровая библиотека Lobachevskii-DML в научном пространстве математических знаний // Научно-техническая информация. Серия 1: Организация и методика информационной работы. 2023. № 1. С. 32–37. https://doi.org/10.36535/0548-0019-2023-01-3
3. Elizarov A., Lipachev E. Big math methods in Lobachevskii-DML digital library // CEUR Workshop Proceedings 2019. V. 2523. P.59–72.
4. Carette J., Farmer W.M., Kohlhase M., Rabe F. Big Math and the OneBrain Barrier. A Position Paper and Architecture Proposal // arXiv:1904.10405v1. 2019. https://doi.org/10.48550/arXiv.1904.10405
5. Carette J., Farmer W.M., Kohlhase M., Rabe F. Big Math and the One-Brain Barrier: The Tetrapod Model of Mathematical Knowledge // Math. Intelligencer. 2021. V. 43. P. 78–87. https://doi.org/10.1007/s00283-020-10006-0
6. Гафурова П.О., Липачёв Е.К. Метод уточнения аффилиации авторов научных документов на основе запросов к семантической сети // Научный сервис в сети Интернет: труды XXIV Всероссийской научной конференции (19–22 сентября 2022 г., онлайн). М.: ИПМ им. М.В. Келдыша. 2022. С. 115–127. https://doi.org/10.20948/abrau-2022-31
7. Гафурова П.О. Гармонизация метаданных цифровых математических коллекций // Информационные технологии в образовании и науке (ИТОН-2023): материалы IX Международной научно-практической конференции в рамках IV Международного форума по математическому образованию (27 марта – 1 апреля 2023 г.) / отв. ред. А.А. Агафонов. Казань: Изд-во Академии наук РТ. 2023. C. 46–50. URL: https://kpfu.ru/portal/docs/F357733059/ITON_2023.pdf
8. Elizarov A., Lipachev E. Digital Libraries and the Common Digital Space of Mathematical Knowledge // CEUR Workshop Proc. 2021. V. 2990. P. 25–38.
9. Инструкция по Articulus (для периодических и непериодических изданий). URL: https://vniigis.ru/1_dlya_failov/Help/Инструкция%20по%20раб оте%20с%20программой%20Articulus%20eLibrary%20НЭБ%20РИНЦ.pdf
10. Bouche T., Goutorbe C., Jorda J.-P., Jost M. The EuDML Metadata Schema: Version 1.0. // Towards a Digital Mathematics Library, July 2011, Bertinoro, Italy. P. 45–61. URL: https://hal.univ-grenoble-alpes.fr/hal-03765892/file/D3.6.pdf
11. How can I submit metadata for a complete journal or conference? URL: https://dblp.org/faq/How+can+I+submit+meta+data+for+a+complete+journal+or+conference.html
12. Кириллова О.В. Аффилиация авторов научных публикаций и ее представление в статьях и в глобальных индексах цитирования. URL: https://kai.ru/documents/1489522/1535688/affiliation.pdf/a3349af1-1b8d-4f05-ba54-812f60a32e21
13. Кириллова О.В. Значение и основные требования к представлению aффилиации авторов в научных публикациях // Научный редактор и издатель. 2016. Т. 1 (1–4). С. 32–42.
14. Елизаров А.М., Липачев Е.К., Хайдаров Ш.М. Цифровая математическая библиотека Lobachevskii DML. Свидетельство о государственной регистрации базы данных № 2021620324 от 25 февраля 2021 года.
15. Елизаров А.М., Зайцева Н.В., Зуев Д.С., Липачёв Е.К., Хайдаров Ш.М. Сервисы формирования метаданных цифровых документов в форматах международных наукометрических баз данных // Научный сервис в сети Интернет: труды XX Всероссийской научной конференции (17–22 сентября 2018 г., г. Новороссийск). М.: ИПМ им. М.В. Келдыша, 2018. С. 175–185. https://doi.org/10.20948/abrau-2018-53/2020610082.pdf
16. Андреичев М.Д., Гафурова П.О., Елизаров А.М., Липачёв Е.К. Пополнение метаданных документов математических цифровых ретро-коллекций методом семантических сетей // Научный сервис в сети Интернет: труды XXIII Всероссийской научной конференции (20–23 сентября 2021 г., онлайн). М.: ИПМ им. М.В. Келдыша, 2021. С. 22–33. https://doi.org/10.20948/abrau-2021-22. URL: https://keldysh.ru/abrau/2021/theses/22.pdf
17. Elizarov A., Gafurova P., Lipachev E. Wikidata in Metadata Formation Methods for Documents of Digital Mathematical Library // CEUR Workshop Proc. 2021. V. 3066. P. 23–33.
18. Апанович З.В. Информация о российских научных организациях в международных и русскоязычных источниках данных // Электронные библиотеки. 2021. Т. 24 (5). С. 756–769. URL: https://rdl-journal.ru/article/view/701
19. ROR – The Research Organization Registry (ROR). URL: https://ror.org/
20. Елизаров А.М., Липачёв Е.К., Хайдаров Ш.М. Программа автоматизированного формирования выпусков журнала «Электронные библиотеки» Свидетельство о государственной регистрации базы данных № 2020610082 от 9 января 2020 года.
21. Гафурова П.О., Елизаров А.М., Липачёв Е.К. Базовые сервисы фабрики метаданных цифровой математической библиотеки Lobachevskii-DML // Электронные библиотеки. 2020. Т. 23 (3). С. 336–381. https://doi.org/10.26907/1562-5419-2020-23-3-336-381
22. Elizarov A., Khaydarov S., Lipachev E. Scientific documents ontologies for semantic representation of digital libraries // RPC 2017. Proceedings of the 2nd Russian-Pacific Conference on Computer Technology and Applications, 2017. P. 1–5. https://doi.org/10.1109/RPC.2017.8168064
23. Biryal'tsev E., Elizarov A., Zhil'tsov N., Lipachev E., Nevzorova O., Solov'ev V. Methods for analyzing semantic data of electronic collections in mathematics // Automatic Documentation and Mathematical Linguistics. 2014. V. 48. No. 2. P. 81–85. https://doi.org/10.3103/S000510551402006X
24. ROR REST API Guide URL: https://ror.readme.io/docs/rest-api
25. Journal Archiving and Interchange Tag Library NISO JATS Version 1.3d1. URL: https://jats.nlm.nih.gov/archiving/tag-library/1.3d1/chapter/how-to-read.html
26. Электронная коллекция статей журнала «Электронные библиотеки» URL: https://lobachevskii-dml.ru/journal/elbib
27. Электронная коллекция «XI Всероссийский съезд по фундаментальным проблемам теоретической и прикладной механики». URL: https://lobachevskii-dml.ru/conference/congress_11
28. Гафурова П.О. Дополнение метаданных документов цифровых коллекций из внешних источников // Материалы Всероссийской школы-конференции «Лобачевские чтения – 2023». Казань: Изд-во КФУ. 2023. Т. 67 С. 33–36.
29. Гафурова П.О. Автоматическое пополнение метаданных цифровых публикаций с использованием семантических сервисов сети Интернет // Научный сервис в сети Интернет. 2023. № 25. С. 84–93.
https://doi.org/10.20948/abrau-2023-27
30. Elizarov A., Gafurova P., Lipachev E. Algorithms for Integration of Unstructured Mathematical Documents into the Common Digital Space of Scientific Knowledge// CEUR Workshop Proc. 2021. V. 2990. P. 39–49. URL: https://ceur-ws.org/Vol-2990/rpaper4.pdf
31. Гафурова П.О., Кривцова В.А. Программа формирования списка близких статей цифровой математической библиотеки на основе статистических метрик. Свидетельство о государственной регистрации базы данных № 2023684278 от 15 ноября 2023 года.