Метод автоматического пополнения метаданных электронных коллекций цифровой математической библиотеки

Main Article Content

Полина Олеговна Гафурова

Аннотация

Предложены подходы к дополнению метаданных документов электронных коллекций цифровой математической библиотеки. В качестве источников информации для пополнения метаданных использованы открытые ресурсы семантической сети. Для этой цели разработаны программные инструменты, обеспечивающие поиск необходимых данных и их включение в набор метаданных.


Предложен алгоритм пополнения метаданных аффилиации авторов научной статьи. Как правило, представленная в документе аффилиация содержит недостаточное количество информации, необходимой для формирования набора метаданных. Метод пополнения метаданных аффилиации авторов основан на данных, извлеченных из открытого реестра идентификаторов научных организаций Research Organization Registry (ROR). Также в методе использованы разработанные инструменты извлечения связей между ROR и открытыми семантическими сетями. Этот метод апробирован на электронной коллекции статей журнала «Электронные библиотеки» за 2021–2022 годы.


На основе предложенного метода разработан программный сервис, включенный в фабрику метаданных цифровой библиотеки Lobachevskii-DML. Также результатом работы является включение в цифровую библиотеку Lobachevskii-DML новых электронных коллекций. Кроме того, описан метод трансформации метаданных в формат, доступный для загрузки в библиотеку.

Article Details

Библиографические ссылки

1. Elizarov A.M., Lipachev E.K. Lobachevskii DML: Towards a Semantic Digital Mathematical Library of Kazan University // International Conference on Data Analytics and Management in Data Intensive Domains. 2017. P. 326–333.
2. Елизаров А.М., Липачёв Е.К. Цифровая библиотека Lobachevskii-DML в научном пространстве математических знаний // Научно-техническая информация. Серия 1: Организация и методика информационной работы. 2023. № 1. С. 32–37. https://doi.org/10.36535/0548-0019-2023-01-3
3. Elizarov A., Lipachev E. Big math methods in Lobachevskii-DML digital library // CEUR Workshop Proceedings 2019. V. 2523. P.59–72.
4. Carette J., Farmer W.M., Kohlhase M., Rabe F. Big Math and the OneBrain Barrier. A Position Paper and Architecture Proposal // arXiv:1904.10405v1. 2019. https://doi.org/10.48550/arXiv.1904.10405
5. Carette J., Farmer W.M., Kohlhase M., Rabe F. Big Math and the One-Brain Barrier: The Tetrapod Model of Mathematical Knowledge // Math. Intelligencer. 2021. V. 43. P. 78–87. https://doi.org/10.1007/s00283-020-10006-0
6. Гафурова П.О., Липачёв Е.К. Метод уточнения аффилиации авторов научных документов на основе запросов к семантической сети // Научный сервис в сети Интернет: труды XXIV Всероссийской научной конференции (19–22 сентября 2022 г., онлайн). М.: ИПМ им. М.В. Келдыша. 2022. С. 115–127. https://doi.org/10.20948/abrau-2022-31
7. Гафурова П.О. Гармонизация метаданных цифровых математических коллекций // Информационные технологии в образовании и науке (ИТОН-2023): материалы IX Международной научно-практической конференции в рамках IV Международного форума по математическому образованию (27 марта – 1 апреля 2023 г.) / отв. ред. А.А. Агафонов. Казань: Изд-во Академии наук РТ. 2023. C. 46–50. URL: https://kpfu.ru/portal/docs/F357733059/ITON_2023.pdf
8. Elizarov A., Lipachev E. Digital Libraries and the Common Digital Space of Mathematical Knowledge // CEUR Workshop Proc. 2021. V. 2990. P. 25–38.
9. Инструкция по Articulus (для периодических и непериодических изданий). URL: https://vniigis.ru/1_dlya_failov/Help/Инструкция%20по%20раб оте%20с%20программой%20Articulus%20eLibrary%20НЭБ%20РИНЦ.pdf
10. Bouche T., Goutorbe C., Jorda J.-P., Jost M. The EuDML Metadata Schema: Version 1.0. // Towards a Digital Mathematics Library, July 2011, Bertinoro, Italy. P. 45–61. URL: https://hal.univ-grenoble-alpes.fr/hal-03765892/file/D3.6.pdf
11. How can I submit metadata for a complete journal or conference? URL: https://dblp.org/faq/How+can+I+submit+meta+data+for+a+complete+journal+or+conference.html
12. Кириллова О.В. Аффилиация авторов научных публикаций и ее представление в статьях и в глобальных индексах цитирования. URL: https://kai.ru/documents/1489522/1535688/affiliation.pdf/a3349af1-1b8d-4f05-ba54-812f60a32e21
13. Кириллова О.В. Значение и основные требования к представлению aффилиации авторов в научных публикациях // Научный редактор и издатель. 2016. Т. 1 (1–4). С. 32–42.
14. Елизаров А.М., Липачев Е.К., Хайдаров Ш.М. Цифровая математическая библиотека Lobachevskii DML. Свидетельство о государственной регистрации базы данных № 2021620324 от 25 февраля 2021 года.
15. Елизаров А.М., Зайцева Н.В., Зуев Д.С., Липачёв Е.К., Хайдаров Ш.М. Сервисы формирования метаданных цифровых документов в форматах международных наукометрических баз данных // Научный сервис в сети Интернет: труды XX Всероссийской научной конференции (17–22 сентября 2018 г., г. Новороссийск). М.: ИПМ им. М.В. Келдыша, 2018. С. 175–185. https://doi.org/10.20948/abrau-2018-53/2020610082.pdf
16. Андреичев М.Д., Гафурова П.О., Елизаров А.М., Липачёв Е.К. Пополнение метаданных документов математических цифровых ретро-коллекций методом семантических сетей // Научный сервис в сети Интернет: труды XXIII Всероссийской научной конференции (20–23 сентября 2021 г., онлайн). М.: ИПМ им. М.В. Келдыша, 2021. С. 22–33. https://doi.org/10.20948/abrau-2021-22. URL: https://keldysh.ru/abrau/2021/theses/22.pdf
17. Elizarov A., Gafurova P., Lipachev E. Wikidata in Metadata Formation Methods for Documents of Digital Mathematical Library // CEUR Workshop Proc. 2021. V. 3066. P. 23–33.
18. Апанович З.В. Информация о российских научных организациях в международных и русскоязычных источниках данных // Электронные библиотеки. 2021. Т. 24 (5). С. 756–769. URL: https://rdl-journal.ru/article/view/701
19. ROR – The Research Organization Registry (ROR). URL: https://ror.org/
20. Елизаров А.М., Липачёв Е.К., Хайдаров Ш.М. Программа автоматизированного формирования выпусков журнала «Электронные библиотеки» Свидетельство о государственной регистрации базы данных № 2020610082 от 9 января 2020 года.
21. Гафурова П.О., Елизаров А.М., Липачёв Е.К. Базовые сервисы фабрики метаданных цифровой математической библиотеки Lobachevskii-DML // Электронные библиотеки. 2020. Т. 23 (3). С. 336–381. https://doi.org/10.26907/1562-5419-2020-23-3-336-381
22. Elizarov A., Khaydarov S., Lipachev E. Scientific documents ontologies for semantic representation of digital libraries // RPC 2017. Proceedings of the 2nd Russian-Pacific Conference on Computer Technology and Applications, 2017. P. 1–5. https://doi.org/10.1109/RPC.2017.8168064
23. Biryal'tsev E., Elizarov A., Zhil'tsov N., Lipachev E., Nevzorova O., Solov'ev V. Methods for analyzing semantic data of electronic collections in mathematics // Automatic Documentation and Mathematical Linguistics. 2014. V. 48. No. 2. P. 81–85. https://doi.org/10.3103/S000510551402006X
24. ROR REST API Guide URL: https://ror.readme.io/docs/rest-api
25. Journal Archiving and Interchange Tag Library NISO JATS Version 1.3d1. URL: https://jats.nlm.nih.gov/archiving/tag-library/1.3d1/chapter/how-to-read.html
26. Электронная коллекция статей журнала «Электронные библиотеки» URL: https://lobachevskii-dml.ru/journal/elbib
27. Электронная коллекция «XI Всероссийский съезд по фундаментальным проблемам теоретической и прикладной механики». URL: https://lobachevskii-dml.ru/conference/congress_11
28. Гафурова П.О. Дополнение метаданных документов цифровых коллекций из внешних источников // Материалы Всероссийской школы-конференции «Лобачевские чтения – 2023». Казань: Изд-во КФУ. 2023. Т. 67 С. 33–36.
29. Гафурова П.О. Автоматическое пополнение метаданных цифровых публикаций с использованием семантических сервисов сети Интернет // Научный сервис в сети Интернет. 2023. № 25. С. 84–93.
https://doi.org/10.20948/abrau-2023-27
30. Elizarov A., Gafurova P., Lipachev E. Algorithms for Integration of Unstructured Mathematical Documents into the Common Digital Space of Scientific Knowledge// CEUR Workshop Proc. 2021. V. 2990. P. 39–49. URL: https://ceur-ws.org/Vol-2990/rpaper4.pdf
31. Гафурова П.О., Кривцова В.А. Программа формирования списка близких статей цифровой математической библиотеки на основе статистических метрик. Свидетельство о государственной регистрации базы данных № 2023684278 от 15 ноября 2023 года.


Наиболее читаемые статьи этого автора (авторов)