Анализ распределения ключевых терминов в научных статьях

Main Article Content

Светлана Александровна Власова
Николай Евгеньевич Каленов
Ирина Николаевна Соболевская

Аннотация

Одними из основных компонентов Единого Цифрового Пространства Научных Знаний (ЕЦПНЗ) являются предметные онтологии отдельных тематических подпространств, включающие в себя основные понятия, относящиеся к данному научному направлению. Задача построения предметных онтологий на первом этапе требует формирования массива ключевых терминов в заданной области науки с последующим установлением связей между ними. Аналогичная задача стоит и при формировании энциклопедий в части определения перечня статей (слотов), определяющего их содержание. Одним из источников формирования массива ключевых терминов могут являться метаданные статей, опубликованных в ведущих научных журналах, а именно, авторские ключевые термины («ключевые слова» – в терминологии редакций журналов), сопровождающие в обязательном порядке эти статьи. Чтобы сделать заключение о возможности использования этого подхода к формированию предметных онтологий, необходимо провести предварительный анализ массива авторских ключевых терминов как с точки зрения реального соответствия основным направлениям исследований в данном разделе науки, так и с точки зрения распределения частоты встречаемости тех или иных терминов. В данной статье приведены результаты частотного анализа встречаемости авторских ключевых терминов на русском и английском языках, проведенного на основе программной обработки нескольких тысяч статей из ведущих российских журналов по математике, информатике и физике, отраженных в базе данных MathNet и на сайтах ряда издательств. Проведена оценка соответствия распределения ключевых терминов (как словосочетаний) и отдельных слов закону Брэдфорда, выявлены ядра ключевых терминов внутри тематических направлений.

Article Details

Библиографические ссылки

1. Антопольский А.Б., Каленов Н.Е., Серебряков В.А., Сотников А.Н. О едином цифровом пространстве научных знаний // Вестник Российской академии наук. 2019. Т. 89 (7). C. 728–735. URL: https://doi.org/ 10.31857/S0869-5873897728-735.
2. Савин Г.И. Единое цифровое пространство научных знаний: цели и задачи // Информационные ресурсы России. 2020. № 5. С. 3–5. URL: https://doi.org/ 10.51218/0204-3653-2020-5-3-5.
3. Большая российская энциклопедия. URL: https://bigenc.ru/ (дата обращения: 22.12.2022).
4. Kalenov N., Savin G., Sotnikov A. Fundamentals of Common Digital Space of Scientific Knowledge Building // CEUR Workshop Proceedings (CEUR-WS.org). 2021. Vol. 2990. P. 93–99. URL: https://doi.org/10.51218/1613-0073-2990-93-99
5. Михайлов О.В. Новая платформа журналов RSCI в WEB of Science Вестник Российской академии наук. 2017. Т. 87. № 2. С. 177–180.
6. Общероссийский портал Math-Net.ru. URL: http://www.mathnet.ru/ (дата обращения: 22.12.2022).
7. Вычислительные методы и программирование. URL: https://num-meth.ru/index.php/journal/issue/archive (дата обращения: 22.12.2022).
8. Программные продукты и системы. URL: http://www.swsys.ru/index.php?page=10&lang= (дата обращения: 22.12.2022)
9. Власова С.А., Каленов Н.Е., Сотников А.Н. Web-ориентированная система формирования контента единого цифрового пространства научных знаний // Программные продукты и системы. 2020. № 3. С. 365–374. URL: https://doi.org/10.15827/0236-235X.131.365-374.