Алгоритм определения переводов статей с использованием статистических данных

Main Article Content

Александр Сергеевич Козицын
Сергей Александрович Афонин
Андрей Александрович Зензинов

Аннотация

В настоящее время происходит активное внедрение наукометрических систем для автоматизации процесса анализа эффективности деятельности научных организаций с целью применения различных методов стимулирования научной деятельности. Одними из наиболее важных индикаторов являются количество публикаций и их цитируемость. Для оценки этих показателей необходимы средства автоматизированного построения связей между оригинальными статьями и их переводами. В настоящей работе проанализированы существующие методы оценки близости оригинального текста и его возможного перевода, показана их недостаточная эффективность для построения связей между статьями и описаня разработанный авторами метод автоматического поиска переводов статей в больших коллекциях библиографических данных. Особенностью разработанного алгоритма является использование статистических данных о публикации статей в различных журналах и информации о соавторах анализируемых статей. Представленный в настоящей работе алгоритм позволяет осуществлять поиск переводов статей без предварительной настройки на заданные пары языков оригинала и перевода статьи, а также не требует использования больших коллекций обучающих выборок. Апробация программной реализации алгоритма проводилась в наукометрической системе Московского государственного университета (МГУ) им. М.В. Ломоносова. Результаты тестирования показали ее достаточную эффективность и возможность использования разработанного алгоритма для автоматического построения рекомендаций пользователям для отметки в системе переводных версий статей.

Article Details

Биографии авторов

Александр Сергеевич Козицын

Ведущий научный сотрудник, к.ф.-м.н., окончил мехмат МГУ им. М.В. Ломоносова. Специалист в области информационного поиска и баз данных.

Сергей Александрович Афонин

Ведущий научный сотрудник, к.ф.-м.н., окончил мехмат МГУ им. М.В. Ломоносова. Специалист в области регулярных языков и информационных систем.

Андрей Александрович Зензинов

Младший научный сотрудник, окончил мехмат МГУ им. М.В. Ломоносова. Специалист в области моделирования распределённых информационных систем.

Библиографические ссылки

Налимов В.В., Мульченко З.М. Наукометрия. Изучение науки как информационного процесса. Москва: Наука, 1969. 340 с.
URL: http://www.library.spbu.ru
URL: http://library.bmstu.ru/Publications/
Алехина Е.И. Информационная система учета научно-исследовательской деятельности сотрудников вуза // Инновационная наука. 2018. №5-1. С. 9–12.
Столяров Р.А., Чугреев В.Л. Автоматизированная система учета результатов интеллектуальной деятельности в научной организации. URL: http://vtr.vscc.ac.ru/article/1512
Садовничий В.А., Васенин В.А. Интеллектуальная система тематического исследования наукометрических данных: предпосылки создания и методология разработки. Часть 1 // Программная инженерия. 2018. Т. 9. №2. С. 51–58.
Васенин В.А., Занчурин М.А., Козицын А.С. и др. Архитектурно-технологические аспекты разработки и сопровождения больших информационно-аналитических систем в сфере науки и образования // Программная инженерия. 2017. Т. 8. № 10. С. 448–455.
Васенин В.А., Иткес A.А. Внедрение реляционной модели логического разграничения доступа в web-приложения информационных систем, разработанных на основе библиотеки django // Программная инженерия. 2018. Т. 9. № 5. С. 195–208.
Васенин В.А., Иткес А.А., Бухонов В.Ю., Галатенко А.В. Модели логического разграничения доступа в многопользовательских системах управления наукометрическим контентом // Программная инженерия. 2016. Т. 7. № 12. С. 547–558.
Коряков Д.Е. Наукометрия. Зачем нужны разные индексы. URL: https://www.mcb.nsc.ru/sites/mcb.nsc.ru/files/fck/file/naukometriya_2.pdf
Автоматический переводчик «Гугл». URL: https://translate.google.ru/
Автоматический переводчик «Промпт». URL: http://www.translate.ru
Научная конференция «Обнаружение заимствований – 2017». URL: http://www.oz2017.ru
Плагиат в научных статьях: трудности обнаружения перевода. URL: http://ai-news.ru/2018/01/plagiat_v_nauchnyh_statyah_trudnosti_obnaruzheniya_ perevoda.html
Афонин С.А., Гаспарянц А.Э. Автоматическое построение функции оценки качества в задаче разрешения неоднозначности имен авторов научных публикаций // Программная инженерия. 2015. № 10. С. 31–37.
Наукометрическая система «ИСТИНА». URL: https://istina.msu.ru/


Наиболее читаемые статьи этого автора (авторов)