Algorithm for linking translated articles using authorship statistics

Main Article Content

Александр Сергеевич Козицын
Сергей Александрович Афонин
Андрей Александрович Зензинов

Abstract

During the last decades scientometric techniques have been used for research activity stimulation. Number of published articles and number of their citation counts are among the most important scientometric parameters. In an automated environment, when the publications metadata is gathered from various sources, correct linking of original papers with their translations into different languages is extremely important. In the paper we show that the known text similarity measures are inefficient in the context of article linkage problem. We propose a method for semi-automatic article linkage using statistical data on authors publication activities only. This approach may be used for linking articles without training for the language of translation. The method was evaluated on real-world collection of publications metadata of ISTINA information system.

Article Details

Author Biographies

Александр Сергеевич Козицын

Leading Researcher, Ph.D., graduated from M.V. Lomonosov Moscow State University. Specialist in the field of information retrieval and database.

Сергей Александрович Афонин

Leading Researcher, Ph.D., graduated from M.V. Lomonosov Moscow State University. Specialist in the field of regular languages and information systems.

Андрей Александрович Зензинов

Junior Researcher, graduated from M.V. Lomonosov Moscow State University. Specialist in the field of modeling of distributed information systems.

References

Налимов В.В., Мульченко З.М. Наукометрия. Изучение науки как информационного процесса. Москва: Наука, 1969. 340 с.
URL: http://www.library.spbu.ru
URL: http://library.bmstu.ru/Publications/
Алехина Е.И. Информационная система учета научно-исследовательской деятельности сотрудников вуза // Инновационная наука. 2018. №5-1. С. 9–12.
Столяров Р.А., Чугреев В.Л. Автоматизированная система учета результатов интеллектуальной деятельности в научной организации. URL: http://vtr.vscc.ac.ru/article/1512
Садовничий В.А., Васенин В.А. Интеллектуальная система тематического исследования наукометрических данных: предпосылки создания и методология разработки. Часть 1 // Программная инженерия. 2018. Т. 9. №2. С. 51–58.
Васенин В.А., Занчурин М.А., Козицын А.С. и др. Архитектурно-технологические аспекты разработки и сопровождения больших информационно-аналитических систем в сфере науки и образования // Программная инженерия. 2017. Т. 8. № 10. С. 448–455.
Васенин В.А., Иткес A.А. Внедрение реляционной модели логического разграничения доступа в web-приложения информационных систем, разработанных на основе библиотеки django // Программная инженерия. 2018. Т. 9. № 5. С. 195–208.
Васенин В.А., Иткес А.А., Бухонов В.Ю., Галатенко А.В. Модели логического разграничения доступа в многопользовательских системах управления наукометрическим контентом // Программная инженерия. 2016. Т. 7. № 12. С. 547–558.
Коряков Д.Е. Наукометрия. Зачем нужны разные индексы. URL: https://www.mcb.nsc.ru/sites/mcb.nsc.ru/files/fck/file/naukometriya_2.pdf
Автоматический переводчик «Гугл». URL: https://translate.google.ru/
Автоматический переводчик «Промпт». URL: http://www.translate.ru
Научная конференция «Обнаружение заимствований – 2017». URL: http://www.oz2017.ru
Плагиат в научных статьях: трудности обнаружения перевода. URL: http://ai-news.ru/2018/01/plagiat_v_nauchnyh_statyah_trudnosti_obnaruzheniya_ perevoda.html
Афонин С.А., Гаспарянц А.Э. Автоматическое построение функции оценки качества в задаче разрешения неоднозначности имен авторов научных публикаций // Программная инженерия. 2015. № 10. С. 31–37.
Наукометрическая система «ИСТИНА». URL: https://istina.msu.ru/


Most read articles by the same author(s)