Review of morphological disambiguation methods

Main Article Content

Рамиль Раисович Гатауллин

Abstract

This paper describes the morphological disambiguation methods and their application for the Tatar language. The state-of-the art technology is discussed. We analyze the contextual and statistical methods and their evaluations for different languages.

Article Details

Author Biography

Рамиль Раисович Гатауллин

Received MS degree in Mathematics from Kazan Federal University (2012). Currently is a graduate student at the Institute of Computational Mathematics and Information Technologies of Kazan Federal University. Current scientific interests: natural language processing, data mining, knowledge extraction technologies

References

1. Хакимов Б.Э., Гильмуллин Р.А., Гатауллин Р.Р. Разрешение грамматической многозначности в корпусе татарского языка // Учен. зап. Казан. ун-та. Сер. Гуманит. науки. 2014. Т. 156, кн. 5. С. 236–244.
2. Турдаков Д.Ю. Методы и программные средства разрешения лексической многозначности терминов на основе сетей документов: автореф. дис. … канд. тех. наук: 05.13.11. Москва, 2010. 20 с.
3. Бобичев В.Л. Автоматическое снятие морфологической многозначности при разметке корпуса // Тр. междунар. конф. «Корпусная лингвистика–2008». СПб.: СПбГУ, 2008. C. 45–49.
4. Tufiş D., Popescu O.A. Knowledge-based approach to morpho-lexical processing of natural language // in Proceedings of the International Conference for Young Computer Scientists, Beijing, 1991. P. 405–408.
5. Harper K.E. Contextual analysis // Mech. Translation. 1956. V. 4, No 3. P. 70–75.
6. Caplan A. An experimental study of ambiguity and context // Mech. Translation. 1955. V. 2, No 2. P. 39–46.
7. Зинькина Ю.В., Пяткин Н.В., Невзорова О.А. Разрешение функциональной омонимии в русском языке на основе контекстных правил // Труды межд. конф. Диалог'2005. М.: Наука, 2005. С. 198–202.
8. Кобзарева Т.Ю., Афанасьев Р.Н. Универсальный модуль предсинтаксического анализа омонимии частей речи в РЯ на основе словаря диагностических ситуаций // Труды междунар. конференции Диалог'2002. М.: 2002. С. 258–268.
9. Курбатов Х.Р. Грамматические омонимы в татарском языке // Татар теле һәм әдәбияты. Казан: Татар. кит. нәшр., 1959. Б. 307–311.
10. Салахова Р.Р. Омонимичные суффиксы татарского языка. Казань: Gumanitarya, 2007. 204 с.
11. Салимгараева Б.С. Омонимы в современном татарском языке. Автореф. канд. дис. Уфа, 1971. 82 с.
12. Татарская грамматика. Казань: Татар. книж. изд-во, 1993. Т. II. Морфология. 397 с.
13. Weischedel Ralph M. Coping with ambiguity and unknown words through probabilistic models // Computational Linguistics. Cambridge, MA, USA: MIT Press, 1993. V. 19, Issue 2. P. 361–382.
14. Ratnaparkhi A. Maximum entropy model for part-of-speech tagging // Proceedings of the Empirical Methods in Natural Language Processing. Philadelphia, PA, USA, 1996. P. 133–142.
15. Лакомкин Е.Д., Пузыревский И.В., Рыжова Д.А. Анализ статистических алгоритмов снятия морфологической омонимии в русском языке. URL: http://aistconf.org/stuff/aist2013/submissions/aist2013_submission_33.pdf.
16. Ткаченко М.В. Модель и алгоритм улучшения распознавания частей речи в текстах, содержащих ошибки. СпбГУ, 2010. 20 с. URL: http://se.math.spbu. ru/SE/YearlyProjects/2010/list.
17. Зеленков Ю.Г., Сегалович И.В., Титов В.А. Вероятностная модель снятия морфологической омонимии на основе нормализующих подстановок и позиций соседних слов // Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара Диалог'2005. М.: Наука, 2005. С. 616.
18. Brill E. A simple rule-based part of speech tagger // Proceedings of the third conference on Applied natural language processing (ANLC’92). Stroudsburg, PA, USA: Association for Computational Linguistics, 1992. P. 152–155.
19. Сокирко А.В., Толдова С.Ю. Сравнение эффективности двух методик снятия лексической и морфологической неоднозначности для русского языка (скрытая модель Маркова и синтаксический анализатор именных групп). URL: http:// www.aot.ru/docs/RusCorporaHMM.htm.
20. Orosz G., Novak A. PurePos 2.0: a hybrid tool for morphological disambiguation // In Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP 2013), Hissar, Bulgaria, 2013. INCOMA Ltd. Shoumen, Bulgaria. P. 539–545.
21. Kristen Linden, Tommi Pirinen. Weighted finite-state morphological analysis of finnish compounding with HFST-LEXC // In Proceedings of the 17th Nordic Conference of Computational Linguistics NODALIDA 2009. Editors: Kristiina Jokinen and Eckhard Bick. NEALT Proceedings Series, 2009. V. 4. P. 89–95.
22. Deniz Yuret, Ferhan Ture. Learning morphological disambiguation rules for turkish // Proceedings of the Human Language Technology Conference of the North American Chapter of the ACL. New York, 2006. P. 328–334.
23. Гатауллин Р. Р., Гильмуллин Р.А. Контекстные правила для разрешения морфологической многозначности в корпусе татарского языка // Открытые семантические технологии проектирования интеллектуальных систем OSTIS-2016 (OpenSemantic Technologies for Intelligent Systems). Материалы V международной научно-технической конференции (Минск, 18–20 февраля 2016 года). Минск: БГУИР, 2016. С. 389–392.
24. Hasim Sak, Tunga Gongur, Murat Saraclar, Morphological disambiguation of turkish text with perceptron algorithm // Computational Linguistics and Intelligent Text Processing, 8th International Conference CICLing, Mexico City, Mexico, February 2007. P. 107–118.
25. Collins M. Discriminative training methods for hidden Markov models: Theory and experiments with perceptron algorithms // Proceedings of EMNLP, 2002. P. 1–8.
26. Сулейманов Д.Ш., Гильмуллин Р.А. Двухуровневое описание морфологии татарского языка // Тезисы докладов Международной научной конференции «Языковая семантика и образ мира». Казань: Изд-во Казан. гос. ун-та, 1997. Книга 2. С. 65–67.


Most read articles by the same author(s)