Semantic analysis of documents in the control system of digital scientific collections

Main Article Content

Шамиль Махмутович Хайдаров

Abstract

Methods of the semantic documents parsing in digital control system of scientific collections, including electronic journals, offered. The methods of processing documents containing mathematical formulas and methods for the conversion of documents from the OpenXML-format in ТеХ-format considered. The search algorithm for the mathematical formulas in the collections of documents stored in OpenXML-format designed. The algorithm is implemented as online-service on platform science.tatarstan.

Article Details

Author Biography

Шамиль Махмутович Хайдаров

Received MS degree in mathematics from Kazan Federal University (2015). Currently is a graduate student at the N.I. Lobachevskii Institute of Mathematics and Mechanics of Kazan Federal University. Current scientific interests: data mining, recommender systems, cloud computing, knowledge extraction technologies.

References

1. Елизаров А.М., Липачев Е.К., Хохлов Ю.Е. Семантические методы струк-турирования математического контента, обеспечивающие расширенную поис-ковую функциональность // Информационное общество. 2013. № 1–2. С. 83-92.
2. Елизаров А.М., Липачев Е.К., Малахальцев М.А. Веб-технологии в работе электронного математического журнала Lobachevskii Journal of Mathematics // В сборнике: Научный сервис в сети Интернет: многоядерный компьютерный мир. 15 лет РФФИ. Труды Всероссийской научной конференции. Московский государственный университет им. М.В. Ломоносова; Южный федеральный университет; Институт вычислительной математики РАН, г. Москва. 2007. С. 355-356.
3. Елизаров А.М., Зуев Д.С., Липачёв Е.К. Информационные системы управления электронными научными журналами // Научно-техническая информация. Серия 1. Организация и методика информационной работы. 2014. № 3. С. 31-38.
4. Хайдаров Ш.М. Методы управления математическим контентом в ин-формационных издательских системах // Тр. Математического центра им. Н.И. Лобачев-ского. Материалы 14-й Всерос. Молодежной школы-конференции «Лобачевские чтения–2015» (Казань, 22–27 октября 2015 года). Казань. 2015. С. 162-165.
5. Воутер В.В. Open XML – Кратко и доступно. Open XML Technical Evange-list, Microsoft, 2007. 101 с.
6. Standard ECMA-376: Office Open XML File Formats [Электронный ресурс] URL: http://www.ecmainternational.org/publications/standards/Ecma-376.htm.
7. Липачёв Е.К., Хайдаров Ш.М. Система сервисов преобразования элек-тронных математических документов на основе облачных технологий // Труды Математического центра им. Н.И. Лобачевского. Казань. 2013. Т. 47. С. 109-110.
8. Елизаров А.М., Липачёв Е.К., Невзорова О.А., Соловьев В.Д. Методы и средства семантического структурирования электронных математических доку-ментов // Доклады Академии наук. 2014. Т. 457. № 6. С. 642-645.
9. Ахметов Д.Ю., Герасимов А.Н., Грачев А.О., Елизаров А.М., Липачёв Е.К. Облачная платформа поддержки электронных научных изданий // Учёные записки Института социальных и гуманитарных знаний. 2014. № 1 (12), ч.1. С. 13-19.
10. Elizarov A.M., Kirillovich A.V., Lipachev E.K., Nevzorova O.A., Solovyev V.D., Zhiltsov N.G. Mathematical knowledge representation: semantic models and formal-isms // Lobachevskii Journal of Mathematics. 2014. V. 35. No 4. P. 348-354.
11. Биряльцев Е.В., Елизаров А.М., Жильцов H.Г., Липачёв Е.К., Невзоро-ва О.А., Соловьев В.Д. Методы анализа семантических данных математических электронных коллекций // Научно-техническая информация. Серия 2: Информа-ционные процессы и системы. 2014. № 4. С. 12-17.
12. Биряльцев Е.В., Галимов М.Р., Жильцов Н.Г., Невзорова О.А. Подход к семантическому поиску математических выражений // OSTIS-2012. 2012. С. 245-256.
13. Nevzorova O., Zhiltsov N., Kirillovich A., Lipachev E. OntoMathPRO Ontology: A Linked Data Hub for Mathematics // Knowledge Engineering and the Se-mantic Web Communications in Computer and Information Science. 2014. V. 468. P. 105-119.
14. Веселаго В.Г., Елизаров А.М., Липачев Е.К., Малахальцев М.А. Формирование и поддержка физико-математических электронных научных изданий: переход на технологии Семантического Веба // Научно-исследовательский институт математики и механики им. Н.Г. Чеботарева Казанского государственного университета. 2003–2007 гг. Коллективная монография под ред. А.М. Елизарова. Казань: Изд-во Казан. ун-та, 2008. С. 456-476.
15. Елизаров А.М., Липачёв Е.К., Малахальцев М.А. Веб-технологии для ма-тематика. Основы MathML. М.: Физматлит, 2010. 194 с.
16. Елизаров А.М., Липачев Е.К., Малахальцев М.А. Технологии Semantic Web в практике работы электронного журнала по математике // Труды 8 Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2006, Суздаль. Ярославль: Ярославский госуниверситет, 2006. С. 215-218.
17. Ausbrooks R., Buswell S., Carlisle D., Chavchanidze G. etc. Mathematical Markup Language (MathML) Version 3.0 2nd Edition. W3C Recommendation 10 April 2014 // World Wide Web Consortium (W3C). 2014. URL: http://www.w3.org/TR/ MathML/mathml.pdf.
18. Kohlhase M., Şucan I.A. A search engine for mathematical formulae // Inter-national Conference on Artificial Intelligence and Symbolic Computation. 2006.
19. Muhammad Adeel, Hui Siu Cheung, Sikandar. Math GO! prototype of a con-tent based mathematical formula search engine // Journal of Theoretical and Applied Information Technology. 2008.
20. Wiki Pages – web-xslt. Example XSLT code for transforming XML languages for the web. URL: https://code.google.com/ p/web-xslt/.
21. Kohlhase M. MathML presenting and capturing mathematics for the Web. URL: http://www.w3.org/Math/Documents/ mathml-tutorial.pdf.
22. SnuggleTeX – Overview & Features [Электронный ресурс] // School of Physics and Astronomy. URL: http://www2.ph.ed.ac.uk/snuggletex/documentation/ overview-and-features.html.
23. Working with MathML & Wolfram Language Documentation. URL: http://reference. wolfram.com/language/XML/tutorial/MathML.html.
24. MathJax. Beautiful math in all browsers. URL: http://www.mathjax.org/.
25. Getting Started – MathJax 2.5 documentation. URL: http://docs.mathjax.org/ en/latest/start.html.
26. jQuery – write less, do more [Электронный ресурс] URL: https://jquery.com.