An Approach to Creating an HTML Version of a Scientific Article from a Manuscript in MS Word Format for a Low-Budget Publisher

Main Article Content

Rimma Yuryevna Skornyakova

Abstract

The most common approach to creating an HTML version of a journal article among scientific publishers is to first create an XML version of the article in accordance with the NISO Journal Article Tag Suite (JATS) standard, followed by automatic conversion to HTML and PDF formats. However, obtaining an XML version from a manuscript in the .docx format of the MS Word word processor, often used by authors, when it contains a large number of complex formulas and tables is a difficult task. The existing software either does not cope with it in full or is expensive and inaccessible to small publishers with a limited budget. This paper proposes an approach to creating an HTML version of a journal article from a manuscript in .docx format containing formulas in MathType format, which does not require significant financial and time costs from the publisher. It also describes a currently implemented prototype of an underlied this approach converter of scientific articles from .docx format to HTML and JATS XML formats, which is applicable for KIAM preprints.

Article Details

References

1. Чебуков Д.Е. Об HTML версии полного текста научной статьи // Труды XX Всероссийской научной конференции «Научный сервис в сети Интернет», г. Новороссийск, 17–22 сентября 2018 г. М.: ИПМ им. М.В. Келдыша, 2018. С. 487–498. URL: https://keldysh.ru/abrau/2018/theses/16.pdf, https://doi.org/10.20948/abrau-2018-16.
2. Горбунов-Посадов М.М. Что дает формат HTML научной публикации // Труды 5-й Международной конференции «Проектирование будущего. Проблемы цифровой реальности», г. Москва, 3–4 февраля 2022 г. М.: ИПМ им. М.В. Келдыша, 2022. С. 216-222. URL: https://keldysh.ru/future/2022/19.pdf, https://doi.org/10.20948/future-2022-19.
3. Скорнякова Р.Ю. Методы и инструменты, используемые при подготовке публикаций научных статей в формате HTML // Электронные библиотеки. 2023. Т. 26, № 2. С. 252–302. URL: https://rdl-journal.ru/article/view/404/489.
4. Скорнякова Р.Ю. Обзор программных средств для создания HTML-версии журнальной статьи из исходного материала в формате Word // Научный сервис в сети Интернет: труды XXV Всероссийской научной конференции (18–21 сентября 2023 г., онлайн). М.: ИПМ им. М.В. Келдыша, 2023. С. 332–344. URL: https://doi.org/10.20948/abrau-2023-38.
5. Standardized Markup for Journal Articles: Journal Article Tag Suite (JATS) // NISO website, 31.10.2024. URL: https://www.niso.org/standards-committees/jats.
6. Kasdorf W.E. Getting from Word to JATS XML // The Association of Learned and Professional Society Publishers blog. 18.10.2018 URL: https://blog.alpsp.org/2018/10/getting-from-word-to-jats-xml.html.
7. Inera JATS Solutions. URL: https://www.inera.com/jats-solutions/.
8. Ictect Intelligent Content for Journals. URL: https://www.ictect.com/JATS-XML.
9. Visel D., Hyde A., Whitmore B. Kotahi: a new JATS production system // Proceedings of Journal Article Tag Suite Conference (JATS-Con), Bethesda (MD), USA, May 3–4, 2022. URL: https://www.ncbi.nlm.nih.gov/books/NBK579686/.
10. XSweet. The open .docx to HTML conversion tool. URL: https://xsweet.org/.
11. Mammoth. .docx to HTML converter. URL: https://mike.zwobble.org/projects/mammoth/.