Настоящий выпуск журнала «Электронные библиотеки» представляет собой тематический сборник статей, подготовленных сотрудниками Института прикладной семиотики Академии наук Республики Татарстан (www.ips.antat.ru). Институт прикладной семиотики выполняет фундаментальные и прикладные исследования в области прикладной семиотики, компьютерной и когнитивной лингвистики, интеллектуальных информационных технологий. Одним из ключевых проектов Института в настоящее время является разработка Национального корпуса татарского языка «Туган тел» (www.corpus.antat.ru). Этот проект выполняется в рамках мероприятий по государственной программе «Сохранение, изучение и развитие государственных языков Республики Татарстан и других языков в Республике Татарстан на 2014 – 2020 годы» и нацелен на разработку аннотированного корпуса татарского языка для гуманитарных и образовательных приложений. Корпусное исследование языка дает богатейший материал для построения лингвистических моделей и ресурсов, применимых в задачах перевода, семиотических и когнитивных исследованиях, образовательных программах.

Обзорные статьи А.М. Галиевой и Р.Р. Гатауллина, представленные в настоящем выпуске, посвящены актуальным проблемам корпусной лингвистики – разрешению грамматической многозначности корпусных данных и подготовке лингвистических ресурсов, которые могут быть использованы при семантическом аннотировании корпусных данных. Для татарского языка в настоящее время отсутствуют большие коллекции данных со снятой многозначностью, что затрудняет применение методов машинного обучения в лингвистических приложениях. Тем не менее, авторы рассматривают машинное обучение как наиболее перспективное направление для снятия многозначности и показывают сравнительные оценки методов применительно к различным языкам. В статье А.М. Галиевой дан обзор основных англоязычных электронных лексикографических ресурсов, разработанных для представления семантики глагола. Данное направление имеет важнейшие применения в задачах обработки естественного языка, поэтому статья является весьма своевременной и актуальной.

Статья А.Ф. Хусаинова, А.Х. Хусаиновой и Р.А. Гильмуллина посвящена еще одному направлению деятельности Института прикладной семиотики, связанному с разработкой интеллектуальных обучающих систем и технологий. Эти исследования ориентированы на разработку семиотических моделей в обучении, их реализацию в прикладных системах и образовательных ресурсах, формирование концепции и методик обучения в условиях инфокоммуникационной образовательной среды. В названной статье описана технология создания электронных версий обучающих материалов в образовательной среде, построенной на основе принципов Smart Education – современного метода обучения, базирующегося на облачных технологиях и обеспечивающего интерактивность учебного процесса.

Публикуемые материалы отражают круг актуальных проблем и задач, которые были представлены для обсуждения на Международной конференции по компьютерной и когнитивной лингвистике TEL-2016, прошедшей в Казани 21–24 апреля 2016 года.

Составитель тематического выпуска О.А. Невзорова

Published: 22.04.2016

От составителя

О. А Невзорова
78-79
Abstract: -

Verbal vocabulary in lexicographical data bases: reviewing main resources

Альфия Макаримовна Галиева
80-97
Abstract: This paper gives a brief review of available lexicographical resources and databases representing verbal vocabulary. The verb, being one of the most complicated, semantically intricate and grammatically sophisticated parts of speech, is characterized by multiplicity of senses and forms. Semantic structure of any verb is a complex of ontological and relational meaning components that may find a formal expression on different levels of the linguistic structure. Fixing verbs in electronic lexicographical resources, researchers come from different methodological orientations, and prioritize different aspects of the organization of the semantics of verbal vocabulary.

Review of morphological disambiguation methods

Рамиль Раисович Гатауллин
98-114
Abstract: This paper describes the morphological disambiguation methods and their application for the Tatar language. The state-of-the art technology is discussed. We analyze the contextual and statistical methods and their evaluations for different languages.

Tool for creating electronic educational materials

Айдар Фаилович Хусаинов, Ринат Абрекович Гильмуллин, Альфира Хамзовна Хусаинова
115-125
Abstract: A technology for creation of electronic educational materials is described. It allows to use the result electronic textbook as a part of smart-education environment. Developed algorithms make it possible to work with all kind of devices from PC to tablets without any limitations in functionality.