Настоящий выпуск журнала «Электронные библиотеки» представляет собой тематический сборник статей, подготовленных сотрудниками Института прикладной семиотики Академии наук Республики Татарстан (www.ips.antat.ru). Институт прикладной семиотики выполняет фундаментальные и прикладные исследования в области прикладной семиотики, компьютерной и когнитивной лингвистики, интеллектуальных информационных технологий. Одним из ключевых проектов Института в настоящее время является разработка Национального корпуса татарского языка «Туган тел» (www.corpus.antat.ru). Этот проект выполняется в рамках мероприятий по государственной программе «Сохранение, изучение и развитие государственных языков Республики Татарстан и других языков в Республике Татарстан на 2014 – 2020 годы» и нацелен на разработку аннотированного корпуса татарского языка для гуманитарных и образовательных приложений. Корпусное исследование языка дает богатейший материал для построения лингвистических моделей и ресурсов, применимых в задачах перевода, семиотических и когнитивных исследованиях, образовательных программах.

Обзорные статьи А.М. Галиевой и Р.Р. Гатауллина, представленные в настоящем выпуске, посвящены актуальным проблемам корпусной лингвистики – разрешению грамматической многозначности корпусных данных и подготовке лингвистических ресурсов, которые могут быть использованы при семантическом аннотировании корпусных данных. Для татарского языка в настоящее время отсутствуют большие коллекции данных со снятой многозначностью, что затрудняет применение методов машинного обучения в лингвистических приложениях. Тем не менее, авторы рассматривают машинное обучение как наиболее перспективное направление для снятия многозначности и показывают сравнительные оценки методов применительно к различным языкам. В статье А.М. Галиевой дан обзор основных англоязычных электронных лексикографических ресурсов, разработанных для представления семантики глагола. Данное направление имеет важнейшие применения в задачах обработки естественного языка, поэтому статья является весьма своевременной и актуальной.

Статья А.Ф. Хусаинова, А.Х. Хусаиновой и Р.А. Гильмуллина посвящена еще одному направлению деятельности Института прикладной семиотики, связанному с разработкой интеллектуальных обучающих систем и технологий. Эти исследования ориентированы на разработку семиотических моделей в обучении, их реализацию в прикладных системах и образовательных ресурсах, формирование концепции и методик обучения в условиях инфокоммуникационной образовательной среды. В названной статье описана технология создания электронных версий обучающих материалов в образовательной среде, построенной на основе принципов Smart Education – современного метода обучения, базирующегося на облачных технологиях и обеспечивающего интерактивность учебного процесса.

Публикуемые материалы отражают круг актуальных проблем и задач, которые были представлены для обсуждения на Международной конференции по компьютерной и когнитивной лингвистике TEL-2016, прошедшей в Казани 21–24 апреля 2016 года.

Составитель тематического выпуска О.А. Невзорова

Опубликован: 22.04.2016

От составителя

О. А Невзорова
78-79
Аннотация: -

Глагольная лексика в лексикографических базах данных: обзор основных ресурсов

Альфия Макаримовна Галиева
80-97
Аннотация:

Дан краткий обзор электронных лексикографических ресурсов и баз данных, представляющих семантику глагола. Глагол как одна из самых сложных, семантически ёмких и грамматически содержательных частей речи в любом языке характеризуется разветвлённой системой значений и грамматических форм. Семантическая структура глагола – это комплекс онтологических и реляционных семантических компонентов, которые могут получать свое формальное выражение на разных уровнях языковой структуры. При фиксации глаголов в электронных лексикографических ресурсах разработчики исходят из различных методологических установок и отдают приоритет различным аспектам семантической организации глагольной лексики.

Аналитический обзор методов разрешения морфологической многозначности

Рамиль Раисович Гатауллин
98-114
Аннотация:

Проанализированы основные методы разрешения морфологической многозначности применительно к татарскому языку. Описано текущее состояние работ и приведены основные результаты по данному направлению, сделаны выводы о применимости методов разрешения с оценкой их точности.

Инструментальные средства создания электронных версий обучающих материалов

Айдар Фаилович Хусаинов, Ринат Абрекович Гильмуллин, Альфира Хамзовна Хусаинова
115-125
Аннотация:

Описана технология, которая позволяет создавать электронные версии обучающих материалов. Данные материалы представляют собой часть общей образовательной среды, построенной на основе принципов Smart Education – современного метода обучения, базирующегося на облачных технологиях и обеспечивающего интерактивность учебного процесса. В электронных обучающих материалах полностью представлено содержимое печатного учебника, необходимых дополнительных интерактивных материалов; созданные с помощью набора алгоритмов электронные учебники могут быть интегрированы в учебный процесс как в виде интернет-ресурса, так и в виде мобильных приложений для наиболее популярных ОС.