• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Пространственная ориентация объектов на основе обработки текстов на естественном языке для генерации раскадровок

Влада Владимировна Кугуракова, Гульнара Фаритовна Сахибгареева , Ань Зунг Нгуен, Андрей Максимович Астафьев
1213-1238
Аннотация:

Статья посвящена подходам в обработке текста на естественном языке для выяснения конкретного пространственного взаиморасположения объектов и трехмерной покадровой визуализации. Предложенные алгоритмы учитывают влияние явных ограничений извлеченных пространственных отношений и позволяют создавать вероятные трехмерные схемы расположения объектов на сцене. Такие пространственные схемы необходимы для уточнения воплощения замысла сценариста при проектировании видеоигр. Для создания удачных кадров использованы такие правила режиссуры, как учет плана, поворот камеры и другие композиционные нюансы.

Ключевые слова: преобразование текста в изображение, преобразование текста в сцену, преобразование текста в анимацию, понимание естественного языка, сценарий, видеоигра, сценарный прототип, положение камеры, режиссура.

Методы и алгоритмы повышения выразительности связанных данных (обзор)

Ольга Авенировна Невзорова
808-834
Аннотация: В обзорной статье рассмотрены методы и алгоритмы повышения выразительности связанных данных, подготовленных для публикации в Вебе. Представлены основные подходы к обогащению онтологий, описаны методы, на которых они базируются, а также приведен инструментарий, реализующий эти подходы и инструменты применения соответствующих методов.Основным этапом в общей схеме жизненного цикла данных в облаке открытых связанных данных является этап построения набора связанных RDF-триплетов. Для улучшения классификации данных и анализа их качества применяются различные методы повышения выразительности связанных данных. Основные идеи рассматриваемых методов связаны с обогащением существующих онтологий (расширением базовой схемы знаний) путем добавления или совершенствования терминологических аксиом. Методы обогащения опираются на методы, применяемые в различных областях, таких как представление знаний, машинное обучение, статистика, обработка текстов на естественном языке, анализ формальных понятий и теория игр.
Ключевые слова: связанные данные, онтология, обогащение онтологии, семантический веб.

Подход к созданию корпуса текстов видеоигр на основе универсальной структуры

Никита Рамильевич Нурлыгаянов, Влада Владимировна Кугуракова
578-597
Аннотация:

Рассмотрена проблема высокой и увеличивающейся стоимости разработки видеоигр, для её решения предложено применить процедурную генерацию контента, что позволит снизить затраты на разработку.


Работа является частью масштабного исследования по автоматическому созданию прототипов видеоигр и посвящена обработке игровых сценариев, то есть текстов на естественном языке. Предложено выделять из сценариев необходимые сущности и передавать их дальнейшим шагам алгоритма, который по текстовым описаниям будет генерировать игровые ресурсы.


Существует несколько публикацией, посвящённых обработке игровых текстов, в которых предложено несколько различных структур хранения выделенной информации. В настоящей статье предложен универсальный формат, который подойдёт для обработки текста любой видеоигры и позволит создать корпус текстов для использования в дальнейших исследованиях и автоматической генерации игровых прототипов.

Ключевые слова: PCG, NLP, разработка видеоигр.

Информационный анализ делового текста. Стратегии анализа и компоненты анализатора

В.Ш. Рубашкин
Аннотация: Статья посвящена обсуждению общей архитектуры систем информационного анализа делового текста. Обсуждаются три комплекса проблем, решения по которым радикально меняют архитектуру анализатора: определение целевой технологии и с учетом этого выбор целевого языка представления знаний; выбор способа межуровневого взаимодействия компонентов анализатора; определение соотношения структурных (rule-based) и прецедентно-статистических (example-based, case-based, corpus-based) моделей в используемых алгоритмах и процедурах анализа.
Ключевые слова: информационный анализ делового текста, компоненты анализатора, архитектура анализатора, целевая технология, целевой язык, фактографическая информация.

Разработка компьютерной системы тестирования когнитивных способностей респондентов на основе предложений с эллипсисами

Ксения Александровна Найденова, Елена Сергеевна Булыкина, Владимир Андреевич Пархоменко, Александр Валентинович Щукин, Татьяна Александровна Мартирова
340-364
Аннотация:

Когнитивные способности охватывают все высшие интеллектуальные функции человека, в том числе устную и письменную речь. Использование эллипсисов связано с умением четко формулировать мысль, избегая избыточности её выражения. Тестирование умения использовать эллипсисы может быть основой, с одной стороны, для оценки самой когнитивной операции порождения эллипсисов в письменной речи и обнаружения нарушений этой операции. Это может послужить в медицине для раннего обнаружения деменции. С другой стороны, такое тестирование применимо для обучения речевым технологиям, в том числе на иностранных языках. С научной точки зрения, важно определить степень влияния обучения на выполнение заданий теста.


В статье описаны разработка компьютерной системы дистанционного online тестирования выполняемой человеком операции преобразования полного предложения в предложение с эллипсисом определенного типа, принципы оценки результатов тестирования испытуемых. Особенностью системы является создание нового типа заданий, связанных с обработкой естественного языка. Сложность разработки определяется необходимостью автоматизированного формирования банка пар предложений на естественном языке без эллипсисов и с эллипсисами, что влечет включение в систему средств синтаксического анализа текстов и алгоритмов автоматизированного формирования эллипсисов в предложениях и/или восстановления полного предложения из эллиптического. В заключении обсуждены перспективы развития и применения предлагаемой системы.

Ключевые слова: эллипсис, обработка естественного языка, on-line тестирование, когнитивные способности.

Рекомендательная система текстовой аналитики юридических документов

Денис Сергеевич Зуев, Марат Фаритович Насрутдинов, Айрат Фаридович Хасьянов
435-449
Аннотация:

Обсуждено использование механизмов машинного обучения, анализа естественного языка и интеллектуального поиска в области юриспруденции. Основные ожидаемые результаты – методология применения алгоритмов текстовой аналитики и семантического анализа естественного языка (NLP) в задачах управления знаниями в судебном делопроизводстве, а также других видах юридической практики. Полученные результаты могут быть применены в области образования и управления знаниями в более широком контексте, поскольку исследование лежит на стыке юриспруденции, математической и компьютерной лингвистики.

Описан прототип многоагентной системы интеллектуального анализа текстов в юриспруденции, способной на имеющейся базе данных судебных документов выявлять общие зависимости, предоставлять для ознакомления юридические дела, близкие по тематике, рекомендовать наиболее вероятные исходы судебного рассмотрения или помечать важные места, на которые следует обращать внимание при процессуальных действиях с использованием инструментов текстовой аналитики.
Ключевые слова: аналитика и управление данными, интенсивное использование данных, электронные библиотеки, кластеризация, классификация судебных актов, рекомендательная система, микросервисная архитектура.

Анализ моделей векторных представлений слов в задаче разметки семантических ролей в русскоязычных текстах

Лейсан Маратовна Кадермятова, Елена Викторовна Тутубалина
1026-1043
Аннотация: Изучено влияние использования векторных представлений слов на качество установления семантических ролей в русскоязычных текстах. Задача установления семантических ролей в русскоязычных текстах получила широкое распространение после выхода на свет корпуса FrameBank. Были исследованы модели векторных представлений слов word2vec, fastText и ELMo (Embeddings from Language Models). Анализировались метрики качества микро- и макро-F1 как оценочные показатели результатов автоматической разметки актантов. Был проведен ряд экспериментов, демонстрирующих, что модели ELMo, основанные на токенах предикатно-аргументных конструкций, показывают больший прирост качества по сравнению со всеми остальными моделями, в том числе, в сопоставлении с моделями ELMo, обученными на леммах, как по величине микро-F1, так и по величине макро-F1.
Ключевые слова: машинное обучение, обработка естественного языка, векторные представления слов, семантические роли.

Аналитический обзор методов разрешения морфологической многозначности

Рамиль Раисович Гатауллин
98-114
Аннотация:

Проанализированы основные методы разрешения морфологической многозначности применительно к татарскому языку. Описано текущее состояние работ и приведены основные результаты по данному направлению, сделаны выводы о применимости методов разрешения с оценкой их точности.

Ключевые слова: разрешение морфологической многозначности, контекстные методы, статистико-вероятностные методы, татарский язык.

Методы искусственного интеллекта для научных исследований в геологии

Михаил Иванович Патук, Вера Викторовна Наумова
673-696
Аннотация:

Приведен краткий обзор некоторых методов искусственного интеллекта в области наук о Земле. Отмечены перспективы применения указанных методов для получения новых знаний. Приведены результаты первых попыток авторов в применении методов обработки естественного языка для обработки научных статей по геологии. Обсуждены возможности развития работ в этом направлении.

Ключевые слова: Искусственный интеллект, машинное обучение, обработка естественного языка, геология.

Построение онтологии предметной области на основе логической модели данных

Александр Михайлович Гусенков, Наиль Раисович Бухараев, Евгений Васильевич Биряльцев
390-417
Аннотация: Представлена технология автоматизированного построения онтологии предметной области на основе информации, извлекаемой из комментариев реляционных баз данных ПАО «Татнефть». Технология основана на построении конвертора (компилятора), транслирующего логическую модель данных Epicentre Petrotechnical Open Software Corporation (POSC), представленную в виде ER-диаграмм и набора описаний на объектно-ориентированном языке EXPRESS, в язык описания онтологий OWL, рекомендованный консорциумом W3C. Описаны основные синтаксические и семантические аспекты преобразования.
Ключевые слова: онтология предметной области, реляционные базы данных, POSC, OWL.

Семантическое сходство в задаче аспектно-эмоционального анализа

Евгений Вячеславович Котельников, Павел Дмитриевич Блинов
120-137
Аннотация:

Исследуется проблема аспектно-эмоционального анализа текста. По сравнению с общим анализом тональности такой вариант является более сложным по причине наличия ряда сопутствующих подзадач, таких, как выделение аспектных терминов, определение тональности по отношению к этим терминам и аспектным категориям. Однако решение данной проблемы значительно расширяет возможности систем автоматического анализа неструктурированного текста.

Приведен обзор предыдущих работ в области аспектно-эмоционального анализа, описаны обучающие и тестовые данные семинара SentiRuEval. Для задачи извлечения аспектных терминов использовано векторное пространство распределенных представлений слов. Тональность аспектных терминов определяется на основе функций совместной информации и семантического сходства. Приведены сравнительные результаты на тестовых данных и заключительные выводы.

Ключевые слова: аспектно-эмоциональный анализ текста, взаимная информация, распределённые представления слов, машинное обучение, SentiRuEval.

Применение моделей мышления в интеллектуальных вопросно-ответных системах

Александр Сергеевич Тощев
222-230
Аннотация: Описана эволюция моделей мышления в рамках решения задачи построения интеллектуальной вопросно-ответной системы для автоматизации обработки запросов пользователей на естественном языке, начиная от простой модели на основе деревьев решений и заканчивая полноценной моделью мышления, основанной на модели мышления человека Марвина Мински. Каждая модель разработана и протестирована. Приведены результаты экспериментов и сделаны выводы о состоятельности каждой из моделей.
Ключевые слова: искусственный интеллект, машинное обучение, системный анализ, машинное мышление, обработка естественного языка, деревья решений.

Интеллектуальный поиск сложных объектов в массивах больших данных

Александр Михайлович Гусенков
40-76
Аннотация: Предложен подход к интеллектуальному поиску сложных объектов в различных типах структурно размеченных текстов, который может быть применен для обработки Больших данных (Big Data). Исследуются два вида представления информационных объектов: реляционные базы данных (РБД), которые структурно размечены своими схемами, и полнотекстовые естественнонаучные документы, содержащие математические выражения (формулы). Для таких полнотекстовых документов предлагается дополнительная автоматизированная разметка для организации поиска формул. В обоих случаях источником информации для построения онтологии и, в дальнейшем, организации поиска являются тексты на естественном языке, которые относятся к слабоструктурированным данным. Для РБД это комментарии к наименованиям таблиц и их атрибутов, а для естественнонаучных документов (статей, монографий и т. д.) – текстовое содержимое размеченных документов.
Ключевые слова: большие данные, семантический поиск, слабоструктурированные данные, онтологии, реляционные базы данных, естественнонаучные тексты, разметка математических выражений.
1 - 13 из 13 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества