• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Тестирование методов анализа тональности текста, основанных на словарях

Елена Викторовна Тутубалина, Владимир Владимирович Иванов, Мария Загулова, Никита Мингазов, Ильсеяр Алимова, Валентин Малых
138-162
Аннотация:

Технологии анализа тональности текста развиваются интенсивно, что обусловлено ростом объемов открытых источников, представляющих мнения пользователей интернета по различным вопросам. В статье описаны методы для анализа тональности текстов отзывов и коротких сообщений (твитов), приводятся результаты оценки их качества, которая производилась в рамках российского семинара SentiRuEval-2015.

Ключевые слова: извлечение информации, анализ тональности, классификация текстов, машинное обучение с учителем.

Проблемы создания 3D-изображений объектов историко-культурного наследия

М.Э. Иванов

Нормализация текста, распознанного при помощи технологии оптического распознавания символов, с использованием легковесных LLM

Владислав Константинович Вершинин, Иван Владимирович Ходненко, Сергей Владимирович Иванов
1036-1056
Аннотация:

Несмотря на значительный прогресс, технологии оптического распознавания символов (OCR) для исторических газет по-прежнему допускают 5–10% ошибок на уровне символов. В работе представлена полностью автоматизированная система нормализации пост-OCR, объединяющая легкие языковые модели (LLM) объемом 7–8 млрд параметров, обученные по инструкциям и квантизованные до 4 бит (INT4), с небольшим набором регулярных выражений. На наборе данных BLN600 (600 страниц британских газет XIX в.) лучшая модель YandexGPT-5-Instruct Q4 снижает Character Error Rate (CER) с 8.4% до 4.0% (–52.5%) и Word Error Rate (WER) с 20.2% до 6.5% (–67.8%), повышая при этом семантическое сходство до 0.962. Система работает на потребительском оборудовании (RTX-4060 Ti, 8 ГБ VRAM) со скоростью около 35 секунд на страницу и не требует дополнительного обучения или параллельных данных. Полученные результаты показывают, что компактные INT4-LLM являются практичной альтернативой крупным моделям для постобработки OCR исторических документов.

Ключевые слова: оптическое распознавание символов, пост-OCR-коррекция, исторические газеты, большие языковые модели, квантизация, INT4, конвейер нормализации, ошибка на уровне символов, семантическое сходство, регулярные выражения, YandexGPT-5, легкие модели, обработка естественного языка, цифровые гуманитарные науки, оцифровка документов.

Выявление психологического портрета на основе определения тональности сообщений для антропоморфного социального агента

Антон Анатольевич Алексеев, Влада Владимировна Кугуракова, Денис Сергеевич Иванов
149-165
Аннотация: Исследованы аспект выявления психологического портрета респондента и генерация отношения к нему социальным агентом на основе анализа тональности диалога. Рассмотрены принципы генерации отношения социального агента к респонденту и изменение его эмоционального настроя на протяжении общения. Реализация поставленной задачи осуществлена с помощью языка программирования Python и работы с реальными данными. Проведенный анализ алгоритмов классификации, основанных на подходах машинного обучения, подтвердил практическую значимость работы.
Ключевые слова: социальный агент, тональность, эмоциональное отношение, машинное обучение.

Антропоморфный социальный агент с симуляцией эмоций и его реализация

Влада Владимировна Кугуракова, Максим Олегович Таланов, Надир Ринатович Манахов, Денис Сергеевич Иванов
254-268
Аннотация: Рассмотрены эмоциональные человеко-машинные интерфейсы, а именно, антропоморфные социальные агенты. Описана кросс-дисциплинарная задача создания антропоморфного агента, который «чувствует» и «реагирует» на эмоциональные стимулы. Предложена нейробиологически инспирированная реализация, основанная на механике химических и физических процессов, происходящих в человеческом мозге. Проектирование и разработка эмоциональной модели осуществлены симуляцией нейромодуляторов: дофамина, серотонина, нор-адреналина. Отображение эмоций достигается за счёт комбинации данных нейромодуляторов в различных пропорциях. Для этого используется гипотеза Хьюго Лёфхейма («куб эмоций»), которая в свою очередь базируется на теории аффек-тов Сильвиана Томпкинса. Описаны преодоление феномена “uncanny valley” и подходы к пониманию взаимосвязей мимики и мотивации индивидуума. Построена реалистичная вычислительная модель, которая позволяет адекватно визуализировать мимику виртуального агента синхронизировано с производимой им речью. На основе трехмерной модели человеческой головы создан антропоморфный эмоциональный агент, способный на мимические реакции в связи с эмоцио-нальным контекстом.
Ключевые слова: антропоморфный социальный агент, искусственный интеллект.
1 - 5 из 5 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества