• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Анализ моделей векторных представлений слов в задаче разметки семантических ролей в русскоязычных текстах

Лейсан Маратовна Кадермятова, Елена Викторовна Тутубалина
1026-1043
Аннотация: Изучено влияние использования векторных представлений слов на качество установления семантических ролей в русскоязычных текстах. Задача установления семантических ролей в русскоязычных текстах получила широкое распространение после выхода на свет корпуса FrameBank. Были исследованы модели векторных представлений слов word2vec, fastText и ELMo (Embeddings from Language Models). Анализировались метрики качества микро- и макро-F1 как оценочные показатели результатов автоматической разметки актантов. Был проведен ряд экспериментов, демонстрирующих, что модели ELMo, основанные на токенах предикатно-аргументных конструкций, показывают больший прирост качества по сравнению со всеми остальными моделями, в том числе, в сопоставлении с моделями ELMo, обученными на леммах, как по величине микро-F1, так и по величине макро-F1.
Ключевые слова: машинное обучение, обработка естественного языка, векторные представления слов, семантические роли.

Тактическая сортировка управленческих задач при их администрировании посредством меток Приоритетов, Спецификаций и Аффилиаций

Феликс Освальдович Каспаринский
733-745
Аннотация: Проанализирована специфика функционала программ управления стратегическими, тактическими и оперативными задачами. Предложена методика предварения названий оперативных задач тактическими метками Приоритетов, Спецификаций и Аффилиаций. Аббревиатуры меток формируются таким образом, чтобы обеспечить правильную расстановку приоритетов при сортировке задач по алфавитному порядку. Квадранты матрицы Приоритетов Д. Эйзенхауэра обозначаются двухбуквенными метками: важно срочно (IF – Important, Fast); важно бессрочно (IS – Important, Slow); не важно, но оперативно (UF – Unimportant, Fast): не важно и не срочно (US – Unimportant, Slow). Метки матрицы Спецификаций информационной среды (RA, RI, SA, SI) компонуются из взаимоисключающих свойств доступности Сети (I – Internet и A – Autonomous) и наличия редуцированного или специального функционала (R– Reduced и S – Special). Метки Транспортной спецификации (TA, TB, TC, TP) позволяют сортировать задачи, требующие перемещения (T – Translocation) на самолёте (A – Airplane), автобусе (B – Bus), автомобиле (C – Car) и пешком (P – Pedestrian), соответственно. Трёхбуквенные метки Аффилиации (принадлежности физическому или юридическому лицу) формируются из первых букв имени, отчества и фамилии или наименования лаборатории, компании, проекта. Тактические метки ускоряют принятие решений при формировании ежедневного списка оперативных задач.
Ключевые слова: задача, планирование, управление, приоритет, спецификация, аффилиация, метка, оперативный, тактический.

Автоматическое извлечение аргументативных отношений из текстов научной коммуникации

Юрий Алексеевич Загорулько, Елена Анатольевна Сидорова, Ирина Равильевна Ахмадеева
1070-1084
Аннотация:

Сложность задачи извлечения аргументативных структур связана с такими проблемами, как выделение аргументативных сегментов, прогнозирование дальних связей между неконтактными сегментами, обучение на данных, размеченных с низкой степенью согласованности между аннотаторами. В настоящей работе рассмотрен подход к извлечению аргументативных отношений из достаточно больших текстов, относящихся к области научной коммуникации. Проведен сравнительный анализ методов тонкой настройки с использованием предобученной языковой модели типа Longformer, позволяющей учитывать длинные контексты, и двух методов, позволяющих учитывать расхождения аннотаторов в разметке аргументов за счет использования так называемых мягких меток, полученных путем равномерного сглаживания меток и усреднения экспертных оценок. Эксперименты проводились на четырех наборах данных, содержащих положительные и отрицательные примеры пар утверждений (посылка, заключение) и различающихся способами сегментации и средним размером текста. Наилучшие результаты получены на модели с усреднением экспертных оценок. В то же время отмечено, что модель, использующая сглаженные метки, также повышает точность классификаторов, но ухудшает полноту.

Ключевые слова: анализ аргументации, извлечение аргументативных отношений, научная коммуникация, проблемы сегментации, мягкая метка, сглаживание меток, языковая модель.

Условная генерация электрокардиограмм с помощью иерархических вариационных автокодировщиков

Иван Анатольевич Свиридов, Константин Сергеевич Егоров
1186-1206
Аннотация:

Сердечно-сосудистые заболевания являются одной из основных причин смертности. Автоматический анализ электрокардиограмм (ЭКГ) может существенно облегчить работу врачей, но его эффективность ограничена нехваткой и несбалансированностью данных. Создание синтетических ЭКГ помогает частично решить эти проблемы. Хотя чаще всего для этого применяются генеративно-состязательные сети (GAN), но последние исследования показали, что вариационные автокодировщики (VAE) могут обеспечивать сопоставимое качество.


В работе представлена модель cNVAE-ECG — модификация Nouveau VAE (NVAE), способная генерировать 12 отведений 10-секундных ЭКГ с различными патологиями. Используя компактную схему работы с каналами и встроенные представления классов для условной генерации, cNVAE-ECG улучшает результаты в задачах бинарной и multi-label классификации, обеспечивая прирост метрики AUROC до 2% по сравнению с моделями на основе GAN. Модель представлена в открытом доступе: https://github.com/univanxx/cNVAE_ECG.

Ключевые слова: ЭКГ, вариационный автокодировщик, условная генерация, GAN.

Автоматические и полуавтоматические методы построения графа знаний предметной области и расширения онтологии

Андрей Петрович Халов, Ольга Муратовна Атаева
1481-1519
Аннотация:

Рассмотрен цикл построения графа знаний и расширения онтологии для специальной предметной области, описывающей процесс управления потоками данных в службах информационной поддержки. Предложена методика формирования корпуса данных для наполнения онтологии с автоматической псевдоразметкой, включающей специальные категории для фиксации ранее не представленных классов и отношений. Обучена специализированная модель извлечения именованных сущностей на корпусе данных объемом 3 млн токенов с 92 метками. Результаты были использованы для интеграции извлеченных фактов, что увеличило граф знаний до 0.98 млн триплетов, при этом коэффициент расширения графа (отношение общего числа фактов к явным триплетам) увеличился с 2.65 до 3.52 при сохранении логической согласованности. Наборы токенов с одинаковыми метками были преобразованы в устойчивые семантические множества, что позволило полуавтоматически расширить онтологию. В онтологию добавлены 12 новых классов, которые были извлечены из неструктурированных текстовых данных. Показан прикладной пример запросов и дальнейшей аналитики.

Ключевые слова: онтология, DOLCE, граф знаний, NER, BIO-разметка, RDF/OWL, SPARQL.

Научные публикации в России. Что нового

Михаил Михайлович Горбунов-Посадов
382-389
Аннотация: Представлены события, происходившие в последнее время в мире российских научных публикаций. Наблюдается медленное сползание в сторону платного доступа части академических журналов, размещенных в открытом доступе в 2018 году. В Европейском союзе объявлен план массового перехода научных журналов к открытому доступу. Внедряются новые модели существования научной публикации. Отчетность по публикациям, затребованная Минобрнауки в 2019 году, не учитывает масштабы читательской аудитории статьи. Ни Минобрнауки, ни ВАК никак не поощряют размещение публикации в открытом доступе. В РИНЦ началась борьба с широко распространенной жульнической торговлей цитированиями статьи, однако ВАК эта деятельность не заинтересовала. Получил распространение внутренне противоречивый термин «автоплагиат», которым широко клеймят авторов и издания за множественные публикации.
Ключевые слова: открытый доступ, «план S», административная оценка статьи, сериальные издания, онлайновый читатель, индекс Хирша, РИНЦ, Диссернет, автоплагиат.

Разработка тренажера виртуальной реальности для пренатальной диагностики врожденных пороков сердца

Омар Корреа Мадригал, Джавье Эрнесто Пердомо Батиста, Карлос Гарсия Гевара
316-327
Аннотация:

Проект разработки тренажера виртуальной реальности для пренатального выявления врожденных пороков сердца и сопутствующих заболеваний направлен на улучшение специализированной подготовки в области пренатальной диагностики с помощью иммерсивных технологий. Особенно заслуживает внимания теоретический модуль «Мой друг – легкое», который позволяет в игровой форме изучать анатомию сердечно-сосудистой системы плода с помощью 3D-головоломок, заданий на время и бейджей, добиваясь хороших результатов в ходе пилотного тестирования. Практический модуль имитирует УЗИ с помощью тактильных устройств, снижая количество диагностических ошибок и позволяя создавать персонализированные УЗИ. В качестве основного источника информации была собрана база данных с 1200 маркированными исследованиями. Реализация проекта направлена на первоначальное снижение количества клинических ошибок, что может привести к снижению перинатальной смертности. Этот проект объединяет технологические инновации, медицинскую строгость и интерактивную педагогику, позиционируя геймификацию как важный инструмент в медицинском образовании и закладывая основу для его распространения на другие специальности.

Ключевые слова: Виртуальная реальность, врожденные пороки сердца, геймификация, пренатальная диагностика, медицинское обучение, клиническое моделирование.

Автоматическая разметка обучающих выборок в компьютерном зрении с использованием методов машинного обучения

Алексей Константинович Журавлёв, Карен Альбертович Григорян
718-729
Аннотация:

Рассмотрена проблема автоматической разметки обучающих выборок в области компьютерного зрения с использованием методов машинного обучения.


Разметка данных является ключевым этапом в разработке и обучении моделей глубокого обучения, однако процесс создания размеченных данных зачастую требует значительных временных и трудовых затрат. В статье предложен механизм автоматической разметки, основанный на использовании сверточных нейронных сетей и методов активного обучения.


Предложенная методология включает анализ и оценку существующих подходов к автоматической разметке. Эффективность предложенных решений оценена на общедоступных наборах данных. Результаты показали, что предложенный метод в значительной мере сокращает время, необходимое для разметки данных, но в любом случае требует вмешательства оператора-разметчика.


Обзор литературы включает анализ современных методов разметки и существующих автоматических систем, что позволяет лучше понять контекст и преимущества предлагаемого подхода. В заключении обсуждены достижения, ограничения и возможные направления для будущих исследований в данной области.

Ключевые слова: компьютерное зрение, машинное обучение, автоматическая разметка данных, обучающая выборка, сегментация изображений.

Cистема контролируемой генерации лица, построенная с использованием сети StyleGAN2

Марат Вильданович Исангулов, Разиль Рустемович Миннеахметов, Алмаз Рустамович Хамеджанов, Тимур Робертович Хафизьянов, Эмиль Асифович Пашаев, Эрнест Ришатович Калимуллин
466-482
Аннотация:

Представлен новый подход к контролируемой генерации лиц, использующий генеративные модели с открытым исходным кодом, включая StyleGAN2 и Гребневую регрессию. Разработана методология, расширяющая возможности StyleGAN2 для контроля характеристик лиц, таких как возраст, раса, пол, выражение лица и атрибуты волос, а также использован обширный набор данных человеческих лиц с аннотациями атрибутов. Лица закодированы в 256-мерном латентном пространстве с использованием кодировщика StyleGAN2, что привело к набору характерных латентных кодов. Применен алгоритм t-SNE для кластеризации этих кодов на основе признаков, продемонстрирована возможность контроля генерации лиц, впоследствии обучены модели регрессии Риджа для каждого измерения латентных кодов с использованием размеченных признаков. При декодировании с использованием StyleGAN2 полученные коды успешно восстанавливали изображения лиц, сохраняя связь с входными признаками. Разработанный подход дает легкий и эффективный способ контролируемой генерации лиц с использованием существующих генеративных моделей, таких как StyleGAN2, и открывает новые возможности для различных областей применения.

Ключевые слова: машинное обучение, генерация лица, StyleGan, энкодер, декодер, скрытые коды, отображение признаков, гребневая регрессия.

О модели поиска синонимов

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
1006-1022
Аннотация:

Рассмотрена задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для ее решения предложены модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использован подход «сначала индексация, затем обучение», что позволяет получить более точные результаты поиска. Обучение модели проводилось на базе контента библиотеки для предметной области «Математика». Приведены примеры расширенного запроса с использованием синонимов.

Ключевые слова: модель поиска, алгоритм word2vec, синонимы, информационный запрос, расширение запроса.
1 - 10 из 10 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества