• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Беги и решай: опыт соревнований по математическому рогейну

Даниил Владимирович Мусатов, Максим Игоревич Калина, Оксана Нурбиевна Малхожева, Александр Викторович Юров, Дауд Казбекович Мамий
672-685
Аннотация: Городское ориентирование – популярный в России вид досуга, сочетающий физическую и интеллектуальную активность. Им увлекаются многие жители крупных городов, в том числе студенты и выпускники математических специальностей. Мы провели подобные соревнования с математическим уклоном как часть программы Кавказской математической олимпиады. В них участвовали как команды школьников, так и все желающие, в общей сложности более 300 человек. В статье собраны рекомендации по подготовке и проведению подобных соревнований.
Ключевые слова: математические игры, задачи с параметрами, задача коммивояжёра, городской рогейн, активность на свежем воздухе.

Ядро верифицируемой объяснимости: гибридная архитектура GD-ANFIS/SHAP для XAI 2.0

Юрий Владиславович Трофимов, Александр Дмитриевич Лебедев, Андрей Сергеевич Ильин, Алексей Николаевич Аверкин
1230-1252
Аннотация:

Предложена гибридная архитектура Explainable AI, совмещающая полностью дифференцируемую нейро-нечеткую модель GD-ANFIS и пост-хок метод SHAP. Интеграция выполнена с целью реализации принципов XAI 2.0, требующих одновременной прозрачности, проверяемости и адаптивности объяснений.


GD-ANFIS формирует человеческо-читаемые правила типа Такаги – Сугено, обеспечивая структурную интерпретируемость, тогда как SHAP вычисляет количественные вклады признаков по теории Шепли. Для объединения этих слоев разработан механизм компаративного аудита: он автоматически сопоставляет наборы ключевых признаков, проверяет совпадение направлений их влияния и анализирует согласованность между числовыми оценками SHAP и лингвистическими правилами GD-ANFIS. Такой двухконтурный контроль повышает доверие к выводам модели и позволяет оперативно выявлять потенциальные расхождения.


Эффективность подхода подтверждена экспериментами на четырех разнородных наборах данных. В медицинской задаче классификации Breast Cancer Wisconsin достигнута точность 0.982; в задаче глобального картирования просадок грунта — 0.89. В регрессионных тестах на Boston Housing и мониторинге качества поверхностных вод получены RMSE 2.30 и 2.36 соответственно при полном сохранении интерпретируемости. Во всех случаях пересечение топ-признаков в объяснениях двух методов составляло не менее 60%, что демонстрирует высокую согласованность структурных и числовых трактовок.


Предложенная архитектура формирует практическую основу для ответственного внедрения XAI 2.0 в критически важных областях — от медицины и экологии до геоинформационных систем и финансового сектора.

Ключевые слова: объяснимый искусственный интеллект, XAI 2.0, ANFIS, SHAP, компаративный анализ, интерпретируемость, пространственный анализ, доверенность.

Анализ моделей машинного обучения на основе методов объяснимого искусственного интеллекта в образовательной аналитике

Дмитрий Артурович Минуллин, Фаиль Мубаракович Гафаров
294-315
Аннотация:

Проблема прогнозирования досрочного отчисления студентов российских вузов является актуальной, поэтому требуется разработка новых инновационных подходов для её решения. Для решения данной проблемы возможна разработка предиктивных систем на основе использования данных о студентах, имеющихся в информационных системах вузов. В настоящей работе исследованы модели машинного обучения для прогнозирования досрочного отчисления студентов, обученные на основе данных о характеристиках и успеваемости студентов. Основная научная новизна работы заключается в использовании методов объяснимого ИИ для интерпретации и объяснения функционирования обученных моделей машинного обучения. Методы объяснимого искусственного интеллекта позволяют понять, какие из входных признаков (характеристик студента) оказывают наибольшее влияние на результаты прогнозов обученных моделей, а также могут помочь понять, почему модели принимают те или иные решения. Полученные результаты расширяют понимание влияния различных факторов на досрочное отчисление студентов.

Ключевые слова: образовательная аналитика, интеллектуальный анализ данных, машинное обучение, объяснимый искусственный интеллект.

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров
61-85
Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.
Ключевые слова: семантический анализ, издательские системы.

Создание инструментальной платформы мультимедийного научного журнала

292-314
Аннотация: Обсуждены подходы к созданию инструментальной платформы электронного научного журнала, обеспечивающей публикацию мультимедийных материалов через веб-интерфейс. Описаны проблемы, связанные с необходимостью включения мультимедиа данных различных типов, и представлен рабочий прототип мультимедиа научного журнала.
Ключевые слова: научная публикация, электронный научный журнал, мультимедиа контент, электронная коллекция.

Проектирование и разработка обучающего блокчейн-симулятора

Олег Максимович Меховников, Александр Сергеевич Тощев
266-277
Аннотация:

Представлен блокчейн-симулятор, предназначенный для обучения студентов и начинающих блокчейн-разработчиков. Симулятор создан с целью предоставить пользователям интуитивно понятное и доступное средство для изучения основных концепций и механизмов функционирования блокчейна. Рассмотрены основные аспекты проектирования и архитектуры симулятора, а также представлена демонстрация работы приложения. Разработанный симулятор способствует привлечению новых специалистов в сферу блокчейн-разработки.

Ключевые слова: блокчейн, блокчейн-симулятор, введение в блокчейн.

Цифровая трансформация мониторинга опасных геологических процессов на примере байкальской природной территории

Игорь Вячеславович Бычков, Дмитрий Петрович Гладкочуб, Геннадий Михайлович Ружников, Константин Жанович Семинский, Вячеслав Владимирович Парамонов, Сергей Владимирович Алексеев, Сергей Александрович Борняков, Анна Александровна Добрынина, Артем Александрович Рыбченко, Александр Матвеевич Кононов, Александр Валентинович Поспеев, Сергей Васильевич Рассказов, Владимир Анатольевич Саньков, Игорь Константинович Семинский
285-302
Аннотация:

Байкальская природная территория (БПТ) – территория, прилегающая к озеру Байкал, являющемуся уникальным природным объектом и, в соответствии с конвенцией ЮНЕСКО, «Объектом всемирного природного наследия». Байкал находится на центральной части Байкальской рифтовой зоны (БРЗ) – самой активной сейсмической зоной, расположенной в середине России. Развитие БРЗ приводит к возникновению опасных геологических процессов, которые могут привести к нарушению экологического равновесия в системе озера Байкал и окружающей территории. Кроме того, эти процессы и явления представляют реальную угрозу для бесперебойного функционирования магистральных коммуникаций, ГЭС и стратегически важных производств в регионе, относящуюся по классификации МЧС России к первой категории опасности. Для обеспечения постоянного мониторинга и прогнозирования экологической обстановки БПТ организованы систематические наблюдения, а также получение и анализ информации об активности опасных геологических процессов в цифровом виде. Цифровая трансформация мониторинга опасных геологических процессов, вытекающая из цифровизации процессов и развития соответствующей инфраструктуры, обеспечивает возможность использования новых моделей и методов, более гибких подходов к анализу протекающих процессов и предсказанию возможных экстремальных явлений. В настоящей работе предлагается цифровая платформа, обеспечивающая поддержку цифровой трансформации мониторинга опасных геологических процессов на примере БПТ. Созданная и развиваемая платформа может быть также использована для экологического мониторинга БПТ в целом.

Ключевые слова: цифровая платформа, цифровая трансформация, сейсмичность, землетрясение, геофизика, опасные геологические процессы, мониторинг, прогноз, модели.

Решение задачи классификации эмоционального тона сообщения с определением наиболее подходящей архитектуры нейронной сети

Данис Ильмасович Багаутдинов, Рихам Салман, Владислав Алексеевич Алексеев, Рустамджон Муроджонович Усмонов
396-413
Аннотация:

Для определения наиболее эффективного подхода к решению задачи классификации эмоционального тона сообщения проведено обучение выбранных моделей нейронной сети на различных наборах обучающих данных. На основе такого показателя, как процентное соотношение правильно данных ответов на тестовом наборе данных, сравнены комбинации наборов обучающих данных и различных моделей, обученных на основе этих данных. Произведено обучение четырех моделей нейронной сети на трех различных наборах обучающих данных. В результате сравнения точности ответов каждой модели, обученной на разных обучающих данных, сделаны выводы о выборе модели нейронной сети, наиболее подходящей для решения поставленной задачи.

Ключевые слова: NLP, sentiment detection, neural networks, comparison of neural network models, LSTM, CNN, BiLSTM.

Технологии семантического веба для поддержки фундаментальных исследований в геологии

Игорь Вячеславович Бычков, Евгений Александрович Черкашин, Цзинь Чжан, Татьяна Юрьевна Черкашина, Виктория Алексеевна Попова, Оксана Анатольевна Мазаева, Оксана Викторовна Лунина
740-780
Аннотация:

Представлена инновационная методология применения технологий семантического веба для поддержки фундаментальных геологических исследований. Рассмотрена проблема семантической интеграции разнородных геологических данных, характеризующихся масштабом разного уровня и междисциплинарностью. Разработана пятиэтапная методология, включающая анализ предметной области, онтологическое концептуальное моделирование, трансформацию данных в граф знаний, развертывание инфраструктуры распределенного доступа к данным на основе концептуальной модели, а также интеграцию с процедурами обработки и анализа. Практическая апробация проведена на трех кейсах: анализе геохимических данных для оценки уровня загрязнения территории, создании информационной системы о разломах и исследовании динамики береговой зоны водохранилищ. Предложенный онтологический подход обеспечивает соответствие FAIR-принципам и преодоление «семантического барьера» в геологических исследованиях. Показано, что технологии семантического веба позволяют перейти от фрагментированных информационных массивов к целостному семантическому пространству геологических знаний, что открывает новые возможности для генерации комплексных научных гипотез и кросс-дисциплинарных исследований.

Ключевые слова: семантический веб, графы знаний, онтологическое моделирование, семантическое пространство научных знаний, фундаментальные геологические исследования.

Разработка компьютерной системы тестирования когнитивных способностей респондентов на основе предложений с эллипсисами

Ксения Александровна Найденова, Елена Сергеевна Булыкина, Владимир Андреевич Пархоменко, Александр Валентинович Щукин, Татьяна Александровна Мартирова
340-364
Аннотация:

Когнитивные способности охватывают все высшие интеллектуальные функции человека, в том числе устную и письменную речь. Использование эллипсисов связано с умением четко формулировать мысль, избегая избыточности её выражения. Тестирование умения использовать эллипсисы может быть основой, с одной стороны, для оценки самой когнитивной операции порождения эллипсисов в письменной речи и обнаружения нарушений этой операции. Это может послужить в медицине для раннего обнаружения деменции. С другой стороны, такое тестирование применимо для обучения речевым технологиям, в том числе на иностранных языках. С научной точки зрения, важно определить степень влияния обучения на выполнение заданий теста.


В статье описаны разработка компьютерной системы дистанционного online тестирования выполняемой человеком операции преобразования полного предложения в предложение с эллипсисом определенного типа, принципы оценки результатов тестирования испытуемых. Особенностью системы является создание нового типа заданий, связанных с обработкой естественного языка. Сложность разработки определяется необходимостью автоматизированного формирования банка пар предложений на естественном языке без эллипсисов и с эллипсисами, что влечет включение в систему средств синтаксического анализа текстов и алгоритмов автоматизированного формирования эллипсисов в предложениях и/или восстановления полного предложения из эллиптического. В заключении обсуждены перспективы развития и применения предлагаемой системы.

Ключевые слова: эллипсис, обработка естественного языка, on-line тестирование, когнитивные способности.

Доступный интернет: от инициативы WAI к российской практике

Татьяна Алексеевна Полилова
119-144
Аннотация:

Уже много лет консорциум W3C (World Wide Web Consortium) продвигает проект WAI (Web Accessibility Initiative), основной лозунг которого сформулирован как «Делаем веб доступным». В рамках инициативы WAI публикуются рекомендации WCAG (Web Content Accessibility Guidelines), помогающие разработчикам веб-сайтов учесть потребности людей с ограничениями по здоровью. В Российской Федерации разработан ГОСТ Р 52872-2019, основанный на рекомендациях WCAG. Некоторые положения ГОСТа Р 52872-2019 представлены в настоящей работе.


Закон № 181-ФЗ о социальной защите инвалидов, действующий с 1995 г., устанавливает норму, в соответствии с которой разработчики информационных ресурсов должны создавать инвалидам условия для беспрепятственного пользования средствами связи и информации. Общие положения закона № 181-ФЗ реализуются в директивных документах профильных ведомств. В настоящей работе рассмотрены положения приказа Минцифры 2023 г., определяющие порядок представления информации на сайтах организаций в виде, удобном для восприятия людьми с проблемами зрения и слуха. Положения упомянутого приказа Минцифры стимулируют разработчиков сайтов организаций, подведомственных органам управления в РФ разного уровня, обеспечивать достаточную контрастность текста, придерживаться адаптивного дизайна, оснащать нетекстовые объекты текстовым слоем или комментариями, упрощая работу инвалидов в интернете и способствуя развитию инструментов искусственного интеллекта.

Ключевые слова: инициатива WAI, рекомендации WCAG, ГОСТ Р 52872-2019, цифровой контент, доступность для людей с ограничениями по здоровью.

Автоматическое извлечение аргументативных отношений из текстов научной коммуникации

Юрий Алексеевич Загорулько, Елена Анатольевна Сидорова, Ирина Равильевна Ахмадеева
1070-1084
Аннотация:

Сложность задачи извлечения аргументативных структур связана с такими проблемами, как выделение аргументативных сегментов, прогнозирование дальних связей между неконтактными сегментами, обучение на данных, размеченных с низкой степенью согласованности между аннотаторами. В настоящей работе рассмотрен подход к извлечению аргументативных отношений из достаточно больших текстов, относящихся к области научной коммуникации. Проведен сравнительный анализ методов тонкой настройки с использованием предобученной языковой модели типа Longformer, позволяющей учитывать длинные контексты, и двух методов, позволяющих учитывать расхождения аннотаторов в разметке аргументов за счет использования так называемых мягких меток, полученных путем равномерного сглаживания меток и усреднения экспертных оценок. Эксперименты проводились на четырех наборах данных, содержащих положительные и отрицательные примеры пар утверждений (посылка, заключение) и различающихся способами сегментации и средним размером текста. Наилучшие результаты получены на модели с усреднением экспертных оценок. В то же время отмечено, что модель, использующая сглаженные метки, также повышает точность классификаторов, но ухудшает полноту.

Ключевые слова: анализ аргументации, извлечение аргументативных отношений, научная коммуникация, проблемы сегментации, мягкая метка, сглаживание меток, языковая модель.

Технологии получения доверенной электронной почты. Обзор и реализация

Гурий Михайлович Михайлов, Андрей Михайлович Чернецов
1055-1063
Аннотация:

Представлен обзор современных технологий, применяемых при обработке почтовых сообщений для решения задачи получения доверенной электронной почты, проведено их описание. Приведены рекомендуемые настройки для успешного функционирования.

Ключевые слова: e-mail, SPF, DMARC, DKIM.

Квантование Vision Transformer: CPU-центричный анализ компромисса между размером модели и скоростью инференса

Амир Рамисович Нигматуллин, Рустам Арифович Лукманов, Ахмад Таха
262-286
Аннотация:

Использование моделей Vision Transformer (ViT) в реальной медицинской практике, например в больницах или диагностических центрах, часто затруднено, потому что на рабочих компьютерах врачей обычно нет мощных графических процессоров (GPU), а имеющиеся вычислительные ресурсы ограничены. В настоящей работе рассмотрен полный путь практической реализации модели на этапе применения (pipeline инференса), направленный на снижение вычислительных затрат без существенной потери качества.


Предложенный подход объединяет несколько методов оптимизации.
Во-первых, использована дистилляция знаний (knowledge distillation) – метод обучения, при котором компактная модель копирует поведение более крупной и точной модели-учителя. Во-вторых, применено экспоненциальное скользящее среднее (Exponential Moving Average, EMA) весов, позволяющее стабилизировать обучение и повысить обобщающую способность модели.
В-третьих, исследована посттренировочная квантизация до целочисленного формата INT8 (post-training quantization, PTQ), направленная на уменьшение размера модели и ускорение инференса. Дополнительно рассмотрен упрощенный вариант квантизации совместно с обучением (QAT-lite), при котором эффекты квантизации частично учитываются во время дообучения модели.


Эксперименты проведены на датасете ISIC, содержащем дерматоскопические изображения кожных новообразований. Оценка качества моделей включает стандартные метрики классификации: точность (accuracy), макроусредненную F1-меру и площадь под ROC-кривой (ROC-AUC). Проанализированы характеристики производительности на центральном процессоре (CPU), включая задержку инференса, пропускную способность, потребление памяти и итоговый размер модели.


Полученные результаты показали, что посттренировочная INT8-квантизация позволяет сохранить качество, близкое к модели в формате FP32, при существенном снижении требований к памяти и вычислительным ресурсам. В то же время использование QAT-lite не демонстрирует устойчивых и воспроизводимых улучшений по сравнению с PTQ.

Ключевые слова: Визуальный трансформер (ViT), дистилляция знаний, экспоненциальная скользящая средняя (EMA), посттренировочная квантизация, обучение с учетом квантования.

Применение алгоритма Дугласа–Пеккера в вопросах онлайн-аутентификации инструментов удалённой работы при подготовке специалистов укрупнённой группы специальностей 10.00.00 «Информационная безопасность»

Антон Григорьевич Уймин, Владимир Сергеевич Греков
679-694
Аннотация:

В условиях перехода образовательных систем на дистанционное обучение, а также развития тренда на удалённую работу, возникла острая потребность в разработке надежных технологий биометрической идентификации и аутентификации для верификации исполнителей работ в режиме удаленной работы. Такие технологии позволяют обеспечить высокую степень защиты и удобство использования, что делает вопросы их разработки и оптимизации крайне важными.


Проблема заключается в необходимости повышения точности и эффективности систем распознавания движений манипулятора «мышь» без использования специализированных устройств в максимально короткий промежуток времени. Для ее решения требуется эффективная предобработка таких движений, чтобы упростить их траектории, сохранив при этом их ключевые особенности.


В статье предложено использование алгоритма Дугласа–Пеккера для предварительной обработки данных траекторий движений «мыши». Этот алгоритм позволяет значительно уменьшить количество точек в траекториях, упрощая их при сохранении основной формы движений. Данные с упрощенными траекториями затем используются для обучения нейронных сетей.


Экспериментальная часть работы показала, что применение алгоритма Дугласа–Пеккера позволяет сократить количество точек в траекториях на 60%, что приводит к увеличению точности распознавания движений с 70% до 82%. Такое упрощение данных способствует ускорению процесса обучения нейронных сетей и повышению их операционной эффективности.


Проведенное исследование подтвердило эффективность использования алгоритма Дугласа–Пеккера для предварительной обработки данных в задачах распознавания движений «мыши». Полученные результаты могут найти применение в разработке более интуитивно понятных и адаптивных пользовательских интерфейсов.


Предложены также направления для дальнейших исследований, включая оптимизацию параметров алгоритма для различных типов движений и исследование возможности его комбинирования с другими методами машинного обучения.

Ключевые слова: аутентификация, биометрическая идентификация, удалённая работа, дистанционное обучение, алгоритм Дугласа–Пеккера, предобработка данных, нейросеть, HID-устройство, траектория движений «мыши», оптимизация данных.

Исследование квантования больших языковых моделей: оценка эффективности с акцентом на русскоязычные задачи

Дмитрий Романович Пойманов, Михаил Сергеевич Шутов
1138-1163
Аннотация:

Квантование стало ключевой техникой сжатия и ускорения больших языковых моделей (LLM). Несмотря на то, что исследования низкобитного квантования активно развиваются применительно к англоязычным LLM, его влияние на морфологически богатые и разнородные по ресурсам языки, включая русский, остается изученным значительно хуже. Поэтому требуются дополнительные исследования этого вопроса в связи с развитием высокоэффективных русскоязычных и многоязычных LLM.


Мы провели систематическое исследование квантования предобученных моделей в эффективные 2.0—4.25 бита на параметр для современных русскоязычных LLM различного масштаба от 4 до 32 млрд параметров (4 B и 32 B). Экспериментальная часть охватывает как стандартное равномерное квантование, так и специализированные низкобитные форматы. Полученные результаты выявили несколько ключевых тенденций: i) устойчивость русскоязычных LLM к квантованию варьируется в зависимости от архитектуры и размера модели; ii) 4-битное квантование демонстрирует высокую надежность, особенно при использовании продвинутых форматов; iii) 3-битное и 2-битное квантования оказались наиболее чувствительными к указанным калибровки. Полученные эмпирические данные демонстрируют необходимость учета домена модели при использовании различных методов квантования.

Ключевые слова: квантование нейросетей, сжатие и оптимизация больших языковых моделей.

Разработка методов и программных инструментов формирования цифрового портрета учащихся

Марат Альбертович Солнцев, Михаил Михайлович Абрамский
697-717
Аннотация:

Рассмотрены вопросы возможности использования данных об обучающихся, представленных в электронном виде, для построения цифрового портрета. Предложен набор характеристик, необходимых для его построения, обозначена модель данных. Реализованы инструменты сбора данных об обучающихся из социальных сетей и других интернет-ресурсов. Предложены алгоритмы построения цифрового портрета. Проиллюстрировано применение алгоритмов машинного обучения для этих задач. Приведены примеры использования цифрового портрета в образовании.

Ключевые слова: социальные сети, сбор данных, портрет пользователя, образование.

Виртуальная выставка как средство интеграции в единое цифровое пространство научных знаний и информационные системы в области науки и культуры

Ирина Николаевна Соболевская, Александр Николаевич Сотников
98-114
Аннотация:

Рассмотрен принцип формирования виртуальных выставок как средства интеграции в Единое Цифровое Пространство Научных Знаний (ЕЦПНЗ) информационных систем в области науки и культуры с целью продвижения науки, обеспечения доступа к информации в разных областях науки, привлечения внимания к актуальным проблемам и достижениям в научной сфере. Представлены основные методы создания виртуальных выставок, включая выбор контента и разделение на основные разделы. Кроме того, предложена классификация виртуальных выставок на автономные, удаленные и комбинированные. Особое внимание уделено методологии формирования виртуальных выставок в МСЦ РАН. На примере межведомственной комбинированной виртуальной выставки предоставлено подробное описание выставки «Госпожа Пенициллин», посвященной создательнице пенициллина З. В. Ермольевой.

Ключевые слова: виртуальная выставка, Единое Цифровое Пространство Научных Знаний, Госпожа Пенициллин, связанные данные, З.В. Ермольева.

Роль электронной среды академических знаний в повышении конкурентоспособности образовательных услуг

Евгений Николаевич Бабин
369-389
Аннотация:

Указаны противоречия и тенденции информатизации высшей школы. На основе обзора ряда исследований в области проблем электронной научно-образовательной среды и подробного изложения электронных сервисов Казанского национального исследовательского технического университета обоснована необходимость формирования открытой модели академических знаний университета. В статье изложены цель и функции открытой модели академических знаний, главным образом – для непрерывного образования и взаимодействия с бизнес-средой. В частности, предложены виртуальные центры компетенций как инструмент совместного с бизнес-средой управления образовательной и научной деятельностью для усиления конкурентоспособности образовательных услуг.

Ключевые слова: информационно-образовательная среда, электронный университет, система управления знаниями, организационные знания, академические знания, управленческие знания, образовательные услуги, компе-тентностный подход, университет, конкурентоспособность.

Нейросимволический подход к дополненной генерации текста на основе автоматизированной индукции морфотактических правил

Марат Вильданович Исангулов, Александр Михайлович Елизаров, Айгиз Ражапович Кунафин, Айрат Рафизович Гатиатуллин, Николай Аркадиевич Прокопьев
1085-1102
Аннотация:

Представлен гибридный нейросимволический метод, который объединяет большую языковую модель (LLM) и конечный автомат (FST) для обеспечения морфологической корректности при генерации текста на агглютинативных языках.
Система автоматически извлекает правила из корпусных данных: для локальных примеров словоформ LLM формирует цепочки морфологического разбора, которые затем агрегируются и упорядочиваются в компактные описания правил морфотактики (LEXC) и выбора алломорфов (regex). На этапе генерации LLM и FST работают совместно: если токен не распознается автоматом, LLM извлекает из контекста пару «лемма + теги», а FST реализует корректную поверхностную форму. В качестве набора данных использован корпус художественной литературы (~1600 предложений). Для списка из 50 существительных извлечено 250 словоформ. По предложенному алгоритму LLM сгенерировала 110 контекстных regex-правил вместе с LEXC-морфотактикой, на основе чего был скомпилирован FST, распознавший 170/250 форм (~70%). В прикладном тесте машинного перевода на подкорпусе из 300 предложений интеграция данного FST в цикл LLM повысила качество с BLEU 16.14 / ChrF 45.13 до BLEU 25.71 / ChrF 50.87 без дообучения переводчика. Подход применим к иным частям речи и другим агглютинативным и малоресурсным языкам, где он может быть использован для наполнения словарных и грамматических ресурсов.

Ключевые слова: нейросимволический подход, большая языковая модель, конечные автоматы, двухуровневая морфология, LEXC морфотактика, машинный перевод, агглютинативные языки, башкирский язык.

Автоматическое добавление SEO-метаданных в новостные статьи с использованием QWEN-coder

Хамза Салем, Александр Сергеевич Тощев
287-303
Аннотация:

Обобщен ранее разработанный конвейер обогащения новостных статей структурированными метаданными и представлена его обновленная конфигурация, в которой GPT-3 (Generative Pre-trained Transformer 3) – языковая модель от компании OpenAI – заменен на открытую модель Qwen-Coder. Новая версия, как и ранее, использует набор из 400 страниц, отобранных через Google News, и остается совместимой с Google Rich Results Test. Эксперименты показали, что качество, сопоставимое с GPT-3, достижимо при локальном запуске на типовом офисном настольном компьютере (CPU, без GPU). Установлено, что замена, указанная выше, снижает зависимость от платных облачных сервисов и обеспечивает более высокую производительность по сравнению с GPT-версией; дана оценка сходства результатов обогащения для Qwen-Coder относительно базовой реализации на GPT-3. Предложенные инструменты снижают порог внедрения семантической разметки и расширяют ее практическое применение, в том числе в цифровой журналистике.

Ключевые слова: семантическая паутина, майнинг шаблонов, Qwen-Coder, новостные веб-страницы, читабельность, структурированные данные.

Содержание прикладной математической подготовки экономиста в условиях цифровизации

Дмитрий Анатольевич Власов
25-35
Аннотация: Рассмотрено содержание прикладной математической подготовки экономиста в условиях цифровизации экономического образования как один из объектов педагогического проектирования. Традиционно содержание является компонентом методических систем, выступающим основным аккумулятором педагогического, дидактического и методического опыта преподавателя. Приведены основные направления для совершенствования прикладной математической подготовки экономиста в условиях цифровой экономики, под влиянием тенденции цифровизации выделены базовые и вариативные дидактические модули.
Ключевые слова: математическая подготовка, цифровизация, бакалавр экономики, теория риска, актуарная математика, эконометрика.

Исследование когнитивной функции при генерации эллиптических предложений в планиметрических задачах

Владимир Андреевич Пархоменко, Ксения Александровна Найденова, Татьяна Александровна Мартирова, Александр Валентинович Щукин
316-335
Аннотация:

Работа посвящена изучению когнитивной функции, связанной с генерацией эллиптических предложений в русском языке. Исследование проводилось на основе тестирования этой когнитивной способности с помощью компьютерной системы, специально разработанной авторами для этой цели. Тестирование этой когнитивной способности предложено и реализовано впервые. Система является расширением Moodle и открыто размещена в репозитории github. Эллиптические конструкции ограничиваются глагольными и именными эллипсисами, которые теоретически возможно полностью восстановить на основе контекста предложения. Исследование проводилось с участием в качестве респондентов студентов СПбПУ. В качестве предметной области были выбраны тексты планиметрических задач. В результате анализа данных тестирования получены следующие результаты: установлено влияние знаний респондента предметной области (планиметрии) на результаты тестирования; обнаружена тенденция к самообучению респондентов, что проявляется в сокращении времени и увеличении баллов по мере прохождения тестов; показано, что респонденты слабо мотивированы, если не видят отзыв на ответ по выполненному заданию.


Обсуждены проблемы дальнейшего развития системы тестирования и её применения при адаптации опросников (заданий) для оценки знаний студентов СПбПУ в области автоматизации обнаружения ошибок в программах, а также диагностики функционального состояния специалистов операторского профиля и экспресс-диагностики деменции. Перспективным представляется также применение системы для совершенствования процессов синтаксического разбора эллиптических предложений и автоматизации восстановления эллипсисов в предметной области планиметрии.

Ключевые слова: онлайн-система тестирования, разработка системы тестирования, когнитивная функция, эллипсис, планиметрия.

Дальнейшее развитие исследований полей давления в арктическом регионе России

Наталия Павловна Тучкова, Константин Павлович Беляев, Гурий Михайлович Михайлов, Алексей Николаевич Сальников
1217-1232
Аннотация:

Представлены результаты исследований атмосферного давления в Арктическом регионе России в период с 1948 по 2008 годы. Проведен анализ климатического сезонного хода полей атмосферного давления. В качестве основного метода исследования использован вероятностный и статистический анализ временных рядов поля давления длиной в 60 лет в фиксированных точках области Арктической зоны России. Всего было исследовано около 90000 ежедневных (с шестичасовым шагом) значений давления. На основе этих данных построен климатический сезонный ход как осреднение значений данного временного ряда в каждой точке пространства и для фиксированной даты. Изучены характеристики сезонного хода, его амплитуда и фаза. Эти характеристики были проанализированы, проведена их геофизическая интерпретация. В частности, определены минимальное и максимальное значения ряда по всей области и построены временные ряды этих характеристик. Показано, что отклонение носит несимметричный характер, это составляет неочевидный результат исследований. Для максимума и минимума построены наилучшие аппроксимации, и эти аппроксимации протестированы известными методами статистического анализа, включая методы максимального правдоподобия, наименьших квадратов и методы (критерии) согласия, в частности, χ2-критерий. Проведенное исследование имеет приложение как чисто физическое (позволяет объяснить природу, генезис и распространение крупномасштабных атмосферных образований в климатическом году), так и прогностическое (позволяет понять и отследить тенденции в климате, а также количественно оценить масштабы и изменчивость крупномасштабных атмосферных процессов). Численные расчеты выполнялись на суперкомпьютере Ломоносов-2 Московского государственного университета имени М.В. Ломоносова.

Ключевые слова: анализ временных рядов, климатический сезонный ход, максимальные и минимальные значения давления внутри климатического года.

Статистический анализ данных наблюдений потоков взаимодействия океана и атмосферы в северной Атлантике

Наталия Павловна Тучкова, Константин Павлович Беляев, Гурий Михайлович Михайлов
122-133
Аннотация:

Проанализированы данные наблюдений 1979–2018 гг. в районе Северной Атлантики, полученные в результате реализации проекта Российской академии наук по исследованию атмосферы в Северной Атлантике (РАН-НААД). Набор данных предоставляет множество параметров поверхности и свободной атмосферы на основе сигма-модели и отвечает многим требованиям метеорологов, климатологов и океанографов, работающих как в исследовательской, так и в оперативной областях. Проведен анализ сезонной и многолетней изменчивости тепловых потоков и температуры поверхности воды в Северной Атлантике. В качестве основного метода исследования использованы схемы анализа диффузионных процессов. На основе заданных рядов длиной в 40 лет с 1979 по 2018 годы вычислены такие параметры диффузионных процессов, как среднее (снос процесса) и дисперсия (диффузия процесса) и построены их карты и временные кривые. Численные расчеты выполнены на суперкомпьютере Ломоносов-2 Московского государственного университета имени М.В. Ломоносова.

Ключевые слова: УДК 519.6, УДК 519.2.
1 - 25 из 398 результатов 1 2 3 4 5 6 7 8 9 10 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества