Найти

Поиск статей

Расширенные фильтры

Опубликовано после

Опубликовано до

По автору

Результаты поиска

Беги и решай: опыт соревнований по математическому рогейну

Даниил Владимирович Мусатов, Максим Игоревич Калина, Оксана Нурбиевна Малхожева, Александр Викторович Юров, Дауд Казбекович Мамий

672-685

Аннотация: Городское ориентирование – популярный в России вид досуга, сочетающий физическую и интеллектуальную активность. Им увлекаются многие жители крупных городов, в том числе студенты и выпускники математических специальностей. Мы провели подобные соревнования с математическим уклоном как часть программы Кавказской математической олимпиады. В них участвовали как команды школьников, так и все желающие, в общей сложности более 300 человек. В статье собраны рекомендации по подготовке и проведению подобных соревнований.

Ключевые слова: математические игры, задачи с параметрами, задача коммивояжёра, городской рогейн, активность на свежем воздухе.

Ядро верифицируемой объяснимости: гибридная архитектура GD-ANFIS/SHAP для XAI 2.0

Юрий Владиславович Трофимов, Александр Дмитриевич Лебедев, Андрей Сергеевич Ильин, Алексей Николаевич Аверкин

1230-1252

Аннотация:

Предложена гибридная архитектура Explainable AI, совмещающая полностью дифференцируемую нейро-нечеткую модель GD-ANFIS и пост-хок метод SHAP. Интеграция выполнена с целью реализации принципов XAI 2.0, требующих одновременной прозрачности, проверяемости и адаптивности объяснений.

GD-ANFIS формирует человеческо-читаемые правила типа Такаги – Сугено, обеспечивая структурную интерпретируемость, тогда как SHAP вычисляет количественные вклады признаков по теории Шепли. Для объединения этих слоев разработан механизм компаративного аудита: он автоматически сопоставляет наборы ключевых признаков, проверяет совпадение направлений их влияния и анализирует согласованность между числовыми оценками SHAP и лингвистическими правилами GD-ANFIS. Такой двухконтурный контроль повышает доверие к выводам модели и позволяет оперативно выявлять потенциальные расхождения.

Эффективность подхода подтверждена экспериментами на четырех разнородных наборах данных. В медицинской задаче классификации Breast Cancer Wisconsin достигнута точность 0.982; в задаче глобального картирования просадок грунта — 0.89. В регрессионных тестах на Boston Housing и мониторинге качества поверхностных вод получены RMSE 2.30 и 2.36 соответственно при полном сохранении интерпретируемости. Во всех случаях пересечение топ-признаков в объяснениях двух методов составляло не менее 60%, что демонстрирует высокую согласованность структурных и числовых трактовок.

Предложенная архитектура формирует практическую основу для ответственного внедрения XAI 2.0 в критически важных областях — от медицины и экологии до геоинформационных систем и финансового сектора.

Ключевые слова: объяснимый искусственный интеллект, XAI 2.0, ANFIS, SHAP, компаративный анализ, интерпретируемость, пространственный анализ, доверенность.

Создание инструментальной платформы мультимедийного научного журнала

292-314

Аннотация: Обсуждены подходы к созданию инструментальной платформы электронного научного журнала, обеспечивающей публикацию мультимедийных материалов через веб-интерфейс. Описаны проблемы, связанные с необходимостью включения мультимедиа данных различных типов, и представлен рабочий прототип мультимедиа научного журнала.

Ключевые слова: научная публикация, электронный научный журнал, мультимедиа контент, электронная коллекция.

Проектирование и разработка обучающего блокчейн-симулятора

Олег Максимович Меховников, Александр Сергеевич Тощев

266-277

Аннотация:

Представлен блокчейн-симулятор, предназначенный для обучения студентов и начинающих блокчейн-разработчиков. Симулятор создан с целью предоставить пользователям интуитивно понятное и доступное средство для изучения основных концепций и механизмов функционирования блокчейна. Рассмотрены основные аспекты проектирования и архитектуры симулятора, а также представлена демонстрация работы приложения. Разработанный симулятор способствует привлечению новых специалистов в сферу блокчейн-разработки.

Ключевые слова: блокчейн, блокчейн-симулятор, введение в блокчейн.

Цифровая трансформация мониторинга опасных геологических процессов на примере байкальской природной территории

Игорь Вячеславович Бычков, Дмитрий Петрович Гладкочуб, Геннадий Михайлович Ружников, Константин Жанович Семинский, Вячеслав Владимирович Парамонов, Сергей Владимирович Алексеев, Сергей Александрович Борняков, Анна Александровна Добрынина, Артем Александрович Рыбченко, Александр Матвеевич Кононов, Александр Валентинович Поспеев, Сергей Васильевич Рассказов, Владимир Анатольевич Саньков, Игорь Константинович Семинский

285-302

Аннотация:

Байкальская природная территория (БПТ) – территория, прилегающая к озеру Байкал, являющемуся уникальным природным объектом и, в соответствии с конвенцией ЮНЕСКО, «Объектом всемирного природного наследия». Байкал находится на центральной части Байкальской рифтовой зоны (БРЗ) – самой активной сейсмической зоной, расположенной в середине России. Развитие БРЗ приводит к возникновению опасных геологических процессов, которые могут привести к нарушению экологического равновесия в системе озера Байкал и окружающей территории. Кроме того, эти процессы и явления представляют реальную угрозу для бесперебойного функционирования магистральных коммуникаций, ГЭС и стратегически важных производств в регионе, относящуюся по классификации МЧС России к первой категории опасности. Для обеспечения постоянного мониторинга и прогнозирования экологической обстановки БПТ организованы систематические наблюдения, а также получение и анализ информации об активности опасных геологических процессов в цифровом виде. Цифровая трансформация мониторинга опасных геологических процессов, вытекающая из цифровизации процессов и развития соответствующей инфраструктуры, обеспечивает возможность использования новых моделей и методов, более гибких подходов к анализу протекающих процессов и предсказанию возможных экстремальных явлений. В настоящей работе предлагается цифровая платформа, обеспечивающая поддержку цифровой трансформации мониторинга опасных геологических процессов на примере БПТ. Созданная и развиваемая платформа может быть также использована для экологического мониторинга БПТ в целом.

Ключевые слова: цифровая платформа, цифровая трансформация, сейсмичность, землетрясение, геофизика, опасные геологические процессы, мониторинг, прогноз, модели.

Анализ моделей машинного обучения на основе методов объяснимого искусственного интеллекта в образовательной аналитике

Дмитрий Артурович Минуллин, Фаиль Мубаракович Гафаров

294-315

Аннотация:

Проблема прогнозирования досрочного отчисления студентов российских вузов является актуальной, поэтому требуется разработка новых инновационных подходов для её решения. Для решения данной проблемы возможна разработка предиктивных систем на основе использования данных о студентах, имеющихся в информационных системах вузов. В настоящей работе исследованы модели машинного обучения для прогнозирования досрочного отчисления студентов, обученные на основе данных о характеристиках и успеваемости студентов. Основная научная новизна работы заключается в использовании методов объяснимого ИИ для интерпретации и объяснения функционирования обученных моделей машинного обучения. Методы объяснимого искусственного интеллекта позволяют понять, какие из входных признаков (характеристик студента) оказывают наибольшее влияние на результаты прогнозов обученных моделей, а также могут помочь понять, почему модели принимают те или иные решения. Полученные результаты расширяют понимание влияния различных факторов на досрочное отчисление студентов.

Ключевые слова: образовательная аналитика, интеллектуальный анализ данных, машинное обучение, объяснимый искусственный интеллект.

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров

61-85

Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.

Ключевые слова: семантический анализ, издательские системы.

Решение задачи классификации эмоционального тона сообщения с определением наиболее подходящей архитектуры нейронной сети

Данис Ильмасович Багаутдинов, Рихам Салман, Владислав Алексеевич Алексеев, Рустамджон Муроджонович Усмонов

396-413

Аннотация:

Для определения наиболее эффективного подхода к решению задачи классификации эмоционального тона сообщения проведено обучение выбранных моделей нейронной сети на различных наборах обучающих данных. На основе такого показателя, как процентное соотношение правильно данных ответов на тестовом наборе данных, сравнены комбинации наборов обучающих данных и различных моделей, обученных на основе этих данных. Произведено обучение четырех моделей нейронной сети на трех различных наборах обучающих данных. В результате сравнения точности ответов каждой модели, обученной на разных обучающих данных, сделаны выводы о выборе модели нейронной сети, наиболее подходящей для решения поставленной задачи.

Ключевые слова: NLP, sentiment detection, neural networks, comparison of neural network models, LSTM, CNN, BiLSTM.

Разработка компьютерной системы тестирования когнитивных способностей респондентов на основе предложений с эллипсисами

Ксения Александровна Найденова, Елена Сергеевна Булыкина, Владимир Андреевич Пархоменко, Александр Валентинович Щукин, Татьяна Александровна Мартирова

340-364

Аннотация:

Когнитивные способности охватывают все высшие интеллектуальные функции человека, в том числе устную и письменную речь. Использование эллипсисов связано с умением четко формулировать мысль, избегая избыточности её выражения. Тестирование умения использовать эллипсисы может быть основой, с одной стороны, для оценки самой когнитивной операции порождения эллипсисов в письменной речи и обнаружения нарушений этой операции. Это может послужить в медицине для раннего обнаружения деменции. С другой стороны, такое тестирование применимо для обучения речевым технологиям, в том числе на иностранных языках. С научной точки зрения, важно определить степень влияния обучения на выполнение заданий теста.

В статье описаны разработка компьютерной системы дистанционного online тестирования выполняемой человеком операции преобразования полного предложения в предложение с эллипсисом определенного типа, принципы оценки результатов тестирования испытуемых. Особенностью системы является создание нового типа заданий, связанных с обработкой естественного языка. Сложность разработки определяется необходимостью автоматизированного формирования банка пар предложений на естественном языке без эллипсисов и с эллипсисами, что влечет включение в систему средств синтаксического анализа текстов и алгоритмов автоматизированного формирования эллипсисов в предложениях и/или восстановления полного предложения из эллиптического. В заключении обсуждены перспективы развития и применения предлагаемой системы.

Ключевые слова: эллипсис, обработка естественного языка, on-line тестирование, когнитивные способности.

Доступный интернет: от инициативы WAI к российской практике

Татьяна Алексеевна Полилова

119-144

Аннотация:

Уже много лет консорциум W3C (World Wide Web Consortium) продвигает проект WAI (Web Accessibility Initiative), основной лозунг которого сформулирован как «Делаем веб доступным». В рамках инициативы WAI публикуются рекомендации WCAG (Web Content Accessibility Guidelines), помогающие разработчикам веб-сайтов учесть потребности людей с ограничениями по здоровью. В Российской Федерации разработан ГОСТ Р 52872-2019, основанный на рекомендациях WCAG. Некоторые положения ГОСТа Р 52872-2019 представлены в настоящей работе.

Закон № 181-ФЗ о социальной защите инвалидов, действующий с 1995 г., устанавливает норму, в соответствии с которой разработчики информационных ресурсов должны создавать инвалидам условия для беспрепятственного пользования средствами связи и информации. Общие положения закона № 181-ФЗ реализуются в директивных документах профильных ведомств. В настоящей работе рассмотрены положения приказа Минцифры 2023 г., определяющие порядок представления информации на сайтах организаций в виде, удобном для восприятия людьми с проблемами зрения и слуха. Положения упомянутого приказа Минцифры стимулируют разработчиков сайтов организаций, подведомственных органам управления в РФ разного уровня, обеспечивать достаточную контрастность текста, придерживаться адаптивного дизайна, оснащать нетекстовые объекты текстовым слоем или комментариями, упрощая работу инвалидов в интернете и способствуя развитию инструментов искусственного интеллекта.

Ключевые слова: инициатива WAI, рекомендации WCAG, ГОСТ Р 52872-2019, цифровой контент, доступность для людей с ограничениями по здоровью.

Технологии семантического веба для поддержки фундаментальных исследований в геологии

Игорь Вячеславович Бычков, Евгений Александрович Черкашин, Цзинь Чжан, Татьяна Юрьевна Черкашина, Виктория Алексеевна Попова, Оксана Анатольевна Мазаева, Оксана Викторовна Лунина

740-780

Аннотация:

Представлена инновационная методология применения технологий семантического веба для поддержки фундаментальных геологических исследований. Рассмотрена проблема семантической интеграции разнородных геологических данных, характеризующихся масштабом разного уровня и междисциплинарностью. Разработана пятиэтапная методология, включающая анализ предметной области, онтологическое концептуальное моделирование, трансформацию данных в граф знаний, развертывание инфраструктуры распределенного доступа к данным на основе концептуальной модели, а также интеграцию с процедурами обработки и анализа. Практическая апробация проведена на трех кейсах: анализе геохимических данных для оценки уровня загрязнения территории, создании информационной системы о разломах и исследовании динамики береговой зоны водохранилищ. Предложенный онтологический подход обеспечивает соответствие FAIR-принципам и преодоление «семантического барьера» в геологических исследованиях. Показано, что технологии семантического веба позволяют перейти от фрагментированных информационных массивов к целостному семантическому пространству геологических знаний, что открывает новые возможности для генерации комплексных научных гипотез и кросс-дисциплинарных исследований.

Ключевые слова: семантический веб, графы знаний, онтологическое моделирование, семантическое пространство научных знаний, фундаментальные геологические исследования.

Разработка методов и программных инструментов формирования цифрового портрета учащихся

Марат Альбертович Солнцев, Михаил Михайлович Абрамский

697-717

Аннотация:

Рассмотрены вопросы возможности использования данных об обучающихся, представленных в электронном виде, для построения цифрового портрета. Предложен набор характеристик, необходимых для его построения, обозначена модель данных. Реализованы инструменты сбора данных об обучающихся из социальных сетей и других интернет-ресурсов. Предложены алгоритмы построения цифрового портрета. Проиллюстрировано применение алгоритмов машинного обучения для этих задач. Приведены примеры использования цифрового портрета в образовании.

Ключевые слова: социальные сети, сбор данных, портрет пользователя, образование.

Автоматическое извлечение аргументативных отношений из текстов научной коммуникации

Юрий Алексеевич Загорулько, Елена Анатольевна Сидорова, Ирина Равильевна Ахмадеева

1070-1084

Аннотация:

Сложность задачи извлечения аргументативных структур связана с такими проблемами, как выделение аргументативных сегментов, прогнозирование дальних связей между неконтактными сегментами, обучение на данных, размеченных с низкой степенью согласованности между аннотаторами. В настоящей работе рассмотрен подход к извлечению аргументативных отношений из достаточно больших текстов, относящихся к области научной коммуникации. Проведен сравнительный анализ методов тонкой настройки с использованием предобученной языковой модели типа Longformer, позволяющей учитывать длинные контексты, и двух методов, позволяющих учитывать расхождения аннотаторов в разметке аргументов за счет использования так называемых мягких меток, полученных путем равномерного сглаживания меток и усреднения экспертных оценок. Эксперименты проводились на четырех наборах данных, содержащих положительные и отрицательные примеры пар утверждений (посылка, заключение) и различающихся способами сегментации и средним размером текста. Наилучшие результаты получены на модели с усреднением экспертных оценок. В то же время отмечено, что модель, использующая сглаженные метки, также повышает точность классификаторов, но ухудшает полноту.

Ключевые слова: анализ аргументации, извлечение аргументативных отношений, научная коммуникация, проблемы сегментации, мягкая метка, сглаживание меток, языковая модель.

Технологии получения доверенной электронной почты. Обзор и реализация

Гурий Михайлович Михайлов, Андрей Михайлович Чернецов

1055-1063

Аннотация:

Представлен обзор современных технологий, применяемых при обработке почтовых сообщений для решения задачи получения доверенной электронной почты, проведено их описание. Приведены рекомендуемые настройки для успешного функционирования.

Ключевые слова: e-mail, SPF, DMARC, DKIM.

Квантование Vision Transformer: CPU-центричный анализ компромисса между размером модели и скоростью инференса

Амир Рамисович Нигматуллин, Рустам Арифович Лукманов, Ахмад Таха

262-286

Аннотация:

Использование моделей Vision Transformer (ViT) в реальной медицинской практике, например в больницах или диагностических центрах, часто затруднено, потому что на рабочих компьютерах врачей обычно нет мощных графических процессоров (GPU), а имеющиеся вычислительные ресурсы ограничены. В настоящей работе рассмотрен полный путь практической реализации модели на этапе применения (pipeline инференса), направленный на снижение вычислительных затрат без существенной потери качества.

Предложенный подход объединяет несколько методов оптимизации.
Во-первых, использована дистилляция знаний (knowledge distillation) – метод обучения, при котором компактная модель копирует поведение более крупной и точной модели-учителя. Во-вторых, применено экспоненциальное скользящее среднее (Exponential Moving Average, EMA) весов, позволяющее стабилизировать обучение и повысить обобщающую способность модели.
В-третьих, исследована посттренировочная квантизация до целочисленного формата INT8 (post-training quantization, PTQ), направленная на уменьшение размера модели и ускорение инференса. Дополнительно рассмотрен упрощенный вариант квантизации совместно с обучением (QAT-lite), при котором эффекты квантизации частично учитываются во время дообучения модели.

Эксперименты проведены на датасете ISIC, содержащем дерматоскопические изображения кожных новообразований. Оценка качества моделей включает стандартные метрики классификации: точность (accuracy), макроусредненную F1-меру и площадь под ROC-кривой (ROC-AUC). Проанализированы характеристики производительности на центральном процессоре (CPU), включая задержку инференса, пропускную способность, потребление памяти и итоговый размер модели.

Полученные результаты показали, что посттренировочная INT8-квантизация позволяет сохранить качество, близкое к модели в формате FP32, при существенном снижении требований к памяти и вычислительным ресурсам. В то же время использование QAT-lite не демонстрирует устойчивых и воспроизводимых улучшений по сравнению с PTQ.

Ключевые слова: Визуальный трансформер (ViT), дистилляция знаний, экспоненциальная скользящая средняя (EMA), посттренировочная квантизация, обучение с учетом квантования.

Применение алгоритма Дугласа–Пеккера в вопросах онлайн-аутентификации инструментов удалённой работы при подготовке специалистов укрупнённой группы специальностей 10.00.00 «Информационная безопасность»

Антон Григорьевич Уймин, Владимир Сергеевич Греков

679-694

Аннотация:

В условиях перехода образовательных систем на дистанционное обучение, а также развития тренда на удалённую работу, возникла острая потребность в разработке надежных технологий биометрической идентификации и аутентификации для верификации исполнителей работ в режиме удаленной работы. Такие технологии позволяют обеспечить высокую степень защиты и удобство использования, что делает вопросы их разработки и оптимизации крайне важными.

Проблема заключается в необходимости повышения точности и эффективности систем распознавания движений манипулятора «мышь» без использования специализированных устройств в максимально короткий промежуток времени. Для ее решения требуется эффективная предобработка таких движений, чтобы упростить их траектории, сохранив при этом их ключевые особенности.

В статье предложено использование алгоритма Дугласа–Пеккера для предварительной обработки данных траекторий движений «мыши». Этот алгоритм позволяет значительно уменьшить количество точек в траекториях, упрощая их при сохранении основной формы движений. Данные с упрощенными траекториями затем используются для обучения нейронных сетей.

Экспериментальная часть работы показала, что применение алгоритма Дугласа–Пеккера позволяет сократить количество точек в траекториях на 60%, что приводит к увеличению точности распознавания движений с 70% до 82%. Такое упрощение данных способствует ускорению процесса обучения нейронных сетей и повышению их операционной эффективности.

Проведенное исследование подтвердило эффективность использования алгоритма Дугласа–Пеккера для предварительной обработки данных в задачах распознавания движений «мыши». Полученные результаты могут найти применение в разработке более интуитивно понятных и адаптивных пользовательских интерфейсов.

Предложены также направления для дальнейших исследований, включая оптимизацию параметров алгоритма для различных типов движений и исследование возможности его комбинирования с другими методами машинного обучения.

Ключевые слова: аутентификация, биометрическая идентификация, удалённая работа, дистанционное обучение, алгоритм Дугласа–Пеккера, предобработка данных, нейросеть, HID-устройство, траектория движений «мыши», оптимизация данных.

Исследование квантования больших языковых моделей: оценка эффективности с акцентом на русскоязычные задачи

Дмитрий Романович Пойманов, Михаил Сергеевич Шутов

1138-1163

Аннотация:

Квантование стало ключевой техникой сжатия и ускорения больших языковых моделей (LLM). Несмотря на то, что исследования низкобитного квантования активно развиваются применительно к англоязычным LLM, его влияние на морфологически богатые и разнородные по ресурсам языки, включая русский, остается изученным значительно хуже. Поэтому требуются дополнительные исследования этого вопроса в связи с развитием высокоэффективных русскоязычных и многоязычных LLM.

Мы провели систематическое исследование квантования предобученных моделей в эффективные 2.0—4.25 бита на параметр для современных русскоязычных LLM различного масштаба от 4 до 32 млрд параметров (4 B и 32 B). Экспериментальная часть охватывает как стандартное равномерное квантование, так и специализированные низкобитные форматы. Полученные результаты выявили несколько ключевых тенденций: i) устойчивость русскоязычных LLM к квантованию варьируется в зависимости от архитектуры и размера модели; ii) 4-битное квантование демонстрирует высокую надежность, особенно при использовании продвинутых форматов; iii) 3-битное и 2-битное квантования оказались наиболее чувствительными к указанным калибровки. Полученные эмпирические данные демонстрируют необходимость учета домена модели при использовании различных методов квантования.

Ключевые слова: квантование нейросетей, сжатие и оптимизация больших языковых моделей.

Об онтологии адресата в математической предметной области

Александр Александрович Муромский, Наталия Павловна Тучкова

506-533

Аннотация: Обсуждена проблема представления математических предметных областей в цифровых библиотеках и полезности этих ресурсов для специалистов. Дан вариант представления математических предметных областей в интернете. В качестве информационной модели для единицы записи выбрана статья тезауруса. Реализация схемы показана на примере уравнений с частными производными. Предложен подход к организации информационного пространства автора, основанный на использовании тезауруса адресата. На основе описаний предметных областей индивидуумов предполагается построение онтологии научного междисциплинарного сообщества, что, по мнению авторов, позволит не утерять новый результат или открытие в науке, соблюсти приоритеты авторов, встроить новое знание в устоявшуюся систему классических предметных областей.

Ключевые слова: контролируемая лексика, дескрипторные словари, тезауруса адресата, онтология адресата.

Контроллер реалистичного поведения стай/стад животных

Влада Владимировна Кугуракова, Александр Михайлович Степанов

239-272

Аннотация:

Работа посвящена рассмотрению процесса моделирования реалистичного контроллера поведения групп объектов. Проведено исследование основных приемов и принципов, используемых при создании реалистичного контроллера поведения автономных агентов, объединенных в связанные группы. На основе этих данных создан контроллер поведения.

Исследована эффективность поведения групп автономных агентов, рассмотрены возможности использования системы локальных скалярных полей с целью построения максимально точной математической модели, проведён анализ возможности создания иерархической системы мультиагентных подгрупп в рамках группы, проведены эксперименты для оценки корректности разработанного контролера.

Ключевые слова: контроллер, группа, модель поведения.

Место языка Lisp при преподавании функционального программирования

Борис Леонидович Файфель, Лидия Васильевна Городняя

503-531

Аннотация:

Рассмотрены ключевые проблемы преподавания функционального программирования обучаемым, уже знакомым с императивной парадигмой. Описаны модель обучаемого и основные сложности, возникающие при преподавании функционального программирования в этом случае (изменяемые переменные, циклы, последовательные вычисления). Приведен развернутый пример перехода от императивной к функциональной парадигме. Подробно рассмотрен возврат функционального значения на примерах численного дифференцирования и интерполяции. Рассмотрена реализация отложенных вычислений, основанная на анонимных функциях. Показано, что использование мультипарадигменного языка Lisp удобно для первого знакомства с функциональной парадигмой.

Ключевые слова: язык программирования, Lisp, Common Lisp, HomeLisp, функциональное программирование.

Реализация одного решения при переходе с CentOS на РЕД ОС для кластера высокой доступности

Гурий Михайлович Михайлов, Наталия Павловна Тучкова, Андрей Михайлович Чернецов

145-155

Аннотация:

Представлен краткий аналитический обзор популярных отечественных дистрибутивов операционных систем, разработанных в рамках реализации задач технологической независимости в области программного обеспечения и средств телекоммуникации. Описано одно из решений перехода с системы CentOS на систему РЕД ОС (RED OS) для кластера высокой доступности на базе Pacemaker и распределенной файловой системы DRBD, обеспечившего работу сайта организации и сервера баз данных MySQL.

Ключевые слова: импортозамещение, РЕД ОС-сертифицированная, Pacemaker.

Виртуальная выставка как средство интеграции в единое цифровое пространство научных знаний и информационные системы в области науки и культуры

Ирина Николаевна Соболевская, Александр Николаевич Сотников

98-114

Аннотация:

Рассмотрен принцип формирования виртуальных выставок как средства интеграции в Единое Цифровое Пространство Научных Знаний (ЕЦПНЗ) информационных систем в области науки и культуры с целью продвижения науки, обеспечения доступа к информации в разных областях науки, привлечения внимания к актуальным проблемам и достижениям в научной сфере. Представлены основные методы создания виртуальных выставок, включая выбор контента и разделение на основные разделы. Кроме того, предложена классификация виртуальных выставок на автономные, удаленные и комбинированные. Особое внимание уделено методологии формирования виртуальных выставок в МСЦ РАН. На примере межведомственной комбинированной виртуальной выставки предоставлено подробное описание выставки «Госпожа Пенициллин», посвященной создательнице пенициллина З. В. Ермольевой.

Ключевые слова: виртуальная выставка, Единое Цифровое Пространство Научных Знаний, Госпожа Пенициллин, связанные данные, З.В. Ермольева.

Роль электронной среды академических знаний в повышении конкурентоспособности образовательных услуг

Евгений Николаевич Бабин

369-389

Аннотация:

Указаны противоречия и тенденции информатизации высшей школы. На основе обзора ряда исследований в области проблем электронной научно-образовательной среды и подробного изложения электронных сервисов Казанского национального исследовательского технического университета обоснована необходимость формирования открытой модели академических знаний университета. В статье изложены цель и функции открытой модели академических знаний, главным образом – для непрерывного образования и взаимодействия с бизнес-средой. В частности, предложены виртуальные центры компетенций как инструмент совместного с бизнес-средой управления образовательной и научной деятельностью для усиления конкурентоспособности образовательных услуг.

Ключевые слова: информационно-образовательная среда, электронный университет, система управления знаниями, организационные знания, академические знания, управленческие знания, образовательные услуги, компе-тентностный подход, университет, конкурентоспособность.

Нейросимволический подход к дополненной генерации текста на основе автоматизированной индукции морфотактических правил

Марат Вильданович Исангулов, Александр Михайлович Елизаров, Айгиз Ражапович Кунафин, Айрат Рафизович Гатиатуллин, Николай Аркадиевич Прокопьев

1085-1102

Аннотация:

Представлен гибридный нейросимволический метод, который объединяет большую языковую модель (LLM) и конечный автомат (FST) для обеспечения морфологической корректности при генерации текста на агглютинативных языках.
Система автоматически извлекает правила из корпусных данных: для локальных примеров словоформ LLM формирует цепочки морфологического разбора, которые затем агрегируются и упорядочиваются в компактные описания правил морфотактики (LEXC) и выбора алломорфов (regex). На этапе генерации LLM и FST работают совместно: если токен не распознается автоматом, LLM извлекает из контекста пару «лемма + теги», а FST реализует корректную поверхностную форму. В качестве набора данных использован корпус художественной литературы (~1600 предложений). Для списка из 50 существительных извлечено 250 словоформ. По предложенному алгоритму LLM сгенерировала 110 контекстных regex-правил вместе с LEXC-морфотактикой, на основе чего был скомпилирован FST, распознавший 170/250 форм (~70%). В прикладном тесте машинного перевода на подкорпусе из 300 предложений интеграция данного FST в цикл LLM повысила качество с BLEU 16.14 / ChrF 45.13 до BLEU 25.71 / ChrF 50.87 без дообучения переводчика. Подход применим к иным частям речи и другим агглютинативным и малоресурсным языкам, где он может быть использован для наполнения словарных и грамматических ресурсов.

Ключевые слова: нейросимволический подход, большая языковая модель, конечные автоматы, двухуровневая морфология, LEXC морфотактика, машинный перевод, агглютинативные языки, башкирский язык.

Автоматическое добавление SEO-метаданных в новостные статьи с использованием QWEN-coder

Хамза Салем, Александр Сергеевич Тощев

287-303

Аннотация:

Обобщен ранее разработанный конвейер обогащения новостных статей структурированными метаданными и представлена его обновленная конфигурация, в которой GPT-3 (Generative Pre-trained Transformer 3) – языковая модель от компании OpenAI – заменен на открытую модель Qwen-Coder. Новая версия, как и ранее, использует набор из 400 страниц, отобранных через Google News, и остается совместимой с Google Rich Results Test. Эксперименты показали, что качество, сопоставимое с GPT-3, достижимо при локальном запуске на типовом офисном настольном компьютере (CPU, без GPU). Установлено, что замена, указанная выше, снижает зависимость от платных облачных сервисов и обеспечивает более высокую производительность по сравнению с GPT-версией; дана оценка сходства результатов обогащения для Qwen-Coder относительно базовой реализации на GPT-3. Предложенные инструменты снижают порог внедрения семантической разметки и расширяют ее практическое применение, в том числе в цифровой журналистике.

Ключевые слова: семантическая паутина, майнинг шаблонов, Qwen-Coder, новостные веб-страницы, читабельность, структурированные данные.

1 - 25 из 398 результатов 1 2 3 4 5 6 7 8 9 10 > >>