https://rdl-journal.ru/issue/feed Электронные библиотеки 2025-12-04T17:30:14+03:00 Редакция журнала «Электронные Библиотеки» ljmeditor@gmail.com Open Journal Systems <div id="journalDescription"> <p><strong>Дорогой посетитель!</strong></p> <p>Вы находитесь на сайте электронного научного журнала «Электронные библиотеки», посвященного оперативному отражению новых результатов теории и практики использования в России и за рубежом электронных библиотек – распределенных информационных систем, позволяющих обрабатывать, хранить, распространять, анализировать и организовывать поиск в разнообразных коллекциях электронных документов (текст, графика, аудио, видео и др.) через глобальные сети передачи данных. Журнал нацелен на формирование российского сообщества учёных, развивающих названное научное направление, и является в настоящее время единственным российским изданием, последовательно и систематически освещающим наиболее актуальные вопросы, связанные с развитием технологий электронных библиотек, которые в настоящее время становятся всё более существенными для совершенствования стандартов науки, экономики, образования, здравоохранения и качества жизни вообще. Научные электронные библиотеки играют важную роль в реализации активно поддерживаемых научным сообществом инициатив открытого доступа к результатам исследований, формировании открытой науки и глобальных репозиториев представления знаний и данных. Материалы журнала направлены на формирование российского сообщества ученых, экспертов и практиков, целенаправленно занимающимися вопросами использования технологий электронных библиотек для социально-экономического развития.</p> <p>Аудитория журнала включает широкий круг специалистов в сфере создания и использования информационно-коммуникационных технологий; ученых и исследователей; работников сфер образования и культуры; частных лиц, интересующихся проблемами развития современного информационного общества. Материалы, публикуемые в журнале, проходят строгую процедуру рецензирования и экспертного отбора.</p> </div> https://rdl-journal.ru/article/view/958 Интеллектуальный робот-химик: на пути к автономной лаборатории 2025-11-27T14:00:48+03:00 Муса Шамильевич Адыгамов musa20930@gmail.com Антон Олегович Голубь toxa.mix7@gmail.com Эмиль Ринатович Сайфуллин mr.emilsr@gmail.com Тимур Рустемович Гимадиев Timur.Gimadiev@gmail.com Никита Юрьевич Серов Serov.Nikita@gmail.com <p>Представлена программно-аппаратная платформа, которая позволяет проводить химические синтезы в автоматическом режиме, включая приготовление реакционных смесей, их нагрев и перемешивание, а также отбор проб с разбавлением после синтеза и отправку на анализ методом высокоэффективной жидкостной хроматографии с последующей автоматической обработкой результатов. Для управления отдельными элементами роботизированной установки создана собственная библиотека ChemBot на языке Python, а для управления всей системой – клиентский веб-сервер; для просмотра состояния установки и хода выполнения синтезов разработан веб-интерфейс. Работа всей платформы по выполнению экспериментов протестирована при выполнении синтезов по альдольной конденсации, где варьировались соотношение реагентов, катализатор и его количество, температура и время синтеза. Написание собственного кода для контроля и управления всей системой стало важным шагом на пути интеграции роботизированной установки и искусственного интеллекта (ИИ), что в перспективе позволит осуществить переход к автономной лаборатории, когда предсказание целевой молекулы и ее синтеза, экспериментальное осуществление и анализ, а также, при необходимости, уточнение или изменение использованной модели будут осуществляться в автоматическом режиме, без вмешательства человека.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Муса Шамильевич Адыгамов, Антон Олегович Голубь, Эмиль Ринатович Сайфуллин, Тимур Рустемович Гимадиев, Никита Юрьевич Серов https://rdl-journal.ru/article/view/959 Проектирование динамической экспертной системы по анализу влияния климатических воздействий на малые и средние предприятия 2025-11-27T14:02:03+03:00 Рустам Арифович Бурнашев r.burnashev@inbox.ru Ярослав Владиславович Сергеев sergeevyarik7@yandex.ru <p>Растущая нестабильность климата создает новые вызовы и риски для устойчивости малых и средних предприятий. В работе предложена архитектура прототипа динамической экспертной системы, интегрирующей несколько ключевых модулей: пользовательский интерфейс, базу знаний, серверное приложение и модуль динамического обновления данных с API-интерфейсами реального времени. Особенностью системы является применение аппарата <em>Z</em>⁺-чисел, реализованного на основе программной библиотеки scikit-fuzzy, что позволяет учитывать градуированную уверенность в оценках. Этот подход дает более обоснованные и адаптивные оценки рисков, чувствительные к изменению качества исходных данных. Интерактивная визуализация результатов реализована на основе картографической платформы OpenStreetMap. Приведены примеры агрегации экспертных оценок в формате <em>Z</em>-чисел, а также описана методика адаптации функций уверенности системы на основе исторических данных.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Рустам Арифович Бурнашев, Ярослав Владиславович Сергеев https://rdl-journal.ru/article/view/960 Нормализация текста, распознанного при помощи технологии оптического распознавания символов, с использованием легковесных LLM 2025-11-27T14:03:00+03:00 Владислав Константинович Вершинин vershinin@itmo.ru Иван Владимирович Ходненко Ivan.Khodnenko@itmo.ru Сергей Владимирович Иванов svivanov@itmo.ru <p>Несмотря на значительный прогресс, технологии оптического распознавания символов (OCR) для исторических газет по-прежнему допускают 5–10% ошибок на уровне символов. В работе представлена полностью автоматизированная система нормализации пост-OCR, объединяющая легкие языковые модели (LLM) объемом 7–8 млрд параметров, обученные по инструкциям и квантизованные до 4 бит (INT4), с небольшим набором регулярных выражений. На наборе данных BLN600 (600 страниц британских газет XIX в.) лучшая модель YandexGPT-5-Instruct Q4 снижает Character Error Rate (CER) с 8.4% до 4.0% (–52.5%) и Word Error Rate (WER) с 20.2% до 6.5% (–67.8%), повышая при этом семантическое сходство до 0.962. Система работает на потребительском оборудовании (RTX-4060 Ti, 8 ГБ VRAM) со скоростью около 35 секунд на страницу и не требует дополнительного обучения или параллельных данных. Полученные результаты показывают, что компактные INT4-LLM являются практичной альтернативой крупным моделям для постобработки OCR исторических документов.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Владислав Константинович Вершинин, Сергей Владимирович Иванов, Иван Владимирович Ходненко https://rdl-journal.ru/article/view/961 Цифровое моделирование тематического поля изучения культурной конгруэнтности в психологическом контексте 2025-11-27T14:03:47+03:00 Айсылу Мунавировна Ганиева ganieva.aisylu@mail.ru <p>В работе установлены ключевые темы в современных психологических исследованиях культурной конгруэнтности с использованием метода тематического цифрового моделирования массива научных публикаций.</p> <p>Актуальность и значимость проведенного исследования обусловлены <br />ростом значимости культурной конгруэнтности в условиях цифровой трансформации общества, изменяющей способы социализации и взаимодействия. Современные технологии требуют переосмысления психологических механизмов адаптации индивида к культурной среде, особенно в детском и подростковом возрастах. Несмотря на активное изучение этого феномена, наблюдается очевидный недостаток исследований, посвященных культурной конгруэнтности взрослых. Применение цифрового моделирования и искусственного интеллекта позволяет систематизировать знания и выявить структуру тематического поля с высокой точностью. Полученные данные открывают перспективу для дальнейшего изучения культурной конгруэнтности в ходе онтогенеза.</p> <p>Конструирование тематического поля исследований культурной конгруэнтности, основанный на анализе цифровых анналов, содержащих коллекцию научных публикаций по данной тематике (112 статей), был выполнен с использованием алгоритма тематического моделирования (topic modeling) на языке программирования Python и с применением цифровых платформ, включая инструменты на основе мультимодальных нейросетей (GigaChat, Qwen, DeepSeek). В результате проведенного анализа возрастных особенностей феномена культурной <br />конгруэнтности выделены четыре возрастные группы: дошкольники, младшие школьники, подростки и взрослые.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Айсылу Мунавировна Ганиева https://rdl-journal.ru/article/view/962 Автоматическое извлечение аргументативных отношений из текстов научной коммуникации 2025-11-27T14:04:27+03:00 Юрий Алексеевич Загорулько zagor@iis.nsk.su Елена Анатольевна Сидорова lsidorova@iis.nsk.su Ирина Равильевна Ахмадеева i.r.akhmadeeva@iis.nsk.su <p>Сложность задачи извлечения аргументативных структур связана с такими проблемами, как выделение аргументативных сегментов, прогнозирование дальних связей между неконтактными сегментами, обучение на данных, размеченных с низкой степенью согласованности между аннотаторами. В настоящей работе рассмотрен подход к извлечению аргументативных отношений из достаточно больших текстов, относящихся к области научной коммуникации. Проведен сравнительный анализ методов тонкой настройки с использованием предобученной языковой модели типа Longformer, позволяющей учитывать длинные контексты, и двух методов, позволяющих учитывать расхождения аннотаторов в разметке аргументов за счет использования так называемых мягких меток, полученных путем равномерного сглаживания меток и усреднения экспертных оценок. Эксперименты проводились на четырех наборах данных, содержащих положительные и отрицательные примеры пар утверждений (посылка, заключение) и различающихся способами сегментации и средним размером текста. Наилучшие результаты получены на модели с усреднением экспертных оценок. В то же время отмечено, что модель, использующая сглаженные метки, также повышает точность классификаторов, но ухудшает полноту.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Юрий Алексеевич Загорулько, Елена Анатольевна Сидорова, Ирина Равильевна Ахмадеева https://rdl-journal.ru/article/view/963 Нейросимволический подход к дополненной генерации текста на основе автоматизированной индукции морфотактических правил 2025-11-27T14:05:30+03:00 Марат Вильданович Исангулов marathon.our@gmail.com Александр Михайлович Елизаров amelizarov@gmail.com Айгиз Ражапович Кунафин aigizk@gmail.com Айрат Рафизович Гатиатуллин ayrat.gatiatullin@gmail.com Николай Аркадиевич Прокопьев nikolai.prokopyev@gmail.com <p>Представлен гибридный нейросимволический метод, который объединяет большую языковую модель (LLM) и конечный автомат (FST) для обеспечения морфологической корректности при генерации текста на агглютинативных языках. <br />Система автоматически извлекает правила из корпусных данных: для локальных примеров словоформ LLM формирует цепочки морфологического разбора, которые затем агрегируются и упорядочиваются в компактные описания правил морфотактики (LEXC) и выбора алломорфов (regex). На этапе генерации LLM и FST работают совместно: если токен не распознается автоматом, LLM извлекает из контекста пару «лемма + теги», а FST реализует корректную поверхностную форму. В качестве набора данных использован корпус художественной литературы (~1600 предложений). Для списка из 50 существительных извлечено 250 словоформ. По предложенному алгоритму LLM сгенерировала 110 контекстных regex-правил вместе с LEXC-морфотактикой, на основе чего был скомпилирован FST, распознавший 170/250 форм (~70%). В прикладном тесте машинного перевода на подкорпусе из 300 предложений интеграция данного FST в цикл LLM повысила качество с BLEU 16.14 / ChrF 45.13 до BLEU 25.71 / ChrF 50.87 без дообучения переводчика. Подход применим к иным частям речи и другим агглютинативным и малоресурсным языкам, где он может быть использован для наполнения словарных и грамматических ресурсов.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Марат Вильданович Исангулов, Александр Михайлович Елизаров, Айгиз Ражапович Кунафин, Айрат Рафизович Гатиатуллин, Николай Аркадиевич Прокопьев https://rdl-journal.ru/article/view/964 Оценка неопределенности в трансформерных цепях на основе принципа согласованности эффективной информации 2025-11-27T14:06:16+03:00 Анатолий Анатольевич Красновский a.a.krasnovsky@gmail.com <p>Механистическая интерпретируемость позволяет выявлять функциональные подграфы в больших языковых моделях (LLM), известные как трансформерные цепи (Transformer Circuits, TC), которые реализуют конкретные алгоритмы. Однако отсутствует формальный способ, позволяющий за один проход количественно оценить, когда активная цепь ведет себя согласованно и, следовательно, ее состояние может быть признано корректным. Опираясь на ранее предложенную автором пучково‑теоретическую формализацию причинной эмерджентности (Krasnovsky, 2025), мы специализируем ее для трансформерных цепей и вводим безразмерную однопроходную оценку согласованности эффективной информации (Effective Information Consistency Score, EICS). EICS сочетает нормализованную несогласованность пучка, вычисляемую из локальных якобианов и активаций, с гауссовским прокси EI для причинной эмерджентности на уровне цепи, полученным из того же состояния прямого прохода. Такая конструкция является прозрачной (white‑box), однопроходной и делает единицы измерения явными, так что оценка безразмерна. Представлены практические рекомендации по интерпретации оценки, учету вычислительных затрат (с быстрыми и точными режимами) и анализ простейшего примера для проверки на адекватность.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Анатолий Анатольевич Красновский https://rdl-journal.ru/article/view/965 Абстрактивная суммаризация новостей внешней торговли на основе нового специализированного корпуса данных 2025-11-27T14:07:09+03:00 Дарья Андреевна Лютова lyutovad@gmail.com Валентин Андреевич Малых valentin.malykh@phystech.edu <p>Представлен TradeNewsSum — корпус для абстрактивной генерации аннотаций к новостям внешней торговли, охватывающий русско- и англоязычные публикации из профильных источников. Все рефераты подготовлены вручную по унифицированным правилам. Проведены эксперименты с дообучением трансформерных и seq2seq-моделей и автоматическую оценку по схеме LLM-as-a-judge. Наилучшие результаты показала LLaMA 3.1 в режиме инструкционного промптинга, продемонстрировав высокие значения по метрикам, включая фактологическую полноту.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Дарья Андреевна Лютова, Валентин Андреевич Малых https://rdl-journal.ru/article/view/966 Исследование квантования больших языковых моделей: оценка эффективности с акцентом на русскоязычные задачи 2025-11-27T14:07:52+03:00 Дмитрий Романович Пойманов poimanovdr@my.msu.ru Михаил Сергеевич Шутов mihailshutov105@gmail.com <p>Квантование стало ключевой техникой сжатия и ускорения больших языковых моделей (LLM). Несмотря на то, что исследования низкобитного квантования активно развиваются применительно к англоязычным LLM, его влияние на морфологически богатые и разнородные по ресурсам языки, включая русский, остается изученным значительно хуже. Поэтому требуются дополнительные исследования этого вопроса в связи с развитием высокоэффективных русскоязычных и многоязычных LLM.</p> <p>Мы провели систематическое исследование квантования предобученных моделей в эффективные 2.0—4.25 бита на параметр для современных русскоязычных LLM различного масштаба от 4 до 32 млрд параметров (4 B и 32 B). Экспериментальная часть охватывает как стандартное равномерное квантование, так и специализированные низкобитные форматы. Полученные результаты выявили несколько ключевых тенденций: i) устойчивость русскоязычных LLM к квантованию варьируется в зависимости от архитектуры и размера модели; ii) 4-битное квантование демонстрирует высокую надежность, особенно при использовании продвинутых форматов; iii) 3-битное и 2-битное квантования оказались наиболее чувствительными к указанным калибровки. Полученные эмпирические данные демонстрируют необходимость учета домена модели при использовании различных методов квантования.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Дмитрий Романович Пойманов, Михаил Сергеевич Шутов https://rdl-journal.ru/article/view/967 Сокрытие в смысле: семантическое кодирование для генеративно-текстовой стеганографии 2025-11-27T14:08:53+03:00 Олег Юрьевич Рогов rogov@airi.net Дмитрий Евгеньевич Инденбом indenbom.de@phystech.edu Дмитрий Сергеевич Корж korzh@airi.net Дарья Валерьевна Пугачёва Daria.Pugacheva@skoltech.ru Всеволод Александрович Воронов v-vor@yandex.ru Елена Викторовна Тутубалина tutubalina@airi.net <p>В статье предложена новая система для генерации стеганографического текста, скрывающая двоичные сообщения в семантически связном естественном языке с помощью скрытого пространства, обусловливающего большие языковые модели (LLM). Секретные сообщения сначала кодируются в непрерывные векторы с помощью обученного отображения двоичного кода в скрытое пространство, которое используется для управления генерацией текста посредством донастройки префикса. В отличие от предыдущих методов стеганографии на уровне токенов или синтаксиса, наш метод позволяет избежать явной манипуляции словами и вместо этого работает полностью в скрытом семантическом пространстве, что обеспечивает более плавные и менее заметные результаты. На стороне получателя скрытое представление восстанавливается из сгенерированного текста и декодируется обратно в исходное сообщение. <br />В качестве ключевого теоретического вклада мы предоставляем гарантию надежности: если восстановленный скрытый вектор находится в пределах ограниченного расстояния от изначального, обеспечивается точное восстановление сообщения, причем граница определяется константой Липшица декодера и минимальным отступом логитов. Этот формальный результат предлагает принципиальный подход к компромиссу между надежностью и емкостью в скрытых стеганографических системах. Эмпирическая оценка как на синтетических данных, так и в практических предметных областях, таких как отзывы на Amazon, показывает, что наш метод достигает высокой точности восстановления сообщений (выше 91%), высокую плавность текста и конкурентоспособную емкость до 6 бит на элемент предложения, сохраняя при этом устойчивость к нейронному стегоанализу. Эти результаты демонстрируют, что генерация со скрытым условием предлагает безопасный и практичный путь для встраивания информации в современные LLM.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Олег Юрьевич Рогов, Дмитрий Евгеньевич Инденбом, Дмитрий Сергеевич Корж, Дарья Валерьевна Пугачёва, Всеволод Александрович Воронов, Елена Викторовна Тутубалина https://rdl-journal.ru/article/view/968 Условная генерация электрокардиограмм с помощью иерархических вариационных автокодировщиков 2025-11-27T14:09:45+03:00 Иван Анатольевич Свиридов ianatosviridov@sberbank.ru Константин Сергеевич Егоров Egorov.K.Ser@sberbank.ru <p>Сердечно-сосудистые заболевания являются одной из основных причин смертности. Автоматический анализ электрокардиограмм (ЭКГ) может существенно облегчить работу врачей, но его эффективность ограничена нехваткой и несбалансированностью данных. Создание синтетических ЭКГ помогает частично решить эти проблемы. Хотя чаще всего для этого применяются генеративно-состязательные сети (GAN), но последние исследования показали, что вариационные автокодировщики (VAE) могут обеспечивать сопоставимое качество.</p> <p>В работе представлена модель cNVAE-ECG — модификация Nouveau VAE (NVAE), способная генерировать 12 отведений 10-секундных ЭКГ с различными патологиями. Используя компактную схему работы с каналами и встроенные представления классов для условной генерации, cNVAE-ECG улучшает результаты в задачах бинарной и multi-label классификации, обеспечивая прирост метрики AUROC до 2% по сравнению с моделями на основе GAN. Модель представлена в открытом доступе: https://github.com/univanxx/cNVAE_ECG.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Иван Анатольевич Свиридов, Константин Сергеевич Егоров https://rdl-journal.ru/article/view/969 Где находятся лучшие признаки? Послойный анализ слоев трансформера для эффективной классификации эндоскопических изображений 2025-11-27T14:10:30+03:00 Ахмад Таха a.taha@innopolis.university Рустам А. Лукманов r.lukmanov@innopolis.university <p>В поисках путей развития медицинского искусственного интеллекта показано, что предварительно обученный Vision Transformer с линейным классификатором может достигать высокой и конкурентоспособной производительности в классификации эндоскопических изображений. Представлен систематический послойный анализ, который выявляет источник наиболее важных признаков, оспаривая общепринятую эвристику использования только последнего слоя. Установлен отчетливый феномен «пика перед концом», когда поздне-промежуточный слой предлагает более обобщаемое представление для последующей медицинской задачи. На стандартных наборах данных Kvasir и HyperKvasir предложенный подход с малым количеством параметров не только получить достаточно высокую точность, но и значительно сокращает вычислительные затраты. Полученные работы могут быть рекомендованы в качестве практического руководства по эффективному использованию признаков общих базовых моделей в клинических условиях.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Ахмад Таха, Рустам А. Лукманов https://rdl-journal.ru/article/view/970 Ядро верифицируемой объяснимости: гибридная архитектура GD-ANFIS/SHAP для XAI 2.0 2025-11-27T14:11:29+03:00 Юрий Владиславович Трофимов ura_trofim@bk.ru Александр Дмитриевич Лебедев lebedev0lexander@gmail.com Андрей Сергеевич Ильин a.ilin@innopolis.university Алексей Николаевич Аверкин averkin2003@inbox.ru <p>Предложена гибридная архитектура Explainable AI, совмещающая полностью дифференцируемую нейро-нечеткую модель GD-ANFIS и пост-хок метод SHAP. Интеграция выполнена с целью реализации принципов XAI 2.0, требующих одновременной прозрачности, проверяемости и адаптивности объяснений.</p> <p>GD-ANFIS формирует человеческо-читаемые правила типа Такаги – Сугено, обеспечивая структурную интерпретируемость, тогда как SHAP вычисляет количественные вклады признаков по теории Шепли. Для объединения этих слоев разработан механизм компаративного аудита: он автоматически сопоставляет наборы ключевых признаков, проверяет совпадение направлений их влияния и анализирует согласованность между числовыми оценками SHAP и лингвистическими правилами GD-ANFIS. Такой двухконтурный контроль повышает доверие к выводам модели и позволяет оперативно выявлять потенциальные расхождения.</p> <p>Эффективность подхода подтверждена экспериментами на четырех разнородных наборах данных. В медицинской задаче классификации Breast Cancer Wisconsin достигнута точность 0.982; в задаче глобального картирования просадок грунта — 0.89. В регрессионных тестах на Boston Housing и мониторинге качества поверхностных вод получены RMSE 2.30 и 2.36 соответственно при полном сохранении интерпретируемости. Во всех случаях пересечение топ-признаков в объяснениях двух методов составляло не менее 60%, что демонстрирует высокую согласованность структурных и числовых трактовок.</p> <p>Предложенная архитектура формирует практическую основу для ответственного внедрения XAI 2.0 в критически важных областях — от медицины и экологии до геоинформационных систем и финансового сектора.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Юрий Владиславович Трофимов, Александр Дмитриевич Лебедев, Андрей Сергеевич Ильин, Алексей Николаевич Аверкин https://rdl-journal.ru/article/view/971 Искусственный интеллект в решении проблемы онкопрофилактики: ретроспективное исследование 2025-11-27T14:12:14+03:00 Петр Александрович Филоненко petr-filonenko@mail.ru Владимир Николаевич Кох kokh.v.n@sber.ru Павел Дмитриевич Блинов blinov.p.d@sber.ru <p>Исследована возможность эффективного решения задачи популяционной онкопрофилактики с помощью методов искусственного интеллекта (ИИ), прогнозирующих риск злокачественных новообразований (ЗНО) на основе минимального набора данных из электронной медицинской карты (ЭМК) – кодов медицинских диагнозов и услуг. Для решения поставленной задачи рассмотрен широкий спектр современных подходов, включающих методы классического машинного обучения, анализа выживаемости, глубокого обучения и больших языковых моделей (LLM). Численные эксперименты показали, что наилучшей способностью ранжирования пациентов по уровню риска ЗНО обладает градиентный бустинг, использующий модели анализа выживаемости в качестве дополнительных предикторов, что позволяет учитывать как популяционные, так и индивидуальные факторы риска ЗНО. Из данных ЭМК были сконструированы предикторы, включающие демографические характеристики, паттерны обращений за медицинской помощью и клинические маркеры. Это решение было протестировано в ретроспективных экспериментах под контролем профильных врачей-онкологов. В ретроспективном эксперименте с участием более 1.9 млн пациентов установлено, что в группу риска попадает до 5.4 раза больше пациентов с ЗНО при том же уровне медицинских обследований. Предложенный метод представляет собой масштабируемое решение, использующее исключительно коды диагнозов и услуг, не требующее специализированной инфраструктуры и интегрируемое в процесс онконастороженности, что делает его применимым для решения задач популяционной онкопрофилактики.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Петр Александрович Филоненко, Владимир Николаевич Кох, Павел Дмитриевич Блинов https://rdl-journal.ru/article/view/972 Стилометрический анализ в задаче поиска заимствований текстов на татарском языке 2025-11-27T14:13:11+03:00 Изида Зуфаровна Хаялеева izidakh@yandex.ru Михаил Михайлович Абрамский mabramsk@kpfu.ru <p>Рассмотрена возможность применения методов стилометрического анализа для поиска заимствований в текстах на татарском языке. Разработаны соответствующие инструменты, в которых использованы алгоритмы машинного обучения, включая кластеризацию (метод <em>k</em>-средних), классификацию (метод случайного леса, метод опорных векторов, наивный байесовский классификатор) и гибридный подход (модель FastText + логистическая регрессия). Особое внимание уделено адаптации лингвистических метрик для татарского языка.</p> 2025-12-04T00:00:00+03:00 Copyright (c) 2025 Изида Зуфаровна Хаялеева, Михаил Михайлович Абрамский