https://rdl-journal.ru/issue/feedЭлектронные библиотеки2025-12-04T17:30:14+03:00Редакция журнала «Электронные Библиотеки»ljmeditor@gmail.comOpen Journal Systems<div id="journalDescription"> <p><strong>Дорогой посетитель!</strong></p> <p>Вы находитесь на сайте электронного научного журнала «Электронные библиотеки», посвященного оперативному отражению новых результатов теории и практики использования в России и за рубежом электронных библиотек – распределенных информационных систем, позволяющих обрабатывать, хранить, распространять, анализировать и организовывать поиск в разнообразных коллекциях электронных документов (текст, графика, аудио, видео и др.) через глобальные сети передачи данных. Журнал нацелен на формирование российского сообщества учёных, развивающих названное научное направление, и является в настоящее время единственным российским изданием, последовательно и систематически освещающим наиболее актуальные вопросы, связанные с развитием технологий электронных библиотек, которые в настоящее время становятся всё более существенными для совершенствования стандартов науки, экономики, образования, здравоохранения и качества жизни вообще. Научные электронные библиотеки играют важную роль в реализации активно поддерживаемых научным сообществом инициатив открытого доступа к результатам исследований, формировании открытой науки и глобальных репозиториев представления знаний и данных. Материалы журнала направлены на формирование российского сообщества ученых, экспертов и практиков, целенаправленно занимающимися вопросами использования технологий электронных библиотек для социально-экономического развития.</p> <p>Аудитория журнала включает широкий круг специалистов в сфере создания и использования информационно-коммуникационных технологий; ученых и исследователей; работников сфер образования и культуры; частных лиц, интересующихся проблемами развития современного информационного общества. Материалы, публикуемые в журнале, проходят строгую процедуру рецензирования и экспертного отбора.</p> </div>https://rdl-journal.ru/article/view/958Интеллектуальный робот-химик: на пути к автономной лаборатории2025-11-27T14:00:48+03:00Муса Шамильевич Адыгамовmusa20930@gmail.comАнтон Олегович Голубьtoxa.mix7@gmail.comЭмиль Ринатович Сайфуллинmr.emilsr@gmail.comТимур Рустемович ГимадиевTimur.Gimadiev@gmail.comНикита Юрьевич СеровSerov.Nikita@gmail.com<p>Представлена программно-аппаратная платформа, которая позволяет проводить химические синтезы в автоматическом режиме, включая приготовление реакционных смесей, их нагрев и перемешивание, а также отбор проб с разбавлением после синтеза и отправку на анализ методом высокоэффективной жидкостной хроматографии с последующей автоматической обработкой результатов. Для управления отдельными элементами роботизированной установки создана собственная библиотека ChemBot на языке Python, а для управления всей системой – клиентский веб-сервер; для просмотра состояния установки и хода выполнения синтезов разработан веб-интерфейс. Работа всей платформы по выполнению экспериментов протестирована при выполнении синтезов по альдольной конденсации, где варьировались соотношение реагентов, катализатор и его количество, температура и время синтеза. Написание собственного кода для контроля и управления всей системой стало важным шагом на пути интеграции роботизированной установки и искусственного интеллекта (ИИ), что в перспективе позволит осуществить переход к автономной лаборатории, когда предсказание целевой молекулы и ее синтеза, экспериментальное осуществление и анализ, а также, при необходимости, уточнение или изменение использованной модели будут осуществляться в автоматическом режиме, без вмешательства человека.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Муса Шамильевич Адыгамов, Антон Олегович Голубь, Эмиль Ринатович Сайфуллин, Тимур Рустемович Гимадиев, Никита Юрьевич Серовhttps://rdl-journal.ru/article/view/959Проектирование динамической экспертной системы по анализу влияния климатических воздействий на малые и средние предприятия 2025-11-27T14:02:03+03:00Рустам Арифович Бурнашевr.burnashev@inbox.ruЯрослав Владиславович Сергеевsergeevyarik7@yandex.ru<p>Растущая нестабильность климата создает новые вызовы и риски для устойчивости малых и средних предприятий. В работе предложена архитектура прототипа динамической экспертной системы, интегрирующей несколько ключевых модулей: пользовательский интерфейс, базу знаний, серверное приложение и модуль динамического обновления данных с API-интерфейсами реального времени. Особенностью системы является применение аппарата <em>Z</em>⁺-чисел, реализованного на основе программной библиотеки scikit-fuzzy, что позволяет учитывать градуированную уверенность в оценках. Этот подход дает более обоснованные и адаптивные оценки рисков, чувствительные к изменению качества исходных данных. Интерактивная визуализация результатов реализована на основе картографической платформы OpenStreetMap. Приведены примеры агрегации экспертных оценок в формате <em>Z</em>-чисел, а также описана методика адаптации функций уверенности системы на основе исторических данных.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Рустам Арифович Бурнашев, Ярослав Владиславович Сергеевhttps://rdl-journal.ru/article/view/960Нормализация текста, распознанного при помощи технологии оптического распознавания символов, с использованием легковесных LLM2025-11-27T14:03:00+03:00Владислав Константинович Вершининvershinin@itmo.ruИван Владимирович ХодненкоIvan.Khodnenko@itmo.ruСергей Владимирович Ивановsvivanov@itmo.ru<p>Несмотря на значительный прогресс, технологии оптического распознавания символов (OCR) для исторических газет по-прежнему допускают 5–10% ошибок на уровне символов. В работе представлена полностью автоматизированная система нормализации пост-OCR, объединяющая легкие языковые модели (LLM) объемом 7–8 млрд параметров, обученные по инструкциям и квантизованные до 4 бит (INT4), с небольшим набором регулярных выражений. На наборе данных BLN600 (600 страниц британских газет XIX в.) лучшая модель YandexGPT-5-Instruct Q4 снижает Character Error Rate (CER) с 8.4% до 4.0% (–52.5%) и Word Error Rate (WER) с 20.2% до 6.5% (–67.8%), повышая при этом семантическое сходство до 0.962. Система работает на потребительском оборудовании (RTX-4060 Ti, 8 ГБ VRAM) со скоростью около 35 секунд на страницу и не требует дополнительного обучения или параллельных данных. Полученные результаты показывают, что компактные INT4-LLM являются практичной альтернативой крупным моделям для постобработки OCR исторических документов.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Владислав Константинович Вершинин, Сергей Владимирович Иванов, Иван Владимирович Ходненкоhttps://rdl-journal.ru/article/view/961Цифровое моделирование тематического поля изучения культурной конгруэнтности в психологическом контексте 2025-11-27T14:03:47+03:00Айсылу Мунавировна Ганиеваganieva.aisylu@mail.ru<p>В работе установлены ключевые темы в современных психологических исследованиях культурной конгруэнтности с использованием метода тематического цифрового моделирования массива научных публикаций.</p> <p>Актуальность и значимость проведенного исследования обусловлены <br />ростом значимости культурной конгруэнтности в условиях цифровой трансформации общества, изменяющей способы социализации и взаимодействия. Современные технологии требуют переосмысления психологических механизмов адаптации индивида к культурной среде, особенно в детском и подростковом возрастах. Несмотря на активное изучение этого феномена, наблюдается очевидный недостаток исследований, посвященных культурной конгруэнтности взрослых. Применение цифрового моделирования и искусственного интеллекта позволяет систематизировать знания и выявить структуру тематического поля с высокой точностью. Полученные данные открывают перспективу для дальнейшего изучения культурной конгруэнтности в ходе онтогенеза.</p> <p>Конструирование тематического поля исследований культурной конгруэнтности, основанный на анализе цифровых анналов, содержащих коллекцию научных публикаций по данной тематике (112 статей), был выполнен с использованием алгоритма тематического моделирования (topic modeling) на языке программирования Python и с применением цифровых платформ, включая инструменты на основе мультимодальных нейросетей (GigaChat, Qwen, DeepSeek). В результате проведенного анализа возрастных особенностей феномена культурной <br />конгруэнтности выделены четыре возрастные группы: дошкольники, младшие школьники, подростки и взрослые.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Айсылу Мунавировна Ганиеваhttps://rdl-journal.ru/article/view/962Автоматическое извлечение аргументативных отношений из текстов научной коммуникации2025-11-27T14:04:27+03:00Юрий Алексеевич Загорулькоzagor@iis.nsk.suЕлена Анатольевна Сидороваlsidorova@iis.nsk.suИрина Равильевна Ахмадееваi.r.akhmadeeva@iis.nsk.su<p>Сложность задачи извлечения аргументативных структур связана с такими проблемами, как выделение аргументативных сегментов, прогнозирование дальних связей между неконтактными сегментами, обучение на данных, размеченных с низкой степенью согласованности между аннотаторами. В настоящей работе рассмотрен подход к извлечению аргументативных отношений из достаточно больших текстов, относящихся к области научной коммуникации. Проведен сравнительный анализ методов тонкой настройки с использованием предобученной языковой модели типа Longformer, позволяющей учитывать длинные контексты, и двух методов, позволяющих учитывать расхождения аннотаторов в разметке аргументов за счет использования так называемых мягких меток, полученных путем равномерного сглаживания меток и усреднения экспертных оценок. Эксперименты проводились на четырех наборах данных, содержащих положительные и отрицательные примеры пар утверждений (посылка, заключение) и различающихся способами сегментации и средним размером текста. Наилучшие результаты получены на модели с усреднением экспертных оценок. В то же время отмечено, что модель, использующая сглаженные метки, также повышает точность классификаторов, но ухудшает полноту.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Юрий Алексеевич Загорулько, Елена Анатольевна Сидорова, Ирина Равильевна Ахмадееваhttps://rdl-journal.ru/article/view/963Нейросимволический подход к дополненной генерации текста на основе автоматизированной индукции морфотактических правил2025-11-27T14:05:30+03:00Марат Вильданович Исангуловmarathon.our@gmail.comАлександр Михайлович Елизаровamelizarov@gmail.comАйгиз Ражапович Кунафинaigizk@gmail.comАйрат Рафизович Гатиатуллинayrat.gatiatullin@gmail.comНиколай Аркадиевич Прокопьевnikolai.prokopyev@gmail.com<p>Представлен гибридный нейросимволический метод, который объединяет большую языковую модель (LLM) и конечный автомат (FST) для обеспечения морфологической корректности при генерации текста на агглютинативных языках. <br />Система автоматически извлекает правила из корпусных данных: для локальных примеров словоформ LLM формирует цепочки морфологического разбора, которые затем агрегируются и упорядочиваются в компактные описания правил морфотактики (LEXC) и выбора алломорфов (regex). На этапе генерации LLM и FST работают совместно: если токен не распознается автоматом, LLM извлекает из контекста пару «лемма + теги», а FST реализует корректную поверхностную форму. В качестве набора данных использован корпус художественной литературы (~1600 предложений). Для списка из 50 существительных извлечено 250 словоформ. По предложенному алгоритму LLM сгенерировала 110 контекстных regex-правил вместе с LEXC-морфотактикой, на основе чего был скомпилирован FST, распознавший 170/250 форм (~70%). В прикладном тесте машинного перевода на подкорпусе из 300 предложений интеграция данного FST в цикл LLM повысила качество с BLEU 16.14 / ChrF 45.13 до BLEU 25.71 / ChrF 50.87 без дообучения переводчика. Подход применим к иным частям речи и другим агглютинативным и малоресурсным языкам, где он может быть использован для наполнения словарных и грамматических ресурсов.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Марат Вильданович Исангулов, Александр Михайлович Елизаров, Айгиз Ражапович Кунафин, Айрат Рафизович Гатиатуллин, Николай Аркадиевич Прокопьевhttps://rdl-journal.ru/article/view/964Оценка неопределенности в трансформерных цепях на основе принципа согласованности эффективной информации 2025-11-27T14:06:16+03:00Анатолий Анатольевич Красновскийa.a.krasnovsky@gmail.com<p>Механистическая интерпретируемость позволяет выявлять функциональные подграфы в больших языковых моделях (LLM), известные как трансформерные цепи (Transformer Circuits, TC), которые реализуют конкретные алгоритмы. Однако отсутствует формальный способ, позволяющий за один проход количественно оценить, когда активная цепь ведет себя согласованно и, следовательно, ее состояние может быть признано корректным. Опираясь на ранее предложенную автором пучково‑теоретическую формализацию причинной эмерджентности (Krasnovsky, 2025), мы специализируем ее для трансформерных цепей и вводим безразмерную однопроходную оценку согласованности эффективной информации (Effective Information Consistency Score, EICS). EICS сочетает нормализованную несогласованность пучка, вычисляемую из локальных якобианов и активаций, с гауссовским прокси EI для причинной эмерджентности на уровне цепи, полученным из того же состояния прямого прохода. Такая конструкция является прозрачной (white‑box), однопроходной и делает единицы измерения явными, так что оценка безразмерна. Представлены практические рекомендации по интерпретации оценки, учету вычислительных затрат (с быстрыми и точными режимами) и анализ простейшего примера для проверки на адекватность.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Анатолий Анатольевич Красновскийhttps://rdl-journal.ru/article/view/965Абстрактивная суммаризация новостей внешней торговли на основе нового специализированного корпуса данных 2025-11-27T14:07:09+03:00Дарья Андреевна Лютоваlyutovad@gmail.comВалентин Андреевич Малыхvalentin.malykh@phystech.edu<p>Представлен TradeNewsSum — корпус для абстрактивной генерации аннотаций к новостям внешней торговли, охватывающий русско- и англоязычные публикации из профильных источников. Все рефераты подготовлены вручную по унифицированным правилам. Проведены эксперименты с дообучением трансформерных и seq2seq-моделей и автоматическую оценку по схеме LLM-as-a-judge. Наилучшие результаты показала LLaMA 3.1 в режиме инструкционного промптинга, продемонстрировав высокие значения по метрикам, включая фактологическую полноту.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Дарья Андреевна Лютова, Валентин Андреевич Малыхhttps://rdl-journal.ru/article/view/966Исследование квантования больших языковых моделей: оценка эффективности с акцентом на русскоязычные задачи 2025-11-27T14:07:52+03:00Дмитрий Романович Поймановpoimanovdr@my.msu.ruМихаил Сергеевич Шутовmihailshutov105@gmail.com<p>Квантование стало ключевой техникой сжатия и ускорения больших языковых моделей (LLM). Несмотря на то, что исследования низкобитного квантования активно развиваются применительно к англоязычным LLM, его влияние на морфологически богатые и разнородные по ресурсам языки, включая русский, остается изученным значительно хуже. Поэтому требуются дополнительные исследования этого вопроса в связи с развитием высокоэффективных русскоязычных и многоязычных LLM.</p> <p>Мы провели систематическое исследование квантования предобученных моделей в эффективные 2.0—4.25 бита на параметр для современных русскоязычных LLM различного масштаба от 4 до 32 млрд параметров (4 B и 32 B). Экспериментальная часть охватывает как стандартное равномерное квантование, так и специализированные низкобитные форматы. Полученные результаты выявили несколько ключевых тенденций: i) устойчивость русскоязычных LLM к квантованию варьируется в зависимости от архитектуры и размера модели; ii) 4-битное квантование демонстрирует высокую надежность, особенно при использовании продвинутых форматов; iii) 3-битное и 2-битное квантования оказались наиболее чувствительными к указанным калибровки. Полученные эмпирические данные демонстрируют необходимость учета домена модели при использовании различных методов квантования.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Дмитрий Романович Пойманов, Михаил Сергеевич Шутовhttps://rdl-journal.ru/article/view/967Сокрытие в смысле: семантическое кодирование для генеративно-текстовой стеганографии2025-11-27T14:08:53+03:00Олег Юрьевич Роговrogov@airi.netДмитрий Евгеньевич Инденбомindenbom.de@phystech.eduДмитрий Сергеевич Коржkorzh@airi.netДарья Валерьевна ПугачёваDaria.Pugacheva@skoltech.ruВсеволод Александрович Вороновv-vor@yandex.ruЕлена Викторовна Тутубалинаtutubalina@airi.net<p>В статье предложена новая система для генерации стеганографического текста, скрывающая двоичные сообщения в семантически связном естественном языке с помощью скрытого пространства, обусловливающего большие языковые модели (LLM). Секретные сообщения сначала кодируются в непрерывные векторы с помощью обученного отображения двоичного кода в скрытое пространство, которое используется для управления генерацией текста посредством донастройки префикса. В отличие от предыдущих методов стеганографии на уровне токенов или синтаксиса, наш метод позволяет избежать явной манипуляции словами и вместо этого работает полностью в скрытом семантическом пространстве, что обеспечивает более плавные и менее заметные результаты. На стороне получателя скрытое представление восстанавливается из сгенерированного текста и декодируется обратно в исходное сообщение. <br />В качестве ключевого теоретического вклада мы предоставляем гарантию надежности: если восстановленный скрытый вектор находится в пределах ограниченного расстояния от изначального, обеспечивается точное восстановление сообщения, причем граница определяется константой Липшица декодера и минимальным отступом логитов. Этот формальный результат предлагает принципиальный подход к компромиссу между надежностью и емкостью в скрытых стеганографических системах. Эмпирическая оценка как на синтетических данных, так и в практических предметных областях, таких как отзывы на Amazon, показывает, что наш метод достигает высокой точности восстановления сообщений (выше 91%), высокую плавность текста и конкурентоспособную емкость до 6 бит на элемент предложения, сохраняя при этом устойчивость к нейронному стегоанализу. Эти результаты демонстрируют, что генерация со скрытым условием предлагает безопасный и практичный путь для встраивания информации в современные LLM.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Олег Юрьевич Рогов, Дмитрий Евгеньевич Инденбом, Дмитрий Сергеевич Корж, Дарья Валерьевна Пугачёва, Всеволод Александрович Воронов, Елена Викторовна Тутубалинаhttps://rdl-journal.ru/article/view/968Условная генерация электрокардиограмм с помощью иерархических вариационных автокодировщиков2025-11-27T14:09:45+03:00Иван Анатольевич Свиридовianatosviridov@sberbank.ruКонстантин Сергеевич ЕгоровEgorov.K.Ser@sberbank.ru<p>Сердечно-сосудистые заболевания являются одной из основных причин смертности. Автоматический анализ электрокардиограмм (ЭКГ) может существенно облегчить работу врачей, но его эффективность ограничена нехваткой и несбалансированностью данных. Создание синтетических ЭКГ помогает частично решить эти проблемы. Хотя чаще всего для этого применяются генеративно-состязательные сети (GAN), но последние исследования показали, что вариационные автокодировщики (VAE) могут обеспечивать сопоставимое качество.</p> <p>В работе представлена модель cNVAE-ECG — модификация Nouveau VAE (NVAE), способная генерировать 12 отведений 10-секундных ЭКГ с различными патологиями. Используя компактную схему работы с каналами и встроенные представления классов для условной генерации, cNVAE-ECG улучшает результаты в задачах бинарной и multi-label классификации, обеспечивая прирост метрики AUROC до 2% по сравнению с моделями на основе GAN. Модель представлена в открытом доступе: https://github.com/univanxx/cNVAE_ECG.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Иван Анатольевич Свиридов, Константин Сергеевич Егоровhttps://rdl-journal.ru/article/view/969Где находятся лучшие признаки? Послойный анализ слоев трансформера для эффективной классификации эндоскопических изображений2025-11-27T14:10:30+03:00Ахмад Тахаa.taha@innopolis.universityРустам А. Лукмановr.lukmanov@innopolis.university<p>В поисках путей развития медицинского искусственного интеллекта показано, что предварительно обученный Vision Transformer с линейным классификатором может достигать высокой и конкурентоспособной производительности в классификации эндоскопических изображений. Представлен систематический послойный анализ, который выявляет источник наиболее важных признаков, оспаривая общепринятую эвристику использования только последнего слоя. Установлен отчетливый феномен «пика перед концом», когда поздне-промежуточный слой предлагает более обобщаемое представление для последующей медицинской задачи. На стандартных наборах данных Kvasir и HyperKvasir предложенный подход с малым количеством параметров не только получить достаточно высокую точность, но и значительно сокращает вычислительные затраты. Полученные работы могут быть рекомендованы в качестве практического руководства по эффективному использованию признаков общих базовых моделей в клинических условиях.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Ахмад Таха, Рустам А. Лукмановhttps://rdl-journal.ru/article/view/970Ядро верифицируемой объяснимости: гибридная архитектура GD-ANFIS/SHAP для XAI 2.02025-11-27T14:11:29+03:00Юрий Владиславович Трофимовura_trofim@bk.ruАлександр Дмитриевич Лебедевlebedev0lexander@gmail.comАндрей Сергеевич Ильинa.ilin@innopolis.universityАлексей Николаевич Аверкинaverkin2003@inbox.ru<p>Предложена гибридная архитектура Explainable AI, совмещающая полностью дифференцируемую нейро-нечеткую модель GD-ANFIS и пост-хок метод SHAP. Интеграция выполнена с целью реализации принципов XAI 2.0, требующих одновременной прозрачности, проверяемости и адаптивности объяснений.</p> <p>GD-ANFIS формирует человеческо-читаемые правила типа Такаги – Сугено, обеспечивая структурную интерпретируемость, тогда как SHAP вычисляет количественные вклады признаков по теории Шепли. Для объединения этих слоев разработан механизм компаративного аудита: он автоматически сопоставляет наборы ключевых признаков, проверяет совпадение направлений их влияния и анализирует согласованность между числовыми оценками SHAP и лингвистическими правилами GD-ANFIS. Такой двухконтурный контроль повышает доверие к выводам модели и позволяет оперативно выявлять потенциальные расхождения.</p> <p>Эффективность подхода подтверждена экспериментами на четырех разнородных наборах данных. В медицинской задаче классификации Breast Cancer Wisconsin достигнута точность 0.982; в задаче глобального картирования просадок грунта — 0.89. В регрессионных тестах на Boston Housing и мониторинге качества поверхностных вод получены RMSE 2.30 и 2.36 соответственно при полном сохранении интерпретируемости. Во всех случаях пересечение топ-признаков в объяснениях двух методов составляло не менее 60%, что демонстрирует высокую согласованность структурных и числовых трактовок.</p> <p>Предложенная архитектура формирует практическую основу для ответственного внедрения XAI 2.0 в критически важных областях — от медицины и экологии до геоинформационных систем и финансового сектора.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Юрий Владиславович Трофимов, Александр Дмитриевич Лебедев, Андрей Сергеевич Ильин, Алексей Николаевич Аверкинhttps://rdl-journal.ru/article/view/971Искусственный интеллект в решении проблемы онкопрофилактики: ретроспективное исследование2025-11-27T14:12:14+03:00Петр Александрович Филоненкоpetr-filonenko@mail.ruВладимир Николаевич Кохkokh.v.n@sber.ruПавел Дмитриевич Блиновblinov.p.d@sber.ru<p>Исследована возможность эффективного решения задачи популяционной онкопрофилактики с помощью методов искусственного интеллекта (ИИ), прогнозирующих риск злокачественных новообразований (ЗНО) на основе минимального набора данных из электронной медицинской карты (ЭМК) – кодов медицинских диагнозов и услуг. Для решения поставленной задачи рассмотрен широкий спектр современных подходов, включающих методы классического машинного обучения, анализа выживаемости, глубокого обучения и больших языковых моделей (LLM). Численные эксперименты показали, что наилучшей способностью ранжирования пациентов по уровню риска ЗНО обладает градиентный бустинг, использующий модели анализа выживаемости в качестве дополнительных предикторов, что позволяет учитывать как популяционные, так и индивидуальные факторы риска ЗНО. Из данных ЭМК были сконструированы предикторы, включающие демографические характеристики, паттерны обращений за медицинской помощью и клинические маркеры. Это решение было протестировано в ретроспективных экспериментах под контролем профильных врачей-онкологов. В ретроспективном эксперименте с участием более 1.9 млн пациентов установлено, что в группу риска попадает до 5.4 раза больше пациентов с ЗНО при том же уровне медицинских обследований. Предложенный метод представляет собой масштабируемое решение, использующее исключительно коды диагнозов и услуг, не требующее специализированной инфраструктуры и интегрируемое в процесс онконастороженности, что делает его применимым для решения задач популяционной онкопрофилактики.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Петр Александрович Филоненко, Владимир Николаевич Кох, Павел Дмитриевич Блиновhttps://rdl-journal.ru/article/view/972Стилометрический анализ в задаче поиска заимствований текстов на татарском языке2025-11-27T14:13:11+03:00Изида Зуфаровна Хаялееваizidakh@yandex.ruМихаил Михайлович Абрамскийmabramsk@kpfu.ru<p>Рассмотрена возможность применения методов стилометрического анализа для поиска заимствований в текстах на татарском языке. Разработаны соответствующие инструменты, в которых использованы алгоритмы машинного обучения, включая кластеризацию (метод <em>k</em>-средних), классификацию (метод случайного леса, метод опорных векторов, наивный байесовский классификатор) и гибридный подход (модель FastText + логистическая регрессия). Особое внимание уделено адаптации лингвистических метрик для татарского языка.</p>2025-12-04T00:00:00+03:00Copyright (c) 2025 Изида Зуфаровна Хаялеева, Михаил Михайлович Абрамский