• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

«Технология наводящих вопросов» как методика обучения решению геометрических задач на доказательство

Андрей Николаевич Давыдов
556-565
Аннотация: Рассмотрена «технология наводящих вопросов» как методика обучения. Раскрыты содержательные особенности технологии обучения. Рассмотрены педагогические подходы к технологии обучения и компоненты технологии обучения как элементы содержательной структуры. Определены понятия: «наводящий вопрос» и «технология наводящих вопросов». Показан пример применения «технологии наводящих вопросов». Пояснена актуальность технологии обучения для формирования умений решать геометрические задачи на доказательство.
Ключевые слова: геометрия, методика обучения геометрии, доказательство, технология обучения, наводящий вопрос, технология наводящих вопросов.

Детекция галлюцинаций на основе внутренних состояний больших языковых моделей

Тимур Рустемович Айсин, Татьяна Вячеславовна Шамардина
1282-1305
Аннотация:

В последние годы большие языковые модели (Large Language Models, LLM) достигли значительных успехов в области обработки естественного языка и стали ключевым инструментом для решения широкого спектра прикладных и исследовательских задач. Однако с ростом их масштабов и возможностей все более острой становится проблема галлюцинаций – генерации ложной, недостоверной или несуществующей информации, представленной в достоверной форме. В связи с этим вопросы анализа природы галлюцинаций и разработки методов их выявления приобретают особую научную и практическую значимость.


В работе изучен феномен галлюцинаций в больших языковых моделях, рассмотрены их существующая классификация и возможные причины. На базе модели Flan-T5 также исследованы различия внутренних состоянии модели при генерации галлюцинаций и верных ответов. На основе этих расхождений представлены два способа детектирования галлюцинаций: с помощью карт внимания и скрытых состояний модели. Эти методы протестированы на данных из бенчмарков HaluEval и Shroom 2024 в задачах суммаризации, ответов на вопросы, перефразирования, машинного перевода и генерации определений. Кроме того, исследована переносимость обученных детекторов между различными типами галлюцинаций, что позволило оценить универсальность предложенных методов для различных типов задач.

Ключевые слова: большие языковые модели, галлюцинации, детекция, Flan-T5, обработка естественного языка, карты внимания, внутренние состояния, HaluEval, Shroom.

In situ двухдиапазонная 3D-дефектоскопия стенописей архитектурных памятников

Влада Владимировна Кугуракова, Евгений Юрьевич Зыков, Алексей Валерьевич Касимов, Айрат Габитович Ситдиков, Андрей Андреевич Скобелев, Евгения Флюровна Шайхутдинова
538-558
Аннотация: Статья посвящена проблеме создания методики мониторинга состояния и систематизации сведений о фресковой живописи объектов культурного наследия. Проблема может быть решена путем компиляции традиционного метода картографирования фресок с применением современных средств визуализации. Описана новая технология Project Tango для фиксации текстур сложных 3D внутренних объёмов архитектурных памятников. Предложены методика экспресс сканирования с автоматическим картограммированием для дальнейшего сравнительного анализа изменения состояния стенописей и методика оценки процента утраты.
Ключевые слова: дефектоскопия, трехмерная визуализация, Project Tango, инфракрасный датчик, SLAM, SFM, PTAM, Structure from motion, Monocular vision, Stereo vision, архитектурный памятник, объект культурного наследия, мониторинг, картограммирование.

Сокрытие в смысле: семантическое кодирование для генеративно-текстовой стеганографии

Олег Юрьевич Рогов, Дмитрий Евгеньевич Инденбом, Дмитрий Сергеевич Корж, Дарья Валерьевна Пугачёва, Всеволод Александрович Воронов, Елена Викторовна Тутубалина
1165-1185
Аннотация:

В статье предложена новая система для генерации стеганографического текста, скрывающая двоичные сообщения в семантически связном естественном языке с помощью скрытого пространства, обусловливающего большие языковые модели (LLM). Секретные сообщения сначала кодируются в непрерывные векторы с помощью обученного отображения двоичного кода в скрытое пространство, которое используется для управления генерацией текста посредством донастройки префикса. В отличие от предыдущих методов стеганографии на уровне токенов или синтаксиса, наш метод позволяет избежать явной манипуляции словами и вместо этого работает полностью в скрытом семантическом пространстве, что обеспечивает более плавные и менее заметные результаты. На стороне получателя скрытое представление восстанавливается из сгенерированного текста и декодируется обратно в исходное сообщение.
В качестве ключевого теоретического вклада мы предоставляем гарантию надежности: если восстановленный скрытый вектор находится в пределах ограниченного расстояния от изначального, обеспечивается точное восстановление сообщения, причем граница определяется константой Липшица декодера и минимальным отступом логитов. Этот формальный результат предлагает принципиальный подход к компромиссу между надежностью и емкостью в скрытых стеганографических системах. Эмпирическая оценка как на синтетических данных, так и в практических предметных областях, таких как отзывы на Amazon, показывает, что наш метод достигает высокой точности восстановления сообщений (выше 91%), высокую плавность текста и конкурентоспособную емкость до 6 бит на элемент предложения, сохраняя при этом устойчивость к нейронному стегоанализу. Эти результаты демонстрируют, что генерация со скрытым условием предлагает безопасный и практичный путь для встраивания информации в современные LLM.

Ключевые слова: стеганография, семантическое кодирование, языковые модели, донастройка префиксов, граф знаний, генерация естественного языка, скрытое обусловливание, нейронный стегоанализ.

Интеграционные возможности Системы управления электронными библиотеками LibMeta

А.А. Каленкова, В.А. Серебряков
Аннотация: В статье представлена Система управления электронными библиотеками (СУЭБ) LibMeta, предназначенная для интеграции библиотечной и музейной информации. Приводится схема метаданных СУЭБ LibMeta, построенная на базе схемы ЕНИП, она включает основной и библиотечный профили, а также профили для работы с музейными и медиа-объектами. Интеграция метаданных из различных источников может привести к дублированию информации: дается подробный алгоритм интеграции метаданных, который позволяет избежать дублирования мета-описаний.
Ключевые слова: цифровые библиотеки, метаданные, интеграция данных.

Электронные информационные ресурсы библиотеки Пермского государственного гуманитарно-педагогического университета: подписные и собственной генерации

А.В. Костицина
Аннотация: Представлен опыт Пермского государственного гуманитарно-педагогического университета (ПГГПУ) выбора и подключения электронно-библиотечных систем, дана краткая характеристика эффективности использования этого вида информационных ресурсов. Рассказано о создании Электронной библиотеки ПГГПУ, ее целях, задачах, представленных в ней ресурсах, подчёркнута важность отражения интеллектуальных продуктов вуза и организации к ним доступа преподавателей и студентов.
Ключевые слова: библиотеки вузов, электронные библиотечные системы, электронные образовательные ресурсы.

Археологические объекты болгарского городища x–xv вв., как материал для создания виртуальной культурно-исторической реконструкции

Азат Ринатович Хафизов, Вячеслав Сергеевич Баранов, Александр Сергеевич Сергеев, Влада Владимировна Кугуракова, Айрат Габитович Ситдиков
269-282
Аннотация: Описаны общий алгоритм и классификация этапов создания виртуальных культурно-исторических реконструкций. На примере проекта «Болгар XIV» разобраны основные стадии реализации реконструкции, рассмотрены архитектура, бытовое окружение и планировка города; дано общее описание той эпохи. Приведены общие соображения о подходах к созданию виртуальных реконструкций, в том числе правила процедурной генерации территорий.
Ключевые слова: процедурная генерация уровней, генерация контента, виртуальные реконструкции, Великий Болгар, level design.

О лицензионном договоре на издание служебного произведения

Татьяна Алексеевна Полилова
119-141
Аннотация: В соответствии с Гражданским кодексом РФ научное произведение является результатом интеллектуальной деятельности, которому предоставляется государственная охрана. Автору научного произведения (в частности, статьи) принадлежат право авторства, право на имя и иные неимущественные права. Если статья создается в рамках выполнения автором своих служебных обязанностей, исключительное право на служебное произведение принадлежит работодателю.
С согласия работодателя автор заключает с издательством лицензионный договор на опубликование статьи в научном издании на условиях, предложенных издателем. Заключение лицензионного договора не влечет за собой переход исключительного права к издателю. Даже если работодатель поручил автору заключить авторский договор с издателем на условиях исключительной лицензии, работодатель сохраняет за собой право использовать произведение, в том числе, право опубликовать произведение на своем сайте.
За автором (правообладателем) навсегда сохраняется право создавать производные произведения. Нередко навязываемые издателем условия лицензионного договора, ограничивающие право автора создавать произведения на основе ранее опубликованной статьи, ничтожны (т. е. не имеют юридической силы).
Опубликование автором производных произведений, содержащих фрагменты текста из предыдущих статей автора, не должно огульно считаться нарушением издательской этики. Термины «самоплагиат», «автоплагиат» являются некорректными.
В Гражданском кодексе РФ закреплен механизм простых (неисключительных) лицензий, позволяющий нескольким издателям опубликовать статью без ее переработки. Опубликование статьи в нескольких изданиях — это один из законных способов реализации права автора (правообладателя) на широкое обнародование произведения.
Ключевые слова: научная публикация, служебное произведение, исключительное право, лицензионный договор, авторский договор, исключительная лицензия, простая лицензия, производное произведение, повторное использование текста, избыточная публикация.

Онтология по естественным наукам и технологиям ОЕНТ: структура, состав и современное состояние

Б.В. Добров, Н.В. Лукашевич
Аннотация: На основе разумного сочетания трех подходов - традиционных информационно-поисковых тезаурусов, формальных онтологий, ресурсов типа WordNet, разработана лингвистическая онтология по естественным наукам и технологиям ОЕНТ, предназначенной для работы при автоматической обработке текста в разных приложениях обработки информации. ОЕНТ включает в настоящее время более 50 тысяч понятий, более 150 тысяч текстовых входов, 200 тысяч прямых и более двух миллионов наследуемых отношений между понятиями. В статье мы описали структурные особенности ОЕНТ. Широта предметной области и назначение онтологии определяют ряд решений, принятых при разработке структурной организации онтологии.
Ключевые слова: онтология, лингвистическая онтология, Онтология по естественным наукам и технологиям ОЕНТ, структурные особенности ОЕНТ.

Выявление психологического портрета на основе определения тональности сообщений для антропоморфного социального агента

Антон Анатольевич Алексеев, Влада Владимировна Кугуракова, Денис Сергеевич Иванов
149-165
Аннотация: Исследованы аспект выявления психологического портрета респондента и генерация отношения к нему социальным агентом на основе анализа тональности диалога. Рассмотрены принципы генерации отношения социального агента к респонденту и изменение его эмоционального настроя на протяжении общения. Реализация поставленной задачи осуществлена с помощью языка программирования Python и работы с реальными данными. Проведенный анализ алгоритмов классификации, основанных на подходах машинного обучения, подтвердил практическую значимость работы.
Ключевые слова: социальный агент, тональность, эмоциональное отношение, машинное обучение.

Автоматические и полуавтоматические методы построения графа знаний предметной области и расширения онтологии

Андрей Петрович Халов, Ольга Муратовна Атаева
1481-1519
Аннотация:

Рассмотрен цикл построения графа знаний и расширения онтологии для специальной предметной области, описывающей процесс управления потоками данных в службах информационной поддержки. Предложена методика формирования корпуса данных для наполнения онтологии с автоматической псевдоразметкой, включающей специальные категории для фиксации ранее не представленных классов и отношений. Обучена специализированная модель извлечения именованных сущностей на корпусе данных объемом 3 млн токенов с 92 метками. Результаты были использованы для интеграции извлеченных фактов, что увеличило граф знаний до 0.98 млн триплетов, при этом коэффициент расширения графа (отношение общего числа фактов к явным триплетам) увеличился с 2.65 до 3.52 при сохранении логической согласованности. Наборы токенов с одинаковыми метками были преобразованы в устойчивые семантические множества, что позволило полуавтоматически расширить онтологию. В онтологию добавлены 12 новых классов, которые были извлечены из неструктурированных текстовых данных. Показан прикладной пример запросов и дальнейшей аналитики.

Ключевые слова: онтология, DOLCE, граф знаний, NER, BIO-разметка, RDF/OWL, SPARQL.

Интеллектуальный сервис мультимодального нейросетевого мониторинга области наблюдения

Разиль Рустемович Миннеахметов
123-144
Аннотация:

Представлен подход к разработке интеллектуального сервиса мультимодального мониторинга области наблюдения с использованием больших нейросетевых моделей. Предлагаемое решение способно анализировать разнородные данные: видеопотоки, сигналы датчиков окружающей среды (температура, влажность и пр.) и журналы событий – для получения целостной картины происходящего. В качестве основных инструментов задействованы крупные языковые и визуальные модели (например, LLaMA, MiniCPM‑V и др.), развернутые локально с помощью платформы Ollama, что обеспечивает автономную и безопасную обработку информации без необходимости передачи данных на удаленные сервера. Разработан прототип системы, работающий в офлайн-режиме и способный выявлять критические ситуации, аномальные отклонения от нормы и контекстно значимые события в наблюдаемой зоне. Описана методика формирования тестовых сценариев и проведения качественной оценки работы модели по метрикам F1-мера, Precision, Recall. Результаты экспериментов подтвердили применимость мультимодальных моделей для решения задач мониторинга: прототип успешно распознает сложные паттерны поведения и демонстрирует потенциал больших моделей в построении адаптивных и масштабируемых систем наблюдения.

Ключевые слова: интеллектуальный сервис, мультимодальный мониторинг, Ollama, большие языковые модели, отслеживание активностей, видеоаналитика, искусственный интеллект.

Требования к АИС «Единый деканат» для комплексной автоматизации учебно-управленческой деятельности АГНИ

Лилия Мирзаяновна Садриева, Гульнара Линаровна Салихова
165-169
Аннотация:

Сформулированы основные требования к разработке и внедрению автоматизированных информационных систем в Альметьевском государственном нефтяном институте на основе анализа эксплуатации системы управления учебным процессом вуза.

Ключевые слова: управление учебным процессом, единая автоматизированная информационная система, единый деканат, студенческий офис.

Mixed methods study of middle school mathematics teachers’ content knowledge in usa and russia using sequential nested design

Мурат Аширович Чошанов
255-286
Аннотация: The sequential nested mixed methods study focused on comparative analysis of middle school mathematics teachers’ content knowledge in two countries. The study consisted of two stages: (1) quantitative study of teacher content knowledge; (2) qualitative study of teacher topic-specific content knowledge. The initial sample for the first stage included lower secondary mathematics teachers from the U.S. (grades 6–9, N=102) and Russia (grades 5–9, N=97). The Teacher Content Knowledge Survey (TCKS) was applied to assess teacher content knowledge based on the cognitive domains of Knowing, Applying, and Reasoning, as well as addressing the lower secondary mathematics topics of Number, Algebra, Geometry, Data and Chance. The second stage – an interpretive cross-case study – aimed at the examination of the U.S. and Russian teachers’ topic-specific knowledge on the division of fractions. For the second stage, N=16 teachers (8 – from the U.S., and 8 – from Russia) were selected for the study using non-probability purposive sampling technique based on teachers’ scores on the TCKS. Teachers were interviewed on the topic of fraction division using questions addressing their content and pedagogical content knowledge. The study revealed that there are explicit similarities and differences in teachers’ content knowledge as well as its cognitive types. The study results may inform the field on priorities placed on lower secondary mathematics teachers’ knowledge in the USA and Russia. It also suggests close comparison and learning about issues related to teacher knowledge in both countries with a potential focus on re-examining practices in teacher preparation and professional development.
Ключевые слова: cross-national comparison, teacher knowledge, topic-specific content knowledge, lower secondary school mathematics.

Требования к информационным компетенциям экспертов при оценке проектов прикладных научных исследований

Ирина Болеславовна Рутковская, Александр Александрович Мусатов
443-449
Аннотация: Представлены результаты проведения глубинных интервью и анкетного опроса представителей научно-технической сферы с целью определения информационных компетенций, необходимых для проведения экспертизы проектов прикладных научных исследований и экспериментальных разработок в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014–2020 годы».
Ключевые слова: прикладные научные исследования, научно-техническая экспертиза, независимые эксперты, информационные компетенции, глубинные интервью, анкетный опрос.

Подход к индивидуализации и контролю деятельности студента в ходе просмотра видеолекции

Максим Юрьевич Новиков
64-74
Аннотация:

Статья посвящена вопросу применения цифровых образовательных сервисов в процессе обучения студентов высших учебных заведений. На основе опыта применения различных методов обучения и цифровых ресурсов в обучении студентов предложены новые цифровые решения, которые решают часть дидактических задач и предоставляют новые возможности для организации процесса обучения. Основной обсуждаемый вопрос – возможность индивидуализации и контроля процесса обучения в случае использования преподавателем обучающих видеоматериалов. Путем сравнения традиционной очной лекции и обучающего видео описаны положительные и отрицательные эффекты каждого из подходов к выдаче лекционного материала. На основе результатов такого сравнения предложена модель видеолекции, включающая в себя интерактивные элементы обратной связи.

Ключевые слова: методы обучения, видеоуроки, обучающее видео, цифровые сервисы.

Исследование сходимости численных методов решения задач с оператором смешанного типа в неограниченной области

Михаил Павлович Галанин, Дмитрий Леонидович Сорокин
656-665
Аннотация: Проанализированы методы решения задач, базирующиеся на основной интегральной формуле Грина. Предложены новые методы решения задачи с оператором смешанного типа в неограниченной области. На основе этих методов созданы программы для решения задач с оператором смешанного типа. Приведены результаты вычислительных экспериментов, показывающие корректность применения методов.
Ключевые слова: неограниченная область, оператор смешанного типа, электродинамические ускорители рельсового типа, система уравнений Максвелла в квазистационарном приближении.

Построение цифровой системы управления геологическими знаниями для поддержки научных исследований

Михаил Иванович Патук, Вера Викторовна Наумова
148-158
Аннотация:

Описаны новые подходы к сбору данных о научных публикациях из систем открытого доступа с тематикой «Науки о земле». На основе разработанных и адаптированных подходов созданы архив научных публикаций (репозиторий) и комплекс программ доступа к научным публикациям для сбора, поиска, фильтрации, каталогизации и управления публикациями и их метаданными. Для улучшения доступности публикаций и других связанных с ними данных, находящихся на сайтах Государственного геологического музея им. В.И. Вернадского РАН, разработана система Wiki – Геология России. Эта система является тематическим рубрикатором по направлению «Месторождения полезных ископаемых России», с дополнительной тематикой «Минералогия». Все статьи имеют ссылку на источник информации из архива научных публикаций и, опционально, дополнительные ссылки по сходной тематике. Wiki – Геология России являются первым шагом в создании базы знаний по месторождениям полезных ископаемых.

Ключевые слова: Wiki – Геология России, системы управления знаниями, репозиторий.

Поиск слов в рукописном тексте на основе штриховой сегментации

Иван Дмитриевич Морозов, Леонид Моисеевич Местецкий
1435-1453
Аннотация:

Рукописные архивные документы составляют фундаментальную часть культурного наследия человечества, однако их анализ остается трудоемкой задачей для профессиональных исследователей-историков, филологов и лингвистов. В отличие от коммерческих приложений систем OCR (Optical Character Recognition, оптического распознавания символов), работа с историческими рукописями требует принципиально иного подхода из-за чрезвычайного многообразия почерков, наличия правок и деградации материалов.


Предложен метод поиска в рукописных текстах, основанный на штриховой сегментации. Вместо полного распознавания текста, часто недостижимого для исторических документов, метод позволяет эффективно отвечать на поисковые запросы исследователей. Ключевая идея заключается в декомпозиции текста на элементарные штрихи, формировании семантических векторных представлений с помощью контрастного обучения, последующей кластеризации и классификации для создания адаптивного словаря почерка.


Экспериментально показано, что поиск сравнением кортежей редуцированных последовательностей наиболее информативных штрихов по расстоянию Левенштейна обеспечивает достаточное качество для рассматриваемой задачи. Метод демонстрирует устойчивость к индивидуальным особенностям почерка и вариациям написания, что особенно важно для работы с авторскими архивами и историческими документами.


Предложенный подход открывает новые возможности для ускорения научных исследований в гуманитарной сфере, позволяя сократить время поиска нужной информации с недель до минут, что качественно меняет возможности исследовательской работы с большими архивами рукописных документов.

Ключевые слова: рукописный текст, поиск, штриховый анализ, сегментация, векторное представление, контрастное обучение, кластеризация.

Автоматизированное оценивание коротких ответов обучающихся с использованием языковых моделей

Чулпан Бакиевна Миннегалиева, Ильнур Илхамович Кашапов, Ольга Дмитриевна Морозова
278-293
Аннотация:

Методы проверки ответов обучающихся с использованием языковых моделей в настоящее время исследуются разными специалистами. Результаты автоматизированного оценивания зависят от предметной области и особенностей учебной дисциплины. В работе проанализированы ответы студентов, полученные в ходе изучения курса «Компьютерная графика и дизайн». При помощи языковых моделей определены векторы документов. Предложен метод оценивания ответов через нахождение косинусного сходства полученных векторов и уточнение оценок проверкой ключевых слов. Результаты могут использоваться при предварительной проверке ответов студентов и являются базой для дальнейших исследований. 

Ключевые слова: языковая модель, контроль знаний, обработка текста, ключевое слово ответа, автоматизированная оценка ответов обучающихся, косинусное сходство, векторное представление документа, BERT, word2vec, открытый вопрос.

Использование систем поддержки принятия решений в автоматизации процессов принятия решений

Василий Борисович Чечнев
163-183
Аннотация:

Возрастающая сложность принятия решений в современных условиях предопределяет безусловность необходимости автоматизации такого процесса. Одним из ключевых элементов этого процесса являются системы поддержки принятия решений. В настоящей работе рассмотрены теоретические аспекты и практические пути реализации названного процесса. С этой целью автором предложен новый взгляд на понимание сути системы поддержки принятия решений, а также проведен анализ основных атрибутов и функций систем данного типа, в процессе которого установлено, что одним из наиболее перспективных направлений в использовании искусственного интеллекта в данной области являются мультиагентные системы.


Проведенный анализ актуальных систем поддержки принятия решений показал основные конкурентные преимущества, общие слабые стороны, а также важность продолжения разработки научной парадигмы в отношении отечественной интеллектуальной системы поддержки принятия решений.

Ключевые слова: интеллектуальные системы, системы поддержки принятия решений, мультиагентные системы, принятие решений, информационные системы, компьютерное моделирование.

Разработка мобильной системы сбора цифрового следа для использования при горизонтальном обучении

Роберт Ринатович Алимбеков, Айрат Фаридович Хасьянов
104-120
Аннотация:

Горизонтальное обучение — это современная модель, альтернативная традиционному вертикальному обучению и основанная на сотрудничестве, взаимодействии между студентами в рамках образовательного процесса. При этом для промежуточной аттестации по дисциплине преподавателю необходимо оценить вклад каждого студента в решение групповой задачи.


На сегодняшний день пользователями мобильных приложений в разных областях оставляется огромное количество цифровых следов. Основными типами оставляемого цифрового следа являются текст, фотографии, видеозаписи, аудиозаписи, а также текущее местоположение.


Для содействия преподавателю при горизонтальном обучении нами разработано мобильное приложение, собирающее все вышеперечисленные виды цифрового следа, а также веб-приложение, анализирующее его.

Ключевые слова: сотовая связь, мобильное приложение, цифровой след, сбор цифрового следа, учет, анализ.

Извлечение данных из сканированных документов со сходной структурой

Рустем Дамирович Саитгареев, Булат Рифатович Гиниятуллин, Владислав Юрьевич Топоров, Артур Александрович Атнагулов, Фарид Радикович Аглямов
667-688
Аннотация:

На текущий момент времени значительная часть передаваемых и хранимых данных не структурирована. Количество неструктурированных данных растет большими темпами каждый год, несмотря на то, что по таким данным трудно производить поиск, к ним нельзя совершать запросы и в целом их обработка не автоматизирована. В то же время наблюдается развитие систем электронного документооборота.


Настоящая работа предлагает инструмент для извлечения данных из фотографий бумажных документов, принимая во внимание их структуру и разметку. Представлены результаты разных испытанных подходов, включая нейронные сети и алгоритмический метод, а также проведен анализ полученных результатов.

Ключевые слова: нейронные сети, машинное обучение, извлечение структуры, извлечение структуры документов, OCR , неструктурированные данные , распознавание текста.

Сравнительный анализ текстов геологических публикаций с использованием больших языковых моделей

Михаил Иванович Патук, Вера Викторовна Наумова
806-821
Аннотация:

Стремительный рост объема публикаций во всех областях геологических наук делает критически важным внедрение методов автоматизированной обработки научных текстов. Одним из наиболее перспективных инструментов для решения этой задачи выступают большие языковые модели на основе нейронных сетей. Огромный прорыв в области искусственного интеллекта за последние годы превратил такие модели в незаменимых помощников для исследователей.
Наши работы по семантическому поиску публикаций с использованием дополнительно тренированных языковых моделей и нахождения меры близости геологических текстов показали хорошие результаты. Но используемые модели оказались неспособны выполнить глубокий анализ текстов. Сравнительный анализ современных архитектур позволил нам выделить модель DeepSeek R1, относящуюся к классу систем с расширенными возможностями логического вывода. Данный тип моделей демонстрирует принципиально новый уровень качества генерации. На базе выбранной модели разработан веб-сервис, предоставляющий уникальный функционал, осуществляющий сравнительный анализ до 5 научных статей стандартного объема; поддержку мульти язычных источников (ввод текстов на английском, китайском, русском и др. языках); формирование структурированных отчетов на русском языке с выделением ключевых тезисов, противоречий и паттернов. Проведено тестирование предложенного подхода для сравнительного анализа геологических публикаций. Тестирование показало результаты, вызывающие доверие.

Ключевые слова: искусственный интеллект, большие языковые модели, обработка естественного языка, анализ текстов, геология.

Методы и инструменты, используемые при подготовке публикаций научных статей в формате HTML

Римма Юрьевна Скорнякова
252-302
Аннотация:

Наряду с традиционной формой электронного представления полных текстов научных статей – форматом PDF – в последние годы все большее распространение получает формат HTML, обладающий для онлайн-публикаций рядом преимуществ за счет имеющихся в нем средств для лучшей структуризации материала, вставки мультимедийного контента и реализации разного рода интерактивных и динамических возможностей. В связи с этим становится весьма актуальной задача получения HTML-версии научной статьи из исходного формата материала, присланного автором. В настоящей работе рассмотрены различные подходы к подготовке HTML-версий полных текстов научных статей, применяемые в издательствах, и описаны используемые при этом программные инструменты. Основное внимание уделено инструментам, применяемым для исходных материалов в формате Word. Изложены также основы стандарта JATS XML, широко применяемого при подготовке онлайн-публикаций журнальных статей.

Ключевые слова: HTML-версия научной статьи, XML-версия научной статьи, стандарт обмена научными статьями, JATS, преобразование форматов научных статей.
176 - 200 из 385 результатов << < 3 4 5 6 7 8 9 10 11 12 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества