• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Научные публикации и эмбеддинг-пространство знаний

Андреас Хачатурович Мариносян, Сергей Георгиевич Григорьев
565-594
Аннотация:

Рассмотрены актуальные проблемы наукометрии, возникающие на фоне роста публикационной активности и широкого внедрения технологий генеративного искусственного интеллекта. Проанализирован существующий наукометрический инструментарий анализа научной деятельности, подразделяемый на количественные метрики и методы картографирования науки (анализ сетей цитирований, академическая генеалогия, семантический анализ и др.). Сделана попытка преодоления ограничений традиционного цитатного анализа, таких как «семантическая слепота» и уязвимость к манипуляциям. В качестве возможного решения предложена концептуальная модель, в которой единицей анализа выступает не публикация в целом, а отдельное «ключевое утверждение». Такой подход предполагает фиксацию не только содержания тезиса, но и его типа, области релевантности и характера связей с другими утверждениями (подтверждение, опровержение, уточнение, обобщение и т. д.). В контексте данного подхода предложены принципы расчета модифицированных наукометрических метрик.


Представлены результаты апробации предложенной модели на массиве из 728 статей журнала «Информатика и образование» (2016–2025 гг.). С использованием больших языковых моделей проведен анализ, результаты которого показали, что ретроспективное извлечение утверждений сталкивается с трудностями, связанными со сложившейся культурой научной коммуникации; поэтому отмечено преимущество самостоятельного формулирования ключевых утверждений (как особого типа метаданных) непосредственно авторами публикаций. Намечены возможные пути развития концепции «эмбеддинг-пространства знаний», которая в перспективе могла бы дополнить существующие подходы анализа динамики развития научных идей и теорий.

Ключевые слова: наукометрия, академическая генеалогия, цитатный анализ, семантический анализ, большие языковые модели, карта науки, индекс Хирша, нанопубликации.

Типы эмбеддингов и их применение в интеллектуальной академической генеалогии

Андреас Хачатурович Мариносян
240-261
Аннотация:

Рассмотрена проблема построения интерпретируемых векторных представлений научных текстов для задач интеллектуальной академической генеалогии. Предложена типология эмбеддингов, включающая три класса: статистические, выученные нейросетевые и структурированные символьные. Обоснована необходимость объединения достоинств нейросетевых (высокая семантическая точность) и символьных (интерпретируемость измерений) подходов. Для реализации такого гибридного подхода предложен алгоритм построения выученных символьных эмбеддингов путем регрессионного преобразования вектора внутреннего представления нейросетевой модели в интерпретируемый набор оценок.


Экспериментальная оценка алгоритма проведена на корпусе фрагментов авторефератов диссертаций по педагогическим наукам. Компактный трансформерный энкодер с регрессионной головой обучался воспроизводить тематические оценки, сгенерированные передовой генеративной языковой моделью. Сравнение шести режимов обучения (три типа регрессионной головы и два состояния энкодера) показало, что дообучение верхних слоев энкодера является ключевым фактором повышения качества. По результатам тестирования была выбрана наилучшая конфигурация, которая достигла коэффициента детерминации R² = 0.57 и точности определения трех наиболее релевантных концептов, равной 74%. Результаты подтверждают, что для определенного рода задач, в которых требуется формальное представление выходных данных, возможна аппроксимация поведения генеративной модели компактным энкодером с регрессионной головой при существенно меньших вычислительных затратах. В более широкой перспективе разработка алгоритмов построения выученных символьных эмбеддингов будет способствовать созданию такой модели формальной репрезентации научного знания, в которой конвергенция нейросетевых и символьных методов обеспечит как масштабируемость обработки научных текстов, так и интерпретируемость векторных представлений, кодирующих содержание.

Ключевые слова: эмбеддинги, академическая генеалогия, трансформерный энкодер, регрессионная голова, символьные эмбеддинги, тематический профиль, обработка естественного языка, интерпретируемость, большие языковые модели, наукометрия.
1 - 2 из 2 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества