• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Cервис генерации учебных карточек математических понятий для дистанционного курса по геометрии

Константин Сергеевич Николаев
365-377
Аннотация:

Представлен сервис генерации и визуализации учебных карточек математических понятий, основанный на онтологии школьной математики OntoMathEdu. Приведены основные этапы сбора информации для отображения карточки понятия. Разработанный сервис применен в качестве рекомендационной системы в курсе дистанционного образования в Казанском федеральном университете (КФУ) «Технология решения планиметрических задач». Математические понятия, расположенные в текстах лекционных материалов, обогащены ссылками на соответствующую карточку понятия на сервисе.

Ключевые слова: онтологии, визуализация данных, информационные системы, математическое образование.

Формализация процессов формирования пользовательских коллекций в цифровом пространстве научных знаний

Николай Евгеньевич Каленов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
433-450
Аннотация: Исследована задача формирования цифрового пространства научных знаний (ЦПНЗ). Рассмотрено отличие этого понятия от общего понятия пространства знаний. ЦПНЗ представлено как множество, содержащее объекты, верифицированные мировым научным сообществом. Формой структурированного представления цифрового пространства знаний является семантическая сеть, основной принцип организации которой основан на системе классификации объектов и последующем построении их иерархии, в частности, по принципу наследования. Введена классификация объектов, составляющих контент ЦПНЗ. Предложена модель ЦПНЗ как совокупности непересекающихся множеств, содержащих цифровые образы реальных объектов и их характеристики, обеспечивающие отбор и визуализацию объектов в соответствии с многоаспектными пользовательскими запросами. Определено понятие пользовательской коллекции, предложена иерархическая классификация типов пользовательских коллекций. Использование понятий теории множеств при построении ЦПНЗ позволяет разбивать информацию по уровням детализации и формализовать алгоритмы обработки пользовательских запросов, что проиллюстрировано конкретными примерами.
Ключевые слова: семантическая сеть, информационное пространство, научные знания, электронная библиотека, уровни детализации, иерархия информационных объектов.

Учёт структуры документа в методе автоматического аннотирования математических понятий в образовательных текстах

Константин Сергеевич Николаев
558-577
Аннотация:

Обогащение образовательных текстов семантическим содержимым (в частности, дополнение документа гиперссылками на страницы сервиса, отображающего подробную информацию о понятиях, используемых в тексте) способствует повышению эффективности усвоения материала обучающимися. Существующие методы семантической разметки образовательных текстов не учитывают структурные особенности таких документов, что приводит к избыточному распознаванию понятий.


В статье описано развитие метода автоматического аннотирования математических понятий в образовательных математических текстах путем добавления функционала для учета структуры образовательного документа. Основное назначение метода заключается в обработке образовательных материалов курса дистанционного образования «Технология решения планиметрических задач». Соблюдение единого шаблона при создании страниц курса позволяет применить анализ веб-разметки страниц и ключевых слов, примененных создателями курса. Основной задачей в данном процессе является определение типа ячеек таблицы, в которых находятся текстовые фрагменты образовательных материалов. В соответствии с рекомендациями создателей курса, определения необходимо выделять в ячейках, содержащих постановку задачи, а также в тех блоках, где указаны входные данные задачи. Определение типа ячеек таблиц производится с помощью анализа их атрибутов и поиска ключевых слов в их содержимом. Такое ограничение распознаваемых фрагментов текста позволяет улучшить восприятие страниц курса учеником и повысить качество усвоения учебного материала.

Ключевые слова: семантический анализ, математическая онтология, дидактические отношения, математическое образование, разметка документа.

Методико-математические основы логико-понятийной компетенции в деятельности современного учителя математики

Василий Иванович Горбачев
331-340
Аннотация: Наряду с общепредметными, в содержании логико-понятийной компетенции выделены и методико-математические основы ее становления. В предметно-математическом плане в качестве базовой представлена методико-математическая адаптация психолого-дидактических закономерностей становления системы субъектного предметного знания. Ее дополняют специфические методико-математические закономерности: становления абстрактного математического мышления и его компонентов; структурного формирования пространственного и теоретико-пространственного типов мышления; анализа системы математического знания в содержании учебной математической теории; интеграции математического языка, математической речи и математического мышления; понятийно-категориальной интеграции учебных математических теорий.
Ключевые слова: предметные компетенции учебной математической деятельности, содержание логико-понятийной компетенции, методико-математические основы.

Онтология по естественным наукам и технологиям ОЕНТ: структура, состав и современное состояние

Б.В. Добров, Н.В. Лукашевич
Аннотация: На основе разумного сочетания трех подходов - традиционных информационно-поисковых тезаурусов, формальных онтологий, ресурсов типа WordNet, разработана лингвистическая онтология по естественным наукам и технологиям ОЕНТ, предназначенной для работы при автоматической обработке текста в разных приложениях обработки информации. ОЕНТ включает в настоящее время более 50 тысяч понятий, более 150 тысяч текстовых входов, 200 тысяч прямых и более двух миллионов наследуемых отношений между понятиями. В статье мы описали структурные особенности ОЕНТ. Широта предметной области и назначение онтологии определяют ряд решений, принятых при разработке структурной организации онтологии.
Ключевые слова: онтология, лингвистическая онтология, Онтология по естественным наукам и технологиям ОЕНТ, структурные особенности ОЕНТ.

V Международная Конференция «Информационные технологии для наук о земле и приложения для геологии, горной промышленности и экономики. Ites&Mp-2019»

Вера Викторовна Наумова
1279-1300
Аннотация:

Охарактеризованы материалы, представленные на V международной конференции «Информационные технологии для наук о Земле и приложения для геологии, горной промышленности и экономики. ITES&MP-2019». Названная конференция описывает результаты последних лет в следующих областях:


  • открытый доступ к научным данным в области наук о Земле; особенности данных в науках о Земле: новые концепции и методы, инструменты их сбора, интеграции и обработки в различных информационных системах, в том числе в системах с интенсивным использованием данных;

  • анализ данных и математическое моделирование природных процессов в науках о Земле: новые подходы. Эволюция классических ГИС-приложений;

  • применение информационных технологий в области металлогении критических полезных ископаемых;

  • социальные аспекты горно-геологической отрасли;

  • прогнозные построения в области геологической разведки и землепользования;

  • интеллектуальный анализ данных, извлечение фактов и знаний из научных публикаций. Тезаурусы, онтологии, концептуальное моделирование. Семантический веб, связанные данные. Сервисы. Семантическое структурирование контента. Применение в науках о Земле;

  • применение методов и технологий дистанционного зондирования в науках о Земле и горной промышленности: от спутников до беспилотных летательных аппаратов;

  • информационные технологии для создания систем демонстрации и популяризации достижений в науках о Земле;

  • приложения: прогноз месторождений, экологические риски, опасные природные явления, управление водными ресурсами, геотермальная энергия и др.

Ключевые слова: информационные технологии, науки о Земле.

Qualitative Analysis of the Relationship Between Teachers and Students`not-Knowing in the Process of Solving Reasoning Tasks

Kevin Fierro, Mourat Tchoshanov, Gulshat Shakirova
749-758
Аннотация: Mason and Spence’s (1999) work demonstrate a detailed view into the concept of knowing. Although they highlight the importance of not-knowing as a first step, it is a topic that is not well researched. This study aims at expanding that research, by analyzing not-knowing expressions from teacher to student and possible connections to be found. During a course of geometric reasoning student teachers were asked to reason with a tangram while simultaneously recording their expressions of not-knowing and reflecting on it periodically. Student teachers were then tasked to teach this lesson to their students, who would also reflect and express their forms of not-knowing. Findings presented no real link between teacher-student expressions of not-knowing, but two major conclusions were made. Individuals altogether struggle conveying their not-knowing clearly and when they did express it, these expressions leaned heavily on not-knowing-that and not-knowing-how forms. A discussion follows to interpret said findings. A conclusion is made detailing key points in the study and what comes next for the concept of not-knowing.
Ключевые слова: knowing, not knowing, secondary school mathematics teachers.

Технологии семантического веба для поддержки фундаментальных исследований в геологии

Игорь Вячеславович Бычков, Евгений Александрович Черкашин, Цзинь Чжан, Татьяна Юрьевна Черкашина, Виктория Алексеевна Попова, Оксана Анатольевна Мазаева, Оксана Викторовна Лунина
740-780
Аннотация:

Представлена инновационная методология применения технологий семантического веба для поддержки фундаментальных геологических исследований. Рассмотрена проблема семантической интеграции разнородных геологических данных, характеризующихся масштабом разного уровня и междисциплинарностью. Разработана пятиэтапная методология, включающая анализ предметной области, онтологическое концептуальное моделирование, трансформацию данных в граф знаний, развертывание инфраструктуры распределенного доступа к данным на основе концептуальной модели, а также интеграцию с процедурами обработки и анализа. Практическая апробация проведена на трех кейсах: анализе геохимических данных для оценки уровня загрязнения территории, создании информационной системы о разломах и исследовании динамики береговой зоны водохранилищ. Предложенный онтологический подход обеспечивает соответствие FAIR-принципам и преодоление «семантического барьера» в геологических исследованиях. Показано, что технологии семантического веба позволяют перейти от фрагментированных информационных массивов к целостному семантическому пространству геологических знаний, что открывает новые возможности для генерации комплексных научных гипотез и кросс-дисциплинарных исследований.

Ключевые слова: семантический веб, графы знаний, онтологическое моделирование, семантическое пространство научных знаний, фундаментальные геологические исследования.

Онтологический подход к описанию единого цифрового пространства научных знаний

Ольга Муратовна Атаева, Николай Евгеньевич Калёнов, Владимир Алексеевич Серебряков
3-19
Аннотация:

Несмотря на развитие технических средств, усложняются процессы, связанные с поиском полной и точной научной информации в огромном количестве источников данных. Для выхода на новый уровень в использовании технологий обработки информации в первую очередь необходим переход к семантически значимому представлению научных знаний, извлекаемых из информации в цифровой среде. В современных условиях, характеризуемых мультидисциплинарностью исследований, необходимого эффекта можно достичь, разработав универсальные подходы к хранению и представлению научных знаний. Эти подходы нашли свое отражение в концепции Единого цифрового пространства научных знаний. В работе представлен обзор основных понятий в этой области, используемых как для представления элементов пространства, так и для обеспечения доступа к ним не только для человека, но и для программных агентов. В качестве инструментария для конструирования пространства знаний рассмотрены семантические библиотеки.


 

Ключевые слова: пространство знаний, цифровое пространство знаний, онтологии, метаданные, научные знания, уровни метаданных, проектирование онтологий, семантические библиотеки.

Описание контекстно-свободных грамматик в формате данных JSON для генераторов синтаксических анализаторов

Олег Константинович Осипов
1301-1323
Аннотация:

Рассмотрены варианты представления контекстно-свободных грамматик, предлагаемые средствами генерации синтаксических анализаторов. Приведён анализ существующих решений. Предложен новый формат описания грамматики. Дано описание грамматики в виде JSON-документа. Разработана концепция нового генератора, основанная на формате данных JSON для контекстно-свободных грамматик. Описана схема построения анализатора на основе концепции.

Ключевые слова: JSON-документ, контекстно-свободные грамматики, лексема, форма Бэкуса-Наура, дерево разбора, терминальные символы (токены), конечный детерминированный автомат, парсер, Parglare, ANTLR.

Концептуальные основы создания экспертно-аналитических центров для анализа научных текстов на наличие некорректных заимствований

Павел Хафизуллович Катабай
332-343
Аннотация: Рассмотрены концептуальные основы создания на базе ведущих вузов Российской Федерации экспертно-аналитических центров для проведения независимой экспертизы научных текстов (диссертаций, монографий, статей и др.) на наличие в них некорректных заимствований. Предложены основные этапы работы центров по проверке научных текстов, а также проект формы экспертного заключения.
Ключевые слова: плагиат, антиплагиат, некорректные заимствования, анализ текстов, проверка диссертаций, экспертно-аналитические центры, независимая экспертиза, экспертная оценка.

Семантическая библиотека как средство определения научной предметной области

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков
988-1005
Аннотация:

Рассмотрены информационная система, предназначенная для представления предметной области, связанной с наукой, и ее особенности. Выделены общие концепции для формального описания такой предметной области в базе знаний семантической библиотеки. Особенность этих областей заключается в том, что структура данных подвержена частым изменениям. Поэтому средство организации знаний, в качестве которого выступает семантическая библиотека, должно быть достаточно универсальным и не требовать глубоких технических познаний. В работе приведены описание функциональности системы и ее использования при настройке на предметную область. Для каждой области набор ресурсов может отличаться как по формату, так и по набору самих ресурсов. Набор понятий, формирующих описание контента библиотеки, должен быть настолько универсальным, чтобы мог адаптироваться под нужды конкретной области. Для представления данных использованы метаданные трех уровней.

Ключевые слова: семантическая библиотека, онтология, представление знаний.

Распределенная тренировка ML-модели на мобильных устройствах

Денис Васильевич Симон, Ирина Сергеевна Шахова
1076-1092
Аннотация: В настоящее время потребность в наличии решений по распределенной тренировке ML-модели в мире возрастает. Однако существующие инструменты, в частности, TensorFlow Federated, – в самом начале своего развития, сложны в реализации и пригодны на текущий момент исключительно для симуляции на серверах. Для мобильных устройств надежно работающих подходов для достижения этой цели не существует. В статье спроектирован и представлен подход к такой распределенной тренировке ML-модели на мобильных устройствах, реализуемый с использованием существующих технологий. В его основе лежит концепция model personalization. В данном подходе эта концепция улучшена как следствие смягчения выявленных недостатков. Процесс реализации выстроен так, чтобы на всех этапах работы с ML-моделью использовать только один язык программирования Swift (применяются Swift for TensorFlow и Core ML 3), делая такой подход еще более удобным и надежным благодаря общей кодовой базе.
Ключевые слова: ML-модель, распределенная тренировка ML-модели, мобильная разработка, программная инженерия, машинное обучение, on-device ML, on-device training, edge computing.

Модель лингвистического графа знаний «Turklang» как база для создания инструментов обучения тюркским языкам

Айрат Рафизович Гатиатуллин, Николай Аркадиевич Прокопьев
251-265
Аннотация:

Описаны элементы модели лингвистического графа знаний «Turklang», разработанного в Институте прикладной семиотики АН РТ и используемого в качестве базы для создания ряда лингвистических ресурсов и инструментов: портал «Тюркская морфема», электронный корпус татарского языка «Туган Тел», лингвистические процессоры.


Для создания образовательной среды необходимы предметно-ориентированные графы знаний, для получения которых не применимы методы создания общих и открытых графов. В работе описаны лингвистические графы знаний, которые отображают, с одной стороны, потенциальные возможности тюркских языков, с другой стороны, примеры реального использования в текстах. Особенность этих графов знаний заключается в том, что они содержат лингвистические единицы разных языковых уровней, а также семантические универсалии, соответствующие значениям этих лингвистических единиц, которые встроены в единую модель лингвистического графа знаний. Структура такого графа знаний позволяет формировать учебные курсы, строить индивидуальную образовательную траекторию, а также создавать задания и средства автоматизированной проверки в рамках контроля знаний при обучении тюркским языкам. Это дает возможность разрабатывать впоследствии, на основе этих графов, программы обучения с учетом структурно-функциональных особенностей тюркских языков, а также способствует реализации индивидуальных целей обучающихся.

Ключевые слова: граф знаний, база знаний, лингвистический ресурс, лингвистическая единица, малоресурсные языки, тюркские языки, веб-портал, электронное образование, контроль знаний, автоматизированная оценка ответа.

Системы образовательных проекций, уровней и пререквизитов математической онтологии OntoMathEdu

Марина Викторовна Фалилеева, Александр Витальевич Кириллович, Ольга Авенировна Hевзорова, Лилиана Рафиковна Шакирова, Евгений Константинович Липачёв, Анастасия Эдуардовна Дюпина
505-530
Аннотация:

Представлены разработанные образовательные проекции, уровни и пререквизиты математической образовательной полилингвальной онтологии OntoMathEdu. Образовательная проекция рассматривается как формализация определенной системы предметной подготовки по математике. Она представляет себой подмножество концептов онтологии OntoMathEdu, которые структурированы на данном этапе развития онтологии с помощью двух дидактических отношений — образовательный уровень и пререквизит.


Образовательные уровни выделены на основе стандартов обучения соответствующей системы образования, отношение пререквизит определяется последовательностью изучаемых понятий в той или иной системе образования.  


В онтологии OntoMathEdu определены две проекции, представляющие образовательные системы России и Великобритании. Алгоритм построения онтологии через связывание различных проекций позволяет в дальнейшем пополнять ее новыми образовательными проекциями, которые можно использовать в системе полилингвального обучения математике.

Ключевые слова: онтология, математическое образование, планиметрия, OntoMathEdu, образовательная проекция, образовательный уровень, пререквизит.

Методология и технология создания многоцелевой информационной среды T-System на базе электронной библиотеки с гибким полнотекстовым поиском

С.Х. Ляпин, А.В. Куковякин
Аннотация: Описана методология и технология построения многоцелевой информационной среды T-System путем расширения информационной системы T-Libra и предназначенной для интеграции ресурсов и сервисов, характерных для электронной библиотеки с гибким полнотекстовым поиском, виртуального музея, электронного архива, исследовательской лаборатории, образовательного сервера. Методологической основой интеграции является гибридная двухуровневая онтология, основанная на взаимодействии функциональных систем (верхний уровень), библиотеки концептов и библиотеки тезаурусов (нижний уровень). Технологической основой – унифицированная поисковая система, включающая в себя механизм нелинейных каскадных запросов, формирующих соответствующие функциональные системы и соединяющих результаты полнотекстового поиска, релевантные тезаурусы и концепты, текстовые метаданные, а также нетекстовые объекты различной модальности (графика, звук, видео и т.д.). Вся среда проектируется в трехзвенной архитектуре (Веб-браузер / Веб-сервер + Сервер приложений / Cервер баз данных), с использованием специальной системы индексации для повышения эффективности поиска, а также внешней логики, встроенной в сервер приложений и обеспечивающей совместимость с различными СУБД.

Об описании некоторых краевых задач в семантической библиотеке LibMeta

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
2-21
Аннотация:

Использован подход онтологического проектирования для описания семантики некоторых краевых задач в цифровой библиотеке LibMeta.


Для описания задач в библиотеке LibMeta установлены связи терминов и понятий с классическими определениями математической энциклопедии и других первоисточников. Установление связей позволяет сформировать словарь и тезаурус прикладной предметной области краевых задач и поместить результаты в семантическую среду цифровой библиотеки. Примеры такого подхода продемонстрированы с использованием возможностей семантической библиотеки LibMeta, в которую в процессе развития интегрированы в оцифрованном виде версия математической энциклопедии, энциклопедии математической физики, классификаторы, прикладные математические тезаурусы и словари. Новые термины из публикаций после добавления в контент библиотеки отразились со связями в математической энциклопедии. Тезаурус для задач предметной области теории упругости был впервые создан путем интеграции предметных словарей, классификаторов, метаданных публикаций профильного журнала и энциклопедического контента библиотеки LibMeta. Цель таких исследований состоит в предоставлении пользователю дополнительных сервисов в поиске публикаций в прикладной научной области.

Ключевые слова: прикладная онтология, тезаурус предметной области, источники данных, разработка онтологии, цифровая семантическая библиотека LibMeta.

Развитие информационной системы регистрации результатов интеллектуальной деятельности сотрудников научного учреждения

Светлана Александровна Власова, Николай Евгеньевич Каленов
770-793
Аннотация:

Описана разработанная авторами веб-система, реализующая сервисы, связанные с формированием и предоставлением многоаспектной информации о результатах научной деятельности (публикациях, авторских свидетельствах и докладах на научных мероприятиях) сотрудников организации или группы организаций. Система ориентирована как на конечного пользователя, заинтересованного в получении конкретных данных, так и на административный персонал, формирующий отчетные материалы для вышестоящей организации. Информационная база системы содержит связанные данные о следующих классах объектов: персоны (авторы), организации и их подразделения; публикации на аналитическом, монографическом и сводном уровнях; авторские свидетельства; научные мероприятия (конференции, симпозиумы, семинары); доклады. В состав системы входят два модуля – административный, предназначенный для ввода и редактирования данных, и пользовательский, который представляет собой специальный поисковый аппарат, осуществляющий поиск информации, ее визуализацию, навигацию по связанным ресурсам и экспорт данных. Отличительной особенностью системы является введенное понятие «эквивалентных» объектов. Эквивалентными считаются объекты, представленные в системе различными метаданными, но относящимися к одной физической сущности. Такими объектами являются «персоны», соответствующие одному автору с различными написаниями фамилии в библиографических описаниях публикаций; организации, имеющие различные варианты названий; статьи, опубликованные без изменений на различных языках. В соответствии с современными требованиями к отчетности по публикациям в системе отражаются источники финансирования научных исследований, а также аффилиации каждого автора, указанные в статьях.

Ключевые слова: научные труды, научная деятельность, автоматизированная система, база данных, отчеты, сетевые технологии.

Онтологический подход в обучении геометрии

Лилиана Рафиковна Шакирова, Марина Викторовна Фалилеева
465-473
Аннотация: Перевод школьной системы знаний на формальный язык для создания онтологии школьной образовательной математики показал, что существуют пробелы, указывающие на существенные недостатки в конструировании содержания курса геометрии. Результаты проведенного исследования среди студентов Института математики и механики им. Н.И. Лобачевского Казанского (Приволжского) федерального университета по качеству понимания родовидовых понятий, графических представлений геометрических фигур показали взаимосвязь между проблемами в подаче содержания школьного курса планиметрии и качеством знаний студентов.
Ключевые слова: онтологический подход, обучение математике, планиметрия.

Цифровая инфраструктура электронного научного журнала: автоматизация редакционно-издательских процессов и система сервисов

Миляуша Салахутдиновна Галявиева, Александр Михайлович Елизаров, Евгений Константинович Липачёв
408-465
Аннотация:

Описаны современные модели и средства публикации и распространения научных знаний. Охарактеризованы современные информационные системы управления научными изданиями и сервисы, определяющие их функциональность.

Введено понятие цифровой инфраструктуры электронного научного журнала как комплекса, который объединяет программную платформу, реализующую основные рабочие процессы управления электронным журналом, и информационные системы, которые обеспечивают функционирование как основных, так и дополнительных сервисов, учитывающих, в частности, специфику предметной области журнала.

Представлен подход к организации цифровой инфраструктуры электронного научного журнала на основе открытой программной системы Open Journal Systems (OJS). Предложены сервисы, расширяющие функциональные возможности этой системы и учитывающие специфику предметной области научных журналов. На основе технологии расширения функционала OJS созданы программные модули, обеспечивающие автоматизацию ряда редакционных процессов электронного научного журнала.

Представлена система сервисов автоматической обработки коллекций научных документов. Эти сервисы обеспечивают проверку соответствия документов коллекций принятым правилам формирования коллекций и преобразования документов в установленные форматы; структурный анализ документов и извлечение метаданных, а также их интеграцию в научное информационное пространство. Система сервисов позволяет автоматически выполнять набор операций, который не реализуем за практически приемлемое время при традиционной «ручной» обработке электронного контента, и предназначена для обработки больших коллекций научных документов.

Охарактеризованы алгоритмы автоматической стилевой валидации текстов на этапе регистрации статьи в информационной системе электронного научного журнала, автоматического подбора рецензентов, рассылки уведомлений и контроля сроков рецензирования.

Представлены методы обработки документов, содержащих математические формулы, в частности, алгоритм поиска по формулам в коллекциях математических документов. Указаны основные идеи, подходы и уже полученные результаты по разработке семантических технологий управления математическими знаниями, в том числе, подход к построению рекомендательных систем на основе онтологий математического знания и метод автоматизации процесса первичной обработки научной статьи, использующей TеX-нотацию.

Охарактеризована проблема построения системы анализа и оценки информационного и социального воздействия публикуемого научного контента на его пользователей. Проведено сопоставление традиционных (библиометрических и наукометрических) и альтернативных показателей такой оценки. Описан мировой опыт использования информетрических сервисов на сайтах научных журналов. Обсуждены варианты реализации этих подходов в рамках цифровой инфраструктуры электронного научного журнала.

Ключевые слова: издательские системы, современные модели публикации и распространения научных знаний, информационное общество, электронный научный журнал, информационные системы управления научными изданиями и публикациями, интеграция электронных ресурсов.

Типы эмбеддингов и их применение в интеллектуальной академической генеалогии

Андреас Хачатурович Мариносян
240-261
Аннотация:

Рассмотрена проблема построения интерпретируемых векторных представлений научных текстов для задач интеллектуальной академической генеалогии. Предложена типология эмбеддингов, включающая три класса: статистические, выученные нейросетевые и структурированные символьные. Обоснована необходимость объединения достоинств нейросетевых (высокая семантическая точность) и символьных (интерпретируемость измерений) подходов. Для реализации такого гибридного подхода предложен алгоритм построения выученных символьных эмбеддингов путем регрессионного преобразования вектора внутреннего представления нейросетевой модели в интерпретируемый набор оценок.


Экспериментальная оценка алгоритма проведена на корпусе фрагментов авторефератов диссертаций по педагогическим наукам. Компактный трансформерный энкодер с регрессионной головой обучался воспроизводить тематические оценки, сгенерированные передовой генеративной языковой моделью. Сравнение шести режимов обучения (три типа регрессионной головы и два состояния энкодера) показало, что дообучение верхних слоев энкодера является ключевым фактором повышения качества. По результатам тестирования была выбрана наилучшая конфигурация, которая достигла коэффициента детерминации R² = 0.57 и точности определения трех наиболее релевантных концептов, равной 74%. Результаты подтверждают, что для определенного рода задач, в которых требуется формальное представление выходных данных, возможна аппроксимация поведения генеративной модели компактным энкодером с регрессионной головой при существенно меньших вычислительных затратах. В более широкой перспективе разработка алгоритмов построения выученных символьных эмбеддингов будет способствовать созданию такой модели формальной репрезентации научного знания, в которой конвергенция нейросетевых и символьных методов обеспечит как масштабируемость обработки научных текстов, так и интерпретируемость векторных представлений, кодирующих содержание.

Ключевые слова: эмбеддинги, академическая генеалогия, трансформерный энкодер, регрессионная голова, символьные эмбеддинги, тематический профиль, обработка естественного языка, интерпретируемость, большие языковые модели, наукометрия.

Технология наполнения предметных онтологий пространства научных знаний

Николай Евгеньевич Каленов
101-115
Аннотация:

Под предметной онтологией в контексте этой статьи понимается совокупность ключевых понятий, относящихся к некоторой области науки, с их семантическими связями, дополненная индексами различных классификационных систем, описывающих данную научную область. Предметные онтологии являются необходимой составляющей каждого подпространства, входящего в Единое цифровое пространство научных знаний (ЕЦПНЗ). В данной статье приводятся результаты исследований, связанных с построением предметных онтологий на базе созданной автоматизированной системы поддержки терминологических словарей и предлагается методология выделения новых ключевых терминов отдельной области науки. Предлагаемая методология базируется на использовании существующих классификационных систем в совокупности с базами данных цитирования (БДЦ), такими как Web of Science и Scopus для англоязычных публикаций и Российский индекс цитирования (РИНЦ) – для русскоязычных. Методология предполагает разбиение научной области на ряд разделов в соответствии с выбранной классификационной системой, выделение из БДЦ ядра статей, относящихся к каждому разделу, а из статей – новых авторских ключевых терминов, которые и должны составлять, в совокупности с соответствующими разделами классификационных систем, основу предметной онтологии данной научной области.

Ключевые слова: пространство научных знаний, предметная онтология, базы данных цитирования, ключевые термины, тезаурус для онтологии знаний, классификационные системы.

Формирование структурированных представлений научных журналов для интеграции в граф знаний и семантического поиска

Ольга Муратовна Атаева, Михаил Геннадьевич Кобук
1306-1323
Аннотация:

Работа посвящена проблеме развития библиотеки научных предметных областей SciLibRu, как продолжения семантического описания научных трудов проекта LibMeta. В основе этой библиотеки лежит концептуальная модель данных, структура и семантика которой сформированы на принципах онтологического моделирования. Такой подход обеспечивает строгое описание предметной области, формализацию взаимосвязей между сущностями и возможность дальнейшего автоматизированного анализа данных. Целью настоящего исследования были разработка и экспериментальное применение методов структуризации содержимого научных журналов в формате LaTeX для их интеграции в онтологию библиотеки и обеспечения семантического поиска.


Предложен алгоритм трансляции в формат XML данных, представленных множеством файлов, для интеграции в онтологию библиотеки. Реализован модуль векторного поиска, основанный на вычислении эмбеддингов с использованием языковых моделей. Выявлены закономерности распределения эмбеддингов и факторы, влияющие на точность ранжирования результатов поиска. Проведено тестирование двух названых компонентов.


Разработанный метод составляет основу для автоматического включения содержимого научных журналов в граф знаний SciLibRu и создания обучающих корпусов для языковых моделей, ограниченных рамками научных предметных областей. Полученные результаты способствуют развитию систем навигации по графу знаний журналов, а также рекомендательных механизмов и инструментов интеллектуального поиска по русскоязычным научным текстам.

Ключевые слова: полуструктурированные данные, онтология текста, LaTeX, векторное представление текста, полнотекстовый поиск, семантический поиск.

Программа «История гениального открытия»

Роман Валерьевич Мосолов
1239-1278
Аннотация:

Настоящая статья описывает концепцию программного обеспечения (ПО) «История гениального открытия», имеющего ряд сходств с программой GitHub, получившей широкую известность в профессиональном сообществе программистов. Программа призвана решать две основные научные проблемы: сохранять научно-культурное наследие российских учёных и аккумулировать первичные данные, позволяющие количественно измерить тенденции становления научных теорий, тем самым дополнив концепцию «научных революций» Т. Куна. Программа позволит сохранять исторически значимые научные достижения, минимизируя вероятность их бесследных потерь вследствие преждевременно ухода учёных из жизни. Идея разработки программы базируется на пересечении пяти научных направлений – программной инженерии, социологии, философии, права и истории – и появилась в стенах Казанского (Приволжского) федерального университета при изучении Big Data Science.

Ключевые слова: История гениального открытия, научное наследие, культурное наследие, закономерности гениальности, ПО для учёных, программа для учёных, GitHub для учёных.

Автоматизированная система выбора оптимальных методов решения акустических задач на базе онтологии

Ирина Леонидовна Артемьева, Алина Евгеньевна Чусова
719-737
Аннотация:

Представлен программный комплекс, который позволит специалистам в области архитектурной акустики выбрать наиболее подходящие способы моделирования звука и подбора отделочных материалов в зависимости от поставленных задач и параметров помещения. Отличительной особенностью данной системы является наличие онтологии предметной области, описывающей термины и связи между понятиями, а также модулей для решения различных задач в области архитектурной акустики. Подобный подход позволит рекомендовать пользователю наиболее подходящие для его запроса методы моделирования вследствие учета специфики помещения и функциональных требований клиента. Программная система позволит по запросу оптимизировать и распараллелить программы, которые написаны с помощью предметно-ориентированного языка программирования.


Описаны принципы анализа программного кода для выявления участков экономии и применения трансформаций, представленных в банке паттернов. Рассмотрен также подход к построению предметно-ориентированного языка программирования, основанного на онтологии предметной области ODSL (Ontology-Based Domain-Specific Language) и позволяющего специалистам описывать алгоритмы, не вникая в используемые методы оптимизации и распараллеливания. Новизна работы заключается в предложенной архитектуре модулей, основанных на прикладной онтологии, что позволяет адаптировать решение под другие предметные области.

Ключевые слова: онтология, архитектурная акустика, оптимизация, параллелизм, ODSL.
1 - 25 из 63 результатов 1 2 3 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества