• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Электронные текстовые ресурсы и долговременное хранение данных в Карельском научном центре РАН

Андрей Анатольевич Крижановский, Анатолий Дмитриевич Сорокин, Виктор Алексеевич Лебедев, Эльвира Викторовна Ямса, Валентина Геннадьевна Старкова, Юлия Андреевна Новикова, Александр Владимирович Чирков, Наталья Борисовна Крижановская, Юлия Васильевна Чиркова
305-367
Аннотация:

Описаны электронные ресурсы Карельского научного центра РАН, связанные с работой электронных библиотек, репозиториев и поисковых систем. Эти ресурсы предназначены для сбора, организации и распространения научной и технической информации (в виде научных публикаций, архивных документов) с целью ее использования в теоретических и прикладных научных дисциплинах. Охарактеризованы этапы разработки названных ресурсов на фоне истории развития отдельных, связанных с ними подразделений (Научная библиотека, Научный архив). Предложены направления развития электронных ресурсов Центра.

Статья распространяется на правах свободной лицензии Creative Commons Attribution-ShareAlike 4.0.

Ключевые слова: Карельский научный центр РАН, электронное архивирование, электронная библиотека.

О модели поиска синонимов

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
1006-1022
Аннотация:

Рассмотрена задача нахождения наиболее релевантных документов в результате расширенного и уточненного запроса. Для ее решения предложены модель поиска и механизм предварительной обработки текста, а также совместное использование поисковой системы и модели, построенной на основе индекса с помощью алгоритмов word2vec для генерации расширенного запроса с синонимами и уточнения результатов поиска на основе подбора похожих документов в цифровой семантической библиотеке. В работе исследуется построение векторного представления документов применительно к массиву данных цифровой семантической библиотеки LibMeta. Решалась задача обогащения пользовательских запросов синонимами. При построении модели поиска совместно с алгоритмами word2vec использован подход «сначала индексация, затем обучение», что позволяет получить более точные результаты поиска. Обучение модели проводилось на базе контента библиотеки для предметной области «Математика». Приведены примеры расширенного запроса с использованием синонимов.

Ключевые слова: модель поиска, алгоритм word2vec, синонимы, информационный запрос, расширение запроса.

Анализ Russian Science Citation Index c bспользованием данных Math-Net.ru

Знаменская Екатерина Александровна, Печников Андрей Анатольевич, Чебуков Дмитрий Евгеньевич
778-795
Аннотация:

С весны 2022 в России ведется создание национальной системы оценки результативности научных исследований и разработок с использованием базы ведущих российских журналов Russian Science Citation Index (RSCI). В статье изложены некоторые результаты анализа нормированного рейтинга RSCI, опубликованного в декабре 2022 года. С применением графа цитирования журналов, построенного по данным Math-Net.Ru на примере тематической группы OECD 101. Mathematics показано, что при наличии большого количества самоцитирований журналов обнаруживается связь между нормированным рейтингом и количеством ссылок, а связь с учетом самоцитирования несколько сильнее, чем без самоцитирования. Анализ распределения журналов по тематическим группам показывает, что использование в качестве критерия единственного признака, такого как OECD, не позволяет сформировать группу как сообщество журналов, имеющее единственную компоненту сильной связности в графе цитирования. Делается вывод о том, что методы исследования графов цитирования журналов являются хорошей основой для сравнительного анализа характеристик журналов и их ранжирования, а значит, могут быть использованы как инструменты для дальнейшего развития и совершенствования рейтингов журналов.

Ключевые слова: рейтинг журналов, Russian Science Citation Index, Math-Net.Ru, граф цитирования журналов, импакт-фактор, степень влиятельности.

Разработка cистемы поиска и индексирования контента аудиозаписей

Роман Алексеевич Климов, Азат Шавкатович Якупов
483-497
Аннотация:

Статья посвящена разработке системы поиска и индексации аудиофайлов с использованием автоматического распознавания речи (ASR) и Elasticsearch. Проанализированы актуальные системы транскрибирования аудиофайлов на русском языке и выбрана система whisper как лучшая. Создан алгоритм оптимизации скорости транскрибирования с помощью параллелизации процессов обработки файла, продемонстрирована его эффективность. Построена система на микросервисной архитектуре, способная индексировать контент аудиофайлов и их мета-данные для поиска. Результаты исследования показали, что предложенный подход может быть применен для создания эффективных и гибких систем поиска и аналитики аудиоинформации.

Ключевые слова: транскрибирование, индексирование, параллелизация, микросервисы, масштабируемость.

Методология и технология создания многоцелевой информационной среды T-System на базе электронной библиотеки с гибким полнотекстовым поиском

С.Х. Ляпин, А.В. Куковякин
Аннотация: Описана методология и технология построения многоцелевой информационной среды T-System путем расширения информационной системы T-Libra и предназначенной для интеграции ресурсов и сервисов, характерных для электронной библиотеки с гибким полнотекстовым поиском, виртуального музея, электронного архива, исследовательской лаборатории, образовательного сервера. Методологической основой интеграции является гибридная двухуровневая онтология, основанная на взаимодействии функциональных систем (верхний уровень), библиотеки концептов и библиотеки тезаурусов (нижний уровень). Технологической основой – унифицированная поисковая система, включающая в себя механизм нелинейных каскадных запросов, формирующих соответствующие функциональные системы и соединяющих результаты полнотекстового поиска, релевантные тезаурусы и концепты, текстовые метаданные, а также нетекстовые объекты различной модальности (графика, звук, видео и т.д.). Вся среда проектируется в трехзвенной архитектуре (Веб-браузер / Веб-сервер + Сервер приложений / Cервер баз данных), с использованием специальной системы индексации для повышения эффективности поиска, а также внешней логики, встроенной в сервер приложений и обеспечивающей совместимость с различными СУБД.

Технология наполнения предметных онтологий пространства научных знаний

Николай Евгеньевич Каленов
101-115
Аннотация:

Под предметной онтологией в контексте этой статьи понимается совокупность ключевых понятий, относящихся к некоторой области науки, с их семантическими связями, дополненная индексами различных классификационных систем, описывающих данную научную область. Предметные онтологии являются необходимой составляющей каждого подпространства, входящего в Единое цифровое пространство научных знаний (ЕЦПНЗ). В данной статье приводятся результаты исследований, связанных с построением предметных онтологий на базе созданной автоматизированной системы поддержки терминологических словарей и предлагается методология выделения новых ключевых терминов отдельной области науки. Предлагаемая методология базируется на использовании существующих классификационных систем в совокупности с базами данных цитирования (БДЦ), такими как Web of Science и Scopus для англоязычных публикаций и Российский индекс цитирования (РИНЦ) – для русскоязычных. Методология предполагает разбиение научной области на ряд разделов в соответствии с выбранной классификационной системой, выделение из БДЦ ядра статей, относящихся к каждому разделу, а из статей – новых авторских ключевых терминов, которые и должны составлять, в совокупности с соответствующими разделами классификационных систем, основу предметной онтологии данной научной области.

Ключевые слова: пространство научных знаний, предметная онтология, базы данных цитирования, ключевые термины, тезаурус для онтологии знаний, классификационные системы.

Модель самотрансформации графов, основанная на операции изменения конца ребра

Игорь Борисович Бурдонов
315-335
Аннотация: Рассмотрена распределенная сеть, топология которой описана неориентированным графом. Сеть может сама изменять свою топологию, используя специальные «команды», подаваемые ее узлами. В работе предложена предельно локальная атомарная трансформация acb изменения конца c ребра ac, «движущегося» вдоль ребра cb от вершины c к вершине b. В результате этой операции ребро ac удаляется, а ребро ab добавляется. Такая трансформация выполняется по «команде» от общей вершины c двух смежных ребер ac и cb. Показано, что из любого дерева можно получить любое другое дерево с тем же множеством вершин, использовав только атомарные трансформации. Если степени вершин дерева ограничены числом d (d3), то трансформация не нарушает этого ограничения. В качестве примера цели такой трансформации рассмотрены задачи максимизации и минимизации индекса Винера дерева с ограниченной степенью вершин без изменения множества его вершин. Индекс Винера – это сумма попарных расстояний между вершинами графа. Максимальный индекс Винера имеет линейное дерево (дерево с двумя листовыми вершинами). Для корневого дерева с минимальным индексом Винера определены его вид и способ вычисления числа вершин в ветвях соседей корня. Предложены два распределенных алгоритма: трансформации дерева в линейное дерево и трансформации линейного дерева в дерево с минимальным индексом Винера. Доказано, что оба алгоритма имеют сложность не выше 2n–2, где n – число вершин дерева. Также рассмотрена трансформация произвольных неориентированных графов, в которых могут быть циклы, кратные ребра и петли, без ограничения на степени вершин. Показано, что любой связный граф с n вершинами может быть преобразован в любой другой связный граф с k вершинами и тем же числом ребер за время не более 2(n+k)–2.
Ключевые слова: распределенная сеть, самотрансформация графов, индекс Винера.

Исследование библиографических ссылок в Math-Net.ru с использованием графа цитирования журналов

Андрей Анатольевич Печников, Дмитрий Евгеньевич Чебуков
923-943
Аннотация:

По данным портала Math-Net.Ru построен граф цитирования журналов, дугами в котором являются цитирования с 2002 по 2021 годы. Для повышения достоверности модели был выбран временной интервал цитирования с 2010 по 2021 годы, когда распределение цитирующих статей стабилизировалось на уровне 3500–4500 цитирований за год. Исследована структура старения ссылок и показано, что время их полужизни равно 8 годам. Поэтому дата издания цитируемых статей была ограничена 2002 годом. Для построенного графа цитирования получены основные свойства, такие как маленький диаметр и высокая плотность, свидетельствующие о высоком уровне научных коммуникаций в Math-Net.Ru. Показано отсутствие «эффекта Матфея» как ярко выраженного преимущества в цитировании состоявшихся журналов по отношению к менее известным. Адекватность графа цитирования журналов Math-Net.Ru как модели научных коммуникаций подтверждается сравнением ранжирования журналов в графе цитирования с их рейтингом SCIENCE INDEX в eLIBRARY.RU. Показана прямая умеренная связь между двумя ранжированиями. Сделан ряд содержательных выводов, следующих из анализа графа цитирования.

Ключевые слова: библиографическая ссылка, граф цитирования журналов, старение библиографических ссылок, индекс Матфея, математический портал Math-Net.Ru.

Бизнес-процессы интеграции электронного каталога библиотеки и репозитория Самарского университета

Мария Борисовна Мишанина, Оксана Владимировна Петрова
963-969
Аннотация: Институциональные репозитории (ИР) повышают общественную ценность, рейтинг, престиж и видимость как отдельных исследователей, так и соответствующих университетов. Репозитории наполняются за счет собственного контента и предоставляют к нему доступ другим исследователям по всему миру. Количество ИР растет за счет подключения к работе по их созданию вузовских библиотек. Библиотеки заинтересованы в том, чтобы все материалы, размещаемые в ИР университета, были востребованы пользователями и использовались в учебном и научном процессе. Поэтому, кроме собственной поисковой системы репозитория и поисковых индексов Google и Яндекс, ресурсы ИР должны быть отражены в электронном каталоге, что максимально приближает их к читателю. В статье описаны бизнес-процессы, внедренные библиотекой Самарского университета в практику работы с электронными ресурсами репозитория университета.
Ключевые слова: библиотека университета, институциональный репозиторий, бизнес-процесс, рабочий процесс, электронный ресурс, электронная публикация, электронное издание, информационные технологии, электронный каталог, база данных, репозиторий открытого доступа.

Научное соавторство в российской математике в 2000–2020 годах: исследование на примере известных российских журналов

Екатерина Александровна Знаменская, Андрей Анатольевич Печников, Дмитрий Евгеньевич Чебуков
22-40
Аннотация:

Научное соавторство является непосредственным отражением научного сотрудничества. Существуют эмпирические доказательства ценности соавторства, например, статьи с большим количеством авторов, как правило, цитируются чаще, что важно для подсчета различных индексов. Многие зарубежные исследования показывают рост соавторства как в целом, так и в различных научных дисциплинах, однако судить о ситуации с соавторством российских учёных на основании исследований по данным Web of Science или Scopus достаточно сложно по ряду причин.


В настоящей работе по данным портала Math-Net.Ru исследованы некоторые вопросы соавторства в области математических и компьютерных наук в России. В частности, за 2000–2020 годы показаны небольшой, но постоянный прирост среднего числа соавторов на одну публикацию и увеличение количества статей, написанных в соавторстве.

Ключевые слова: соавторство, Math-Net.Ru, тематическое сообщество, граф соавторства.

Университетская библиотека в научно-исследовательском процессе вуза: опыт систематизации данных о публикационной активности

Натела Нодарьевна Квелидзе-Кузнецова, Светлана Александровна Морозова, Алексей Дмитриевич Матюшенко
923-941
Аннотация: Фундаментальная библиотека Герценовского университета традиционно является ключевым звеном в цепи построения эффективной научно-исследовательской деятельности университета и ее воплощения в публикациях. Новым этапом данной деятельности стали создание и развитие библиотекой программного модуля, функционирующего в РГПУ им. А. И. Герцена и позволяющего в режиме реального времени осуществлять вывод структурированных текущих и сравнительных данных о наукометрических показателях преподавателей и научных сотрудников университета. Программный модуль был создан на основе взаимодействия базы данных с API наукометрических ресурсов: Российский индекс научного цитирования, Scopus и Web of Science с целью дальнейшей обработки и систематизации получаемых данных. Особое внимание авторами уделено перспективам развития созданного комплекса и возможностям интеграции данных, в том числе, уже реализованной синхронизации сведений с профилями преподавателей на сайте университета.
Ключевые слова: индексы цитирования, наукометрия, наукометрические показатели, базы данных, информационные системы, программные модули, API.

Восстановление многомерной формы обращений к линеаризованным массивам в системе SAPFOR

Никита Андреевич Катаев, Владислав Николаевич Василькин
770-787
Аннотация: Система автоматизированного распараллеливания SAPFOR (System FOR Automated Parallelization) включает инструменты для анализа и преобразования программ, основной ее целью является снижение сложности распараллеливания программ. Система SAPFOR ориентирована на исследования многоязыковых вычислительных комплексов, разрабатываемых на языках программирования Фортран и Си. Для анализа программ в этой системе используется низкоуровневое их представление в виде LLVM IR, которое позволяет проводить различные оптимизации с целью повышения качества анализа программ. При этом оно теряет некоторые особенности программы, отражаемые ее представлением на языке высокого уровня. Одной из таких особенностей является многомерная структура используемых массивов. Анализ зависимостей по данным является одним из ключевых при исследовании возможности параллельного выполнения программ. При этом такой анализ относится к классу NP-трудных задач. Знание многомерной структуры массивов позволяет во многих случаях учесть структуру индексных выражений в обращениях к массивам и снизить сложность проводимого анализа. Кроме того, использование многомерных массивов позволяет повысить уровень параллелизма в программе за счет использования многомерных решеток процессоров и распараллеливания гнезд циклов, а не отдельных циклов в гнезде. Данная возможность естественным образом поддерживается в DVM-системе. В настоящей работе рассмотрен подход, применяемый в системе SAPFOR для восстановления формы многомерных массивов и обращений к ним по их линеаризованному представлению в LLVM IR. Предложенный подход был успешно протестирован на различных приложениях, включая тесты производительности из набора NAS Parallel Benchmarks.
Ключевые слова: анализ программ, автоматизация распараллеливания, SAPFOR, DVM, LLVM.

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров
61-85
Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.
Ключевые слова: семантический анализ, издательские системы.
1 - 13 из 13 результатов
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества