• Main Navigation
  • Main Content
  • Sidebar

Russian Digital Libraries Journal

  • Home
  • About
    • About the Journal
    • Aims and Scopes
    • Themes
    • Editor-in-Chief
    • Editorial Team
    • Submissions
    • Open Access Statement
    • Privacy Statement
    • Contact
  • Current
  • Archives
  • Register
  • Login
  • Search
Published since 1998
ISSN 1562-5419
16+
Language
  • Русский
  • English

Search

Advanced filters

Search Results

Служба управления потоками работ по манипулированию ресурсами репозитория

А.К. Нестеренко, А.А. Бездушный, Т.М. Сысоев, А.Н. Бездушный, В.А. Серебряков
Abstract: В работе рассматриваются проблемы и задачи, возникающие при манипулировании ресурсами репозиториев цифровых библиотек, информационных Интернет систем и порталов. Анализируются соответствующие требования к службе управления потоками работ, которая в этом случае должна обеспечить управление созданием и модификацией информационных ресурсов произвольных типов. Описывается реализация такой службы, ее роль и место в новой версии системы ИСИР [8, 9, 10]. Реализация следует стандартам WfMC [4]; канонической модели и языку спецификации потоков работ [5]. Решение демонстрируется в применении к управлению потоками работ по сопровождению ресурсов Информационного Web-портала РАН [11].

About Descriptions of Some Bounary-Value Problems in the Semantic Library LibMeta

Olga Muratovna Ataeva, Vladimir Alekseevich Serebriakov, Natalia Pavlovna Tuchkova
2-21
Abstract:

An ontological design approach was used to describe the semantics of some boundary value problems in the LibMeta digital library. To describe problems in the LibMeta library, connections of terms and concepts with classical definitions of the mathematical encyclopedia and other primary sources have been established. Establishing links allows you to form a dictionary and thesaurus of the applied subject area of new boundary value problems and place the results in the semantic environment of the digital library. Examples of this approach are demonstrated using the capabilities of the LibMeta semantic library, which contains a digitized version of the mathematical encyclopedia, encyclopedia of mathematical physics, classifiers, and applied mathematical thesauri and dictionaries. New terms from publications, after being added to the content of the library, were reflected with links in the mathematical encyclopedia. The thesaurus for problems in the elasticity theory domain was created for the first time by integrating subject dictionaries, classifiers, metadata of specialized journal publications and encyclopedic content of the LibMeta library. The purpose of such research is to provide the user with additional services in the search for publications in the applied scientific field.

Keywords: applied ontology, subject domain thesaurus, data sources, ontology development, LibMeta semantic digital library.

Spatial data infrastructure for the scientific research

О.М. Атаева, А.В. Кошкарев, А.А. Медведев, В.А. Серебряков, К.Б. Теймуразов
Abstract: Обсуждаются планы создания Академической инфраструктуры пространственных данных как элемента единого научного пространства РАН. Приводятся результаты ее реализации, в том числе геопорталы будущей распределенной сети узлов «ГеоМета» ВЦ РАН (http://www.geometa.ru) и ИГ РАН (http://asdi.igras.ru), и проект по особо охраняемым природным территориям России на основе интегрированной прикладной схемы в соответствии со спецификацией Директивы INSPIRE Европейского союза.
Keywords: spatial data, spatial data infrastructure, geoportal, protected site, metadata.

Electronic libraries in the Computing Center of Russian Rcademy of Sciences – main developments

Владимир Алексеевич Серебряков
534-566
Abstract: The main projects that have been implemented in the Computing Center named A.A. Dorodnitsyna of the Russian Academy of Sciences (CC RAS) for the last 20 years, that is, since 1998, are analyzed. One of the first was the implementation of the pilot project “Integrated Information Resource System (ISIR) RAS”. The successful completion of this project allowed the development of work on the integration of heterogeneous scientific information resources into the general academic scientific information system. An important stage was the project of creating the Unified Scientific Information Space (ENIP) of the RAS. This project was based on the subsystem “Scientific Institute of the Russian Academy of Sciences”, created at the CC of the Russian Academy of Sciences and the Center for Scientific Telecommunications (CNTK) of the Russian Academy of Sciences. Considering the importance of building digital libraries, in 2006 the Russian Academy of Sciences adopted the target scientific program “Creating the Central Bank “Scientific Heritage of Russia”, in accordance with which the digital library was implemented. The created GeoMeta Portal is a standardized and decentralized spatial information management environment designed to access geodatabases, map products and associated metadata from various sources, facilitating the exchange of spatial information between organizations and its sharing via the Internet. Currently, the main line of work is the LibMeta digital personal semantic library. The main task of this system is to provide the user with a unified view for the possibility of automated extraction of information of interest to him on a particular subject area.
Keywords: subject area, scientific subject area, scientific information, scientific knowledge, generalized representation of scientific subject area, taxonomy, thesaurus, global ontology, search engines, organization of scientific knowledge, digital libraries.

Архитектура и технологии RDFS-среды разработки цифровых библиотек и Web-порталов

А.А. Бездушный, А.К. Нестеренко, Т.М. Сысоев, А.Н. Бездушный, В.А. Серебряков
Abstract: В работе рассматривается общая архитектура новой версии системы ИСИР, опирающейся на открытые стандарты W3C: Semantic Web [SW], XML[XML] технологии, и на применение opensource решений. Архитектура позволяет разрабатывать распределённые объектно-ориентированные информационные системы - цифровые библиотеки, информационные и корпоративные порталы, сайты на базе различных типов хранилищ информации, таких как объектные и реляционные базы данных, LDAP-каталоги. Система параметризуется описанием объектной схемы данных конкретной предметной области и легко адаптируется к её изменениям. Для описания схемы используется W3C стандарт на описание схем Интернет ресурсов - RDFS. Архитектура имеет многоуровневую модульную организацию, каждый уровень имеет собственные цели и абстракции. Фундамент решения - ядро ИСИР - унифицирует механизмы работы с хранимыми объектными данными, предоставляет ряд услуг по управлению этими данными, например, разграничение прав доступа, журнализация изменений. На базе ядра строятся более высокоуровневые сервисы такие, как RDF/XML-обмен данными, репликация информации между репозиториями, атрибутно - полнотекстовая индексация данных и др. Имеются средства для простой и эффективной разработки пользовательских Web-интерфейсов. Средства публикации информации и построения отчётов применяют механизмы XSLT и поддерживают широкий спектр целевых форматов. Служба управления потоками работ по редактированию ресурсов репозиториев следует стандартам WfMC - канонической модели и языку спецификации потоков работ XPDL. Служба управления содержанием Web-сайта обеспечивает мульти - иерархическую каталогизацию слабоструктурированной информации, отличающейся нерегулярностью взаимосвязи ее элементов.

Modeling an Adaptive Interface using Semantic Ontology Relations

Olga Muratovna Ataeva, Vladimir Alekseevich Serebriakov, Natalia Pavlovna Tuchkova
2-17
Abstract:

The work is devoted to the problem of customizing the user interfaces of an information system that integrates data. An adaptive interface serves as one of the means of organizing the presentation of subject domain data. The issue of using the semantic relations of ontology to select data corresponding to the objectives of the study is investigated. A model of an adaptive interface is considered, which allows the most accurate reflection of the needs of a researcher within a particular subject domain. It is shown how the adaptive interface is formed by means of the semantic library model.

Keywords: ontology, adaptive interface, subject domain, data model.

Возможности технологий ИСИР в поддержке Единого Научного Информационного Пространства РАН

А.А. Бездушный, А.К. Нестеренко, Т.М. Сысоев, А.Н. Бездушный, В.А. Серебряков
Abstract: Работа посвящена вопросам обеспечения интеграции информационных ресурсов РАН, информационной поддержки научных исследований в рамках Единого Научного Информационного Пространства (ЕНИП) РАН. Рассматриваются потребности, цели и задачи организации ЕНИП РАН, как среды взаимосвязанных распределённых гетерогенных систем. Обсуждается возможности применения технологии ИСИР для обеспечения решения этих задач, которые могут использоваться как для формирования инфраструктурных элементов среды, так и для создания адаптеров существующих систем и реализации новых с широкой гаммой вариации соответствующих служб. Кратко рассматривает архитектурные принципы последних разработок ИСИР, применение Semantic Web-технологий и многоуровневое деление архитектуры, инструментарий разработчика ИСИР и разработка информационных систем и Web-порталов на базе технологий ИСИР.

The Third All-Russian Symposium "Infrastructure of scientific information resources and systems"

Е.Б. Кудашев, В.А. Серебряков
Abstract: This article analyzes the work of the Third All-Russian Symposium "Infrastructure scientific information resources and systems", held in Sukhum, Abkhazia, 5-8 October 2013. The avalanche growth of electronic content required the development of new approaches to storage and continuous access to digital scientific data. Of particular interest are the current scientific tasks of creating spatial data infrastructures. Symposium traditionally discusses issues related to the integration of geographic information resources and free access to them, research e-Infrastructures to form a distributed scientific information resources, development of related directories and create a network of integrated, interoperable databases. The development of e-Science Infrastructures should be the basis of emerging systems for collective work of researchers based on a virtual integration of information and computing resources. The main focus of the Third Symposium were questions the use of modern approaches to technology development of information systems to the problems of informational support of scientific research.
Keywords: digital content, scientific data, the formation of digital infrastructure, continuous access and long-term storage of data.

RDFS как основа среды разработки цифровых библиотек и Web-порталов

А.А. Бездушный, А.Н. Бездушный, А.К. Нестеренко, В.А. Серебряков, Т.М. Сысоев
Abstract: В работе рассматриваются основные цели, понятия и технологии Semantic Web, анализируются перспективы их поддержки. Приводится сопоставление парадигмы Semantic Web с традиционными парадигмами программирования. Описывается место RDF(S) в новой версии системы ИСИР [ISIR], опирающейся на открытые стандарты W3C: Semantic Web, XML технологии, использующей open-source Java решения. Рассматриваются совокупность расширений RDFS, обусловленных требованиями системы.

On the Synonym Search Model

Olga Muratovna Ataeva, Vladimir Alekseevich Serebriakov, Natalia Pavlovna Tuchkova
1006-1022
Abstract:

The problem of finding the most relevant documents as a result of an extended and refined query is considered. For this, a search model and a text preprocessing mechanism are proposed, as well as the joint use of a search engine and a neural network model built on the basis of an index using word2vec algorithms to generate an extended query with synonyms and refine search results based on a selection of similar documents in a digital semantic library. The paper investigates the construction of a vector representation of documents based on paragraphs in relation to the data array of the digital semantic library LibMeta. Each piece of text is labeled. Both the whole document and its separate parts can be marked. The problem of enriching user queries with synonyms was solved, then when building a search model together with word2vec algorithms, an approach of "indexing first, then training" was used to cover more information and give more accurate search results. The model was trained on the basis of the library's mathematical content. Examples of training, extended query and search quality assessment using training and synonyms are given.

Keywords: search model, word2vec algorithm, synonyms, information query, query extension.

Предложения по наборам метаданных для научных информационных ресурсов ЕНИП РАН

А.А. Бездушный, А.Н. Бездушный, А.К. Нестеренко, В.А. Серебряков, Т.М. Сысоев
Abstract: Рассматриваются вопросы формирования наборов элементов метаданных и онтологий для научных информационных ресурсов РАН в рамках проекта Единого Научного Информационного Пространства (ЕНИП) РАН. Рассматриваются потребности, цели и задачи организации ЕНИП РАН, как среды взаимосвязанных распределённых гетерогенных систем. Даётся представление о предметных областях и типах ресурсов, информацию о которых планируется представлять в ЕНИП. Описывается методика, используемая для описания схем метаданных, приводится список проанализированных стандартов и предложений по схемам метаданных, использованных при разработке схем ЕНИП. Рассматриваются примеры схем метаданных ЕНИП и XML-представления данных для обмена ими в рамках ЕНИП.

Ontological modeling as a means of integration data on substances and materials properties

А.О. Еркимбаев, В.Ю. Зицерман, Г.А. Кобзев, В.А. Серебряков, Л.Н. Шиолашвили
Abstract: We consider features of object domain “Substances and materials properties” treated as a testing area for development of ap-proaches to the integrity of science DB. Specific exam-ples illustrate capabilities of the ontological modeling for the semantic integration of numerical data. A gen-eral sketch of the ontology is proposed for thermody-namic data of pure compounds.
Keywords: ontological modeling, formalization of the domain, numerical integration of the data, the thermodynamic properties of the substance.

Архитектура Сервисов Интегрированной Системы Информационных Ресурсов (ИСИР)

А.Н. Бездушный, Д.А. Ковалев, В.А. Серебряков

Semantic library as a tool of defining a scientific subject area

Olga Muratovna Ataeva, Vladimir Alekseevich Serebriakov
988-1005
Abstract:

The paper considers an information system designed to represent a subject area related to science and its features. Highlighted general concepts for formal descriptions of such a subject area in the knowledge base of the semantic library. The peculiarity of these areas is that the data structure is subject to frequent changes. Therefore, the means of organizing knowledge, which is a semantic library, should be sufficiently universal and not require deep technical knowledge. The paper describes the functionality of the system and its use. For each area, the set of resources can differ both in format and in the set of the resources themselves. The set of concepts that form the description of the library's content should be so universal that it can be adapted to the needs of a particular area. Three levels of metadata are used to represent the data.

Keywords: semantic library, ontology, knowledge representation.

Интеграция распределенных данных на основе технологий Semantic Web и рабочих процессов

А.К. Нестеренко, Т.М. Сысоев, А.А. Бездушный, А.Н. Бездушный, В.А. Серебряков
Abstract: В данной статье рассматривается один из подходов к осуществлению задач интеграции распределенной информации посредством выполнения «открытых запросов» к внешним системам под контролем управляемых потоков работ. Рассматриваются возникающие задачи и направления дальнейшего развития подхода.

Publishing the Data on Protected Sites in Linked Open Data Space

К.А. Кузнецов, В.А. Серебряков, К.Б. Теймуразов
Abstract: This article presents the framework that incorporates two modern trends in data publishing: Linked Open Data technologies and spatial data publishing technologies. The framework includes components for semantic data publishing from relational data sources, data integration and link generation. The SPARQL query answering algorithm that utilizes generated linksets is introduced. This article also presents the Protected Sites ontology for Linked Open Data Space, which follows INSPIRE recommendations and involves common RDF vocabularies.
Keywords: system integration of spatial data, Linked Open Data, RDF-sets of links, sub-system data publication, data binding.

Метаданные ИСИР: определение и использование

А.Н. Бездушный, А.М. Меденников, А.М. Серебряков, А.А. Филиппова, А.С. Лопатенко

Authors Identification within the Subject Area in the Semantic Library

Olga Muratovna Ataeva, Vladimir Alekseevich Serebriakov, Natalia Pavlovna Tuchkova
198-217
Abstract:

The peculiarities of the task of authors identifying and determining author's contribution to publications in digital bibliographic codes are considered. The features of the problem of insufficient identification are manifested in the repetition of information, doubling, the presence of authors with completely coincidental names, self-quotation, autoplagiate and plagiarism itself. It is proposed to use publication information that has already been accumulated in the digital library in the form of related object area data and a variety of target thesaurus data, as the author and user of the library. This information contains links whereby keyword contexts, multiple co-authors, and term associations in dictionaries and thesauruses can be used to identify authorship. It is important that an array of scientific publications is considered, since they have an established traditional structure, which allows comparing fixed text elements (annotations, keywords, classifier codes, etc.). Thus, even if the names in the publications are fully matched, the question of authorship can be raised if the publications in the digital library correspond to different subject areas. Resolution of such contradictions is accomplished by evaluating a plurality of links of all elements of secondary publication information. The result of the comparison could be the addition of the author to a specific area, i.e. the extension of the addressee's thesaurus and the author's personal thesaurus, or the appearance of full namesakes in the library, but from different areas of knowledge. It has been shown that modern data analysis tools allow you to evaluate the author's contribution to publication, despite the fact that of course, only the scientific community can evaluate the real contribution to scientific research.

Keywords: comparison of scientific texts, semantic search, thesaurus for the ontology of knowledge information, query using the thesaurus methods of authors identification, addressee thesaurus, secondary information, individual frequency dictionary, LibMeta.

О реализации веб-системы математической информации

А.С. Аджиев, А.Н. Бездушный, В.А. Серебряков
Abstract: На основе проведенного ранее анализа российских математических электронных ресурсов, а так же опыта зарубежных математических информационных систем описан проект создаваемой математической информационной системы Math-Net.RU. Базовой платформой системы Math-Net.RU является универсальная информационная система ИСИР.
Проект описан в терминах перечня требований и условий, которым должна удовлетворять создаваемая система. Рассмотрены и проанализированы альтернативные варианты реализации различных компонент системы, а также пути решения возникающих при этом проблем. Очерчены категории хранимой информации, целевой круг пользователей системы и требуемая функциональность. Описана общая архитектура, схема данных, пользовательские интерфейсы, а также способы наполнения системы информацией, актуализации и синхронизации данных из других информационных систем и баз данных. Рассмотрены проблемы представления математических текстов и формул в информационных системах, дан сравнительный анализ существующих форматов хранения. Очерчены так же перспективы участия системы Math-Net.RU в создаваемой Всемирной математической информационной системе Math-Net, а также требования к системе-участнику.

Integration capabilities of Digital library management system LibMeta

А.А. Каленкова, В.А. Серебряков
Abstract: Digital library management system LibMeta is presented. It provides a means of library and museum metadata integration. Metadata schema of Digital library management system LibMeta which is based on ENIP schema is exposed. It contains main, library profiles and also profiles to work with museum and media objects. Integration of information from different sources could lead to duplication of resource descriptions. Detailed integration algorithm is given; it helps to avoid duplication of resource descriptions.
Keywords: digital library, metadata, data integration.

Ontological Approach to the Description of a Common Digital Space of Scientific Knowledge

Olga Muratovna Ataeva, Nikolay Evgenevich Kalenov, Vladimir Alekseevich Serebriakov
3-19
Abstract:

Despite the development of technical means, the processes associated with the search for complete and accurate scientific information in a huge number of data sources are becoming more complicated. To reach a new level in the use of information processing technologies, first of all, a transition to a semantically meaningful representation is necessary for scientific knowledge extracted from information in a digital environment. In modern conditions, characterized by multidisciplinary research, the desired effect can be achieved by developing universal approaches to the storage and presentation of scientific knowledge. These approaches are reflected in the concept of the Common Digital Space of Scientific Knowledge. The paper presents an overview of the basic concepts in this area, which are used both to represent the elements of space and to provide access to them not only for humans, but also for software agents. Semantic libraries are considered as tools for constructing the knowledge space.

Keywords: knowledge space, digital knowledge space, ontologies, metadata, scientific knowledge, metadata levels, ontology deisng, semantic libraries.

О реализации службы управления содержанием

Т.М. Сысоев, А.К. Нестеренко, А.Н. Бездушный, В.А. Серебряков, А.А. Бездушный
Abstract: Важная часть любой информационной Web-системы будь-то сайт или портал - это представление информации, данных – содержания информационной системы. Соответственно важнейшей функцией Web-системы является управлять этим содержанием. Служба управления содержанием призвана обеспечить сквозное управление единицами содержания, их взаимосвязями, образуемыми ими структурами и существенно снизить трудоемкость сопровождения информационной Web-системы. Как правило, службы управления содержанием осуществляют манипулирование слабоструктурированной информацией, отличающейся нерегулярностью взаимосвязи ее элементов, редкостью изменений, такой как информационно-публицистические материалы сайта, пресс-релизы. Вследствие этого они обычно обеспечивают иерархическую каталогизацию данных одного типа – разделы/документы. В системе ИСИР [4-7] мы стремимся в рамках службы управления содержанием обеспечить разностороннюю поддержку информационного содержания порталов и сайтов. Мы полагаем, что служба должна включать не только средства управления неструктурированной информацией, но интегрироваться со средствами управления структурированной информацией, предоставлять средства сопряжения слабоструктурированных и структурированных данных, в частности, включения вторых в первые, механизмы атрибутно-полнотекстового индексирования данных обоих видов, поддержки технической и семантической интероперабельности с распределенными источниками содержания Web-системы. В работе рассматривается решения и некоторые технические моменты текущей реализации такой службы системы ИСИР.

On Presentation of the Results of a Scientific Institute in the Form of a Knowledge Graph in a Semantic Library

Olga Muratovna Ataeva, Vladimir Alekseevich Serebryakov , Natalia Pavlovna Tuchkova
798-818
Abstract:

The problem of presenting scientific results of academic institute in a digital environment is considered. A new look at the knowledge space of a scientific institute constitutes a natural stage in the development of WEB technologies. The data structure inherent in previous studies allows you to organize search and navigation through them using a knowledge graph, like a version of the semantic library LibMeta. The knowledge graph gives a more complete and high-quality idea of the knowledge space, often removing the cognitive load in the perception of complex structures and data connections.

Keywords: digital library LibMeta, applied ontology, knowledge graph, data sources, ontology development, scientific results in the digital environment, scientific institute.

Spatial data integration environment "GeoMeta"

О.М. Атаева, К.А. Кузнецов, В.А. Серебряков, В.И. Филиппов
Abstract: The spatial data portal GeoMeta is described as a standardized and decentralized spatial information management environment, designed for access to geodata, cartographic products and related metadata from various sources. The main features of the portal are discussed, with the accent on the expansions, realized in its last versions.
Keywords: spatial data, spatial data infrastructure, geoportal, metadata.

Creation of Query Expansion Based on the Subject Domain Thesaurus in the Ontology of Knowledge of the Semantic Library

Olga Muratovna Ataeva, Vladimir Alekseevich Serebriakov, Natalia Pavlovna Tuchkova
271-291
Abstract: Possibilities of query expansion with subject area thesaurus are discussed. The role of the context defined by thesaurus term links is both to refine the query and to increase the size of the sample on the query. Of particular importance is the process of expanding the query for scientific subject areas where the search based on special terminology. In this case, thesauruses of subject areas must be used to minimize the occurrence of information noise. The proposed approach takes into account the application of similar terminology in various subject areas. Examples of the use of thesaurus of separate sections of equations of mathematical physics and related fields demonstrate the effectiveness of the chosen approach of research. By linking to concepts of information resources of other areas of knowledge, the extension of the information query captures search fields of remote subject areas and various types of data, texts, symbolic, audio and video archives. Research shows that expanding the query based on context semantics improves the search quality of scientific publications in digital information and increases the effectiveness of scientific interdisciplinary research.
Keywords: comparison of scientific texts, semantic search, thesaurus for the ontology of knowledge, information query using the thesaurus, LibMeta.
1 - 25 of 25 items
Information
  • For Readers
  • For Authors
  • For Librarians
Make a Submission
Current Issue
  • Atom logo
  • RSS2 logo
  • RSS1 logo

Russian Digital Libraries Journal

ISSN 1562-5419

Information

  • About the Journal
  • Aims and Scopes
  • Themes
  • Author Guidelines
  • Submissions
  • Privacy Statement
  • Contact
  • eLIBRARY.RU
  • dblp computer science bibliography

Send a manuscript

Authors need to register with the journal prior to submitting or, if already registered, can simply log in and begin the five-step process.

Make a Submission
About this Publishing System

© 2015-2025 Kazan Federal University; Institute of the Information Society