• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Международная виртуальная обсерватория: десять лет спустя

О.Ю. Малков, О.Б. Длужневская, О.С. Бартунов, И.Ю. Золотухин
Аннотация: Международная виртуальная обсерватория представляет собой реализацию концепции электронной науки в астрономии. Это мощная виртуальная среда, предназначенная для увеличения возможностей астрономических исследований и научного выхода данных. Виртуальная обсерватория интегрирует в единую среду гигантские астрономические архивы и базы данных, распределенные по всему миру, а также инструменты анализа данных и вычислительный сервис, используя при этом набор однородных стандартов и технологий. Международная виртуальная обсерватория объединяет все значительные национальные и международные проекты по созданию виртуальных обсерваторий, основная цель которых – объединить существующие архивы наземных и космических инструментов и обеспечить исследователям и общественности удобный доступ к ним. Эта задача представляется весьма значительной не только из-за колоссального объема астрономических данных, но и их спектрального разнообразия (от рентгена до радио). Каждый спектральный диапазон предоставляет свою, уникальную информацию о небесном объекте или явлении; при этом требуется специализированная экспертиза для правильной интерпретации. Вся эта информация также интегрируется в Международной виртуальной обсерватории и позволяет синтезировать данные, чтобы использовать их в конкретных научных приложениях.
Ключевые слова: virtual observatory, e-science, astronomical data.

Цифровая платформа для интеграции и анализа данных геофизического мониторинга байкальской природной территории

Андрей Павлович Григорюк, Людмила Петровна Брагинская, Игорь Константинович Семинский, Константин Жанович Семинский, Валерий Викторович Ковалевский
303-316
Аннотация:

Представлена цифровая платформа для данных комплексного мониторинга опасных геодинамических, инженерно-геологических и гидрогеологических процессов, протекающих в регионе интенсивного природопользования центральной экологической зоны Байкальской природной территории (ЦЭЗ БПТ). Платформа предназначена для интеграции и анализа данных, поступающих с нескольких полигонов, расположенных в пределах ЦЭЗ БПТ, с целью оценки состояния геологической среды и прогнозирования проявлений опасных процессов. Платформа построена по клиент-серверной архитектуре. Хранение, обработка и анализ данных осуществляются на сервере, к которому пользователи могут обращаться через интернет посредством веб-браузера. Блочная структура сервера позволяет легко расширять набор процедур обработки и анализа данных, а также визуализации результатов. В настоящее время доступны несколько методов фильтрации данных (линейная частотная, Савицкого–Голея и другие), различные методы спектрального и вэйвлет-анализа, мультифрактальный и энтропийный анализ, анализ пространственных данных. Цифровая платформа была опробована на реальных данных.

Ключевые слова: геофизический мониторинг, цифровая платформа, предвестники, сейсмический прогноз, землетрясения.

Определение зависимостей по данным средствами динамического анализа системы SAPFOR

Никита Андреевич Катаев, Александр Андреевич Смирнов, Андрей Дмитриевич Жуков
473-493
Аннотация: Использование указателей и косвенной адресации в программе, а также сложная структура графа потока управления являются одними из основных препятствий при выполнении статического анализа программ. Обнаруженные в результате такого анализа свойства программы слишком консервативно описывают ее поведение и часто оказываются недостаточными для принятия решений о возможности ее параллельного выполнения. Использование динамического анализа программ позволяет расширить возможности средств автоматизации распараллеливания. В системе SAPFOR (System FOR Automated Parallelization) реализован инструмент динамического анализа, опирающийся на инструментацию программ в представлении LLVM, что позволяет исследовать программы на языках C и Fortran. Чтобы снизить накладные расходы на время выполнения инструментированной программы, сохранив при этом полноту проводимого анализа, используются возможности статического анализа, реализованного в SAPFOR. В процессе динамического анализа часть обращений к памяти, информация о которых была получена в процессе статического анализа, может быть проигнорирована. Разработанный инструмент был протестирован на тестах производительности из пакета NAS Parallel Benchmarks для языков C и Fortran. В процессе динамического анализа кроме традиционных видов зависимостей (flow, anit, output) также определяются переменные, зависимость по которым может быть устранена за счет приватизации или конвейерного выполнения циклов. Совместно с возможностями DVM и OpenMP это существенно облегчает, в том числе, и ручное распараллеливание, облегчая задание соответствующих директив компилятора.
Ключевые слова: анализ программ, динамический анализ, автоматизация распараллеливания, SAPFOR, DVM, LLVM.

Методика сетевого анализа научных публикаций

Инна Геннадьевна Ольгина
646-672
Аннотация:

Актуальность вопросов анализа значимости научных публикаций обусловлена тем, что с появлением интернет-технологий стал возможен сбор данных о сети цитирования публикаций. Между тем, существующий сегодня подход к анализу значимости научных публикаций базируется на библиометрических показателях, учитывающих только количество цитирований. Однако все более широкое применение начинает получать сетевой анализ, применяемый преимущественно в исследованиях социальных сетей. Автором разработана методика, позволяющая осуществить эффективный анализ значимости научных публикаций, которая основана на методах сетевого анализа, альтернативных библиометрическим методам. В качестве критериев оценки значимости научных публикаций, основанных на сетевом анализе, установлены релевантные меры центральности узлов сети цитирования: центральность по степени связности; близости к другим узлам; посредничеству; авторитетности; концентрации. Приведен результат эксперимента, позволивший продемонстрировать адекватность разработанной методики анализа научных публикаций на основе сетевых метрик. В качестве первичных источников данных о публикациях использованы наукометрические базы данных, позволяющие отслеживать цитируемость публикаций и выявлять соответствующие сети цитирования. Применение предложенной методики способствует выявлению важных публикаций в развитии соответствующих научных направлений.

Ключевые слова: сеть цитирования, публикации, наукометрия, библиометрический анализ, сетевой анализ, граф.

Визуализация цифровых 3D-объектов при формировании виртуальных выставок

Николай Евгеньевич Каленов, Сергей Александрович Кириллов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
418-432
Аннотация: Представлены подходы к решению задачи создания реалистичных интерактивных 3D веб-коллекций музейных экспонатов. Рассмотрено представление 3D-моделей объектов на основе ориентированных полигональных структур. Описан метод создания виртуальной коллекции 3D-моделей по технологии интерактивной анимации. Также показано, как на основе отдельных кадров экспозиции с помощью методов фотограмметрии строится высококачественная 3D-модель. Приведены результаты расчетов для построения 3D-моделей реальных музейных экспонатов. Для создания 3D-моделей с целью предоставления их широкому кругу пользователей через интернет использована технология интерактивной анимации. Приведены различия между представлениями цифровых 3D-моделей. Описана технология создания цифровых 3D-моделей объектов из фондов Государственного биологического музея им. К.А. Тимирязева и формирования на их основе средствами электронной библиотеки «Научное наследие России» виртуальной выставки, посвященной научной деятельности М.М. Герасимова и его антропологическим реконструкциям. Выставка наглядно продемонстрирована возможности интеграции информационных ресурсов средствами электронной библиотеки. Формат виртуальных выставок позволил объединить ресурсы партнеров для предоставления широкому кругу пользователей коллекций, хранящихся в музейных, архивных и библиотечных фондах.
Ключевые слова: фотограмметрия, 3D-моделирование, интерактивная мультипликация, веб-дизайн, полигональное моделирование.

Формализация процессов формирования пользовательских коллекций в цифровом пространстве научных знаний

Николай Евгеньевич Каленов, Ирина Николаевна Соболевская, Александр Николаевич Сотников
433-450
Аннотация: Исследована задача формирования цифрового пространства научных знаний (ЦПНЗ). Рассмотрено отличие этого понятия от общего понятия пространства знаний. ЦПНЗ представлено как множество, содержащее объекты, верифицированные мировым научным сообществом. Формой структурированного представления цифрового пространства знаний является семантическая сеть, основной принцип организации которой основан на системе классификации объектов и последующем построении их иерархии, в частности, по принципу наследования. Введена классификация объектов, составляющих контент ЦПНЗ. Предложена модель ЦПНЗ как совокупности непересекающихся множеств, содержащих цифровые образы реальных объектов и их характеристики, обеспечивающие отбор и визуализацию объектов в соответствии с многоаспектными пользовательскими запросами. Определено понятие пользовательской коллекции, предложена иерархическая классификация типов пользовательских коллекций. Использование понятий теории множеств при построении ЦПНЗ позволяет разбивать информацию по уровням детализации и формализовать алгоритмы обработки пользовательских запросов, что проиллюстрировано конкретными примерами.
Ключевые слова: семантическая сеть, информационное пространство, научные знания, электронная библиотека, уровни детализации, иерархия информационных объектов.

Анализ геоинформационных данных в распределенных инфраструктурах

Е.В. Шулькин, С.М. Краснопеев
Аннотация: В статье рассматривается проблема использования алгоритмов анализа пространственных данных в распределенных инфраструктурах, основанных на стандартах Открытого геопространственного консорциума. Вкратце затрагивается тема публикации алгоритмов анализа в виде исходного кода. Основное внимание уделено изложению нашего понимания о том, какой должна быть клиентская часть веб-сервисов обработки пространственных данных и как может быть организовано взаимодействие конечного пользователя с опубликованными средствами анализа данных.
Ключевые слова: анализ пространственных данных, открытый геопространственный консорциум, инфраструктура пространственных данных, Web Processing Service, WPS, клиент анализа данных.

Результаты исследований по обнаружению заимствований с использованием анализа цитирований

Вадим Николаевич Гуреев, Николай Алексеевич Мазов
322-331
Аннотация:

Переводной плагиат как одна из наиболее распространенных в научном информационном пространстве разновидностей плагиата представляет собой трудноразрешимую проблему, поскольку практически не поддается автоматизированному выявлению. Между тем за последние пять лет в этом направлении наблюдается прогресс. Авторами настоящей работы, а также группой зарубежных исследователей из нескольких университетов независимо друг от друга был предложен подход к выявлению плагиата на основе анализа цитирований, при котором для анализируемой подозрительной публикации находится возможный первоисточник с идентичным или схожим списком цитируемой литературы, что в итоге позволяет сличать текст на разных языках. Разработанная методика обнаружения неправомерных заимствований в научных текстах успешно прошла тестовые исследования. В статье приведены результаты четырехлетних исследований.

Ключевые слова: обнаружение заимствований, переводной плагиат, выявление плагиата, анализ цитирования, база данных цитирований.

Процессный подход и построение базы данных по управлению непрофильными активами кредитной организации

Марат Хайдарович Шакиров
710-753
Аннотация:

Проведен анализ развития интеллектуальных систем в кредитных организациях (далее – Банках).


Предложен метод выстраивания сквозного управленческого учета в подразделении кредитной организации, специализирующегося на работе с непрофильными активами. На базе процессного подхода предложен алгоритм внедрения в работу подразделения базы данных для формирования ключевых индикаторов производительности и контроля.


Описаны ключевые этапы работы подразделения, атрибутный состав сущностей (множества), поступающих, обогащаемых и передаваемых на каждом этапе работы подразделения. Методом моделирования процесса выстроены ролевая модель, права доступа и редактирования для сотрудников. Предложены источники данных (справочники) для оптимизации и унификации процесса наполнения базы данных (кортежа). Предложен способ обращения к базе данных в надстройке Power Query Microsoft Excel, которая позволяет собирать данные из файлов всех основных типов данных, обрабатывать и дорабатывать полученные данные. На языке Python на основе данных построены математические и финансовые модели анализа данных (логистическая регрессия, дерево решений и метод дисконтированных денежных потоков) с целью прогнозирования расходов, сроков экспозиции активов и принятия решения об оптимальной стоимости постановки имущества на баланс Банка и цены реализации. На основе библиотек (matpotlib, seaborn, plotly) предложены варианты визуализации данных для менеджмента. На примере подразделения Банка описаны положительные эффекты и возможности, которые открываются перед менеджментом разного уровня в решении повседневных задач и планирования деятельности подразделения. Предложено техническое задание по разработке витрины реализации непрофильных активов на сайте Банка как среды накопления внешних данных для принятия гибких менеджерских решений.

Ключевые слова: непрофильный актив, процессный подход, база данных, Power Query, визуализация данных, математические и финансовые методы анализа данных, регрессионный анализ, дерево решений, метод дисконтированных денежных потоков.

Базы данных и астрономия - практический подход

О.С. Бартунов, С.В. Карпов
Аннотация: В настоящее время астрономия переживает взрывной рост объемов данных, получаемых в результате наблюдений и моделирования. Их эффективное хранение становится проблемой, сравнимой по важности с собственно анализом. В настоящей работе мы анализируем причины такого "информационного взрыва" и описываем цели и задачи, стоящие в связи с ним перед Виртуальной Обсерваторией, в первую очередь, разработки стандартов и технологий удаленного и программного доступа к данным. Также мы рассматриваем основные требования, предъявляемые к современной научной информации, такие, как воспроизводимость получаемых результатов, версионность, контролируемость ее происхождения. Очевидным способом долговременного надежного хранения информации являются системы управления базами данных (СУБД). Мы обсуждаем, насколько хорошо различные виды астрономической информации – каталоги, спектры, изображения, временные ряды, результаты симуляций и т. д. – совместимы с реляционной моделью, используемой в наиболее распространенных СУБД, и формулируем требования к специализированным системам, оптимальным для хранения и анализа научной информации.
Ключевые слова: виртуальная обсерватория, научные данные, системы хранения научной информации, СУБД.

Методы и алгоритмы повышения выразительности связанных данных (обзор)

Ольга Авенировна Невзорова
808-834
Аннотация: В обзорной статье рассмотрены методы и алгоритмы повышения выразительности связанных данных, подготовленных для публикации в Вебе. Представлены основные подходы к обогащению онтологий, описаны методы, на которых они базируются, а также приведен инструментарий, реализующий эти подходы и инструменты применения соответствующих методов.Основным этапом в общей схеме жизненного цикла данных в облаке открытых связанных данных является этап построения набора связанных RDF-триплетов. Для улучшения классификации данных и анализа их качества применяются различные методы повышения выразительности связанных данных. Основные идеи рассматриваемых методов связаны с обогащением существующих онтологий (расширением базовой схемы знаний) путем добавления или совершенствования терминологических аксиом. Методы обогащения опираются на методы, применяемые в различных областях, таких как представление знаний, машинное обучение, статистика, обработка текстов на естественном языке, анализ формальных понятий и теория игр.
Ключевые слова: связанные данные, онтология, обогащение онтологии, семантический веб.

К проблеме организации разнородных данных при многочастотных исследованиях радиоисточников

О.П. Желенкова, В.Н. Черненков, Т.А. Пляскина, В.С. Шергин
Аннотация: Программные средства виртуальной обсерватории обеспечивают удобный доступ к астрономическим данным и повышают эффективность научных исследований. На базе уже существующих веб-технологий ведутся разработки по реализации большей семантической связности данных, что должно перевести сервисы виртуальной обсерватории на новый уровень, обеспечивающий обмен не только данными, но и знаниями. Пока еще отсутствует развитый инструментарий для актуализации собранной из веб-ресурсов информации, а также средства организации разнородных данных, подготовленных пользователем для научного анализа, которые могли бы повысить эффективность дальнейших исследований. Рассматривается подход к организации разнородной информации, относящейся к исследуемому объекту, который основан на развитии существующих форматов астрономических данных и средств поддержки семантической связности данных.
Ключевые слова: виртуальная обсерватория, астрономические данные, стандарт хранения, формат обмена данными.

Восстановление многомерной формы обращений к линеаризованным массивам в системе SAPFOR

Никита Андреевич Катаев, Владислав Николаевич Василькин
770-787
Аннотация: Система автоматизированного распараллеливания SAPFOR (System FOR Automated Parallelization) включает инструменты для анализа и преобразования программ, основной ее целью является снижение сложности распараллеливания программ. Система SAPFOR ориентирована на исследования многоязыковых вычислительных комплексов, разрабатываемых на языках программирования Фортран и Си. Для анализа программ в этой системе используется низкоуровневое их представление в виде LLVM IR, которое позволяет проводить различные оптимизации с целью повышения качества анализа программ. При этом оно теряет некоторые особенности программы, отражаемые ее представлением на языке высокого уровня. Одной из таких особенностей является многомерная структура используемых массивов. Анализ зависимостей по данным является одним из ключевых при исследовании возможности параллельного выполнения программ. При этом такой анализ относится к классу NP-трудных задач. Знание многомерной структуры массивов позволяет во многих случаях учесть структуру индексных выражений в обращениях к массивам и снизить сложность проводимого анализа. Кроме того, использование многомерных массивов позволяет повысить уровень параллелизма в программе за счет использования многомерных решеток процессоров и распараллеливания гнезд циклов, а не отдельных циклов в гнезде. Данная возможность естественным образом поддерживается в DVM-системе. В настоящей работе рассмотрен подход, применяемый в системе SAPFOR для восстановления формы многомерных массивов и обращений к ним по их линеаризованному представлению в LLVM IR. Предложенный подход был успешно протестирован на различных приложениях, включая тесты производительности из набора NAS Parallel Benchmarks.
Ключевые слова: анализ программ, автоматизация распараллеливания, SAPFOR, DVM, LLVM.

Разработка Веб-ГИС системы для статистического анализа больших архивов пространственно распределенных данных при проведении комплексных геофизических исследований

Е.П. Гордов, И.Г. Окладников, А.Г. Титов
Аннотация: В статье описана разрабатываемая информационно-вычислительная система для проведения научных исследований, связанных со статистическим анализом архивов пространственно-распределенных геофизических данных, полученных как в результате наблюдений, так и моделирования. В процессе реализации использовался накопленный опыт создания информационно-вычислительных веб-систем, обеспечивающих обработку больших массивов данных. Функциональные возможности существующей на данный момент версии системы включают в себя ряд процедур для оперативного математического и статистического анализа, а также визуализации данных, что позволяет оптимизировать выполнение типовых вычислительных задач. В качестве одного из приложений разрабатываемой системы были реализованы программные модули для анализа региональных особенностей динамики основных климатических характеристик и их взаимосвязей, а также для обеспечения графического представления результатов в виде графиков, диаграмм и полей на карте соответствующей территории с использованием Веб-ГИС технологий.
Ключевые слова: комплексные геофизические исследования, пространственно распределенные данные, большие массивы данных, Веб-ГИС технологии, методы математической статистики.

Автоматизация процессов сбора и анализа данных о взаимодействии с интерактивными прототипами мобильных приложений

Айнур Ринатович Динмухаметов, Ирина Сергеевна Шахова
185-199
Аннотация: Представлено описание разработанной программной платформы для сбора и автоматического анализа данных о взаимодействии пользователей с интерактивными прототипами, позволяющей организовать непрерывную и оперативную связь между целевой аудиторией и проектировщиками интерфейсов мобильных приложений. Программная платформа включает в себя десктопное и мобильное приложения, а также серверную часть для осуществления анализа данных, хранения информации и организации взаимодействия между клиентскими приложениями.
Ключевые слова: UI, UX, пользовательский интерфейс, мобильные приложения, прототипирование.

Тенденции развития технологий обработки больших данных и инструментария хранения разноформатных данных и аналитики

Марат Рамилевич Биктимиров, Александр Михайлович Елизаров, Андрей Юрьевич Щербаков
390-407
Аннотация:

Статья посвящена анализу тенденций развития технологий обработки Больших Данных и инструментария хранения разноформатных данных и аналитики, который проведен в рамках работ по программе фундаментальных исследований Отделения математических наук РАН «Алгебраические и комбинаторные методы математической кибернетики и информационные системы нового поколения», а также гранта РФФИ № 14-07-00783 «Способы хранения и обработки большого объема научно-справочных данных на современных аппаратных платформах».

Ключевые слова: большие данные, анализ, информация, программное обеспечение, распределенные вычисления, системы хранения, облачные технологии.

Развитие информационной системы регистрации результатов интеллектуальной деятельности сотрудников научного учреждения

Светлана Александровна Власова, Николай Евгеньевич Каленов
770-793
Аннотация:

Описана разработанная авторами веб-система, реализующая сервисы, связанные с формированием и предоставлением многоаспектной информации о результатах научной деятельности (публикациях, авторских свидетельствах и докладах на научных мероприятиях) сотрудников организации или группы организаций. Система ориентирована как на конечного пользователя, заинтересованного в получении конкретных данных, так и на административный персонал, формирующий отчетные материалы для вышестоящей организации. Информационная база системы содержит связанные данные о следующих классах объектов: персоны (авторы), организации и их подразделения; публикации на аналитическом, монографическом и сводном уровнях; авторские свидетельства; научные мероприятия (конференции, симпозиумы, семинары); доклады. В состав системы входят два модуля – административный, предназначенный для ввода и редактирования данных, и пользовательский, который представляет собой специальный поисковый аппарат, осуществляющий поиск информации, ее визуализацию, навигацию по связанным ресурсам и экспорт данных. Отличительной особенностью системы является введенное понятие «эквивалентных» объектов. Эквивалентными считаются объекты, представленные в системе различными метаданными, но относящимися к одной физической сущности. Такими объектами являются «персоны», соответствующие одному автору с различными написаниями фамилии в библиографических описаниях публикаций; организации, имеющие различные варианты названий; статьи, опубликованные без изменений на различных языках. В соответствии с современными требованиями к отчетности по публикациям в системе отражаются источники финансирования научных исследований, а также аффилиации каждого автора, указанные в статьях.

Ключевые слова: научные труды, научная деятельность, автоматизированная система, база данных, отчеты, сетевые технологии.

Алгоритмы формирования метаданных математических ретро-коллекций на основе анализа структурных особенностей документов

Полина Олеговна Гафурова, Александр Михайлович Елизаров, Евгений Константинович Липачёв
238-271
Аннотация:

Представлены решения основных задач, связанных с формированием цифровых математических коллекций из документов, изданных в доцифровой период, – такие коллекции обозначены в работе как ретро-коллекции. Приведены алгоритмы создания метаописания ретро-коллекций, основанные на анализе структуры математических документов и применении программных инструментов выделения метаданных. Дано описание ретро-коллекций, сформированных с помощью разработанных алгоритмов и включенных в состав фабрики метаданных цифровой математической библиотеки Lobachevskii-DML. Указаны схемы формирования метаданных и методы нормализации извлеченных метаданных в соответствии со схемами и требованиями интегрирующих математических библиотек.

Ключевые слова: Lobachevskii-DML, фабрика метаданных, управление метаданными, цифровая ретро-коллекция.

Цифровая инфраструктура электронного научного журнала: автоматизация редакционно-издательских процессов и система сервисов

Миляуша Салахутдиновна Галявиева, Александр Михайлович Елизаров, Евгений Константинович Липачёв
408-465
Аннотация:

Описаны современные модели и средства публикации и распространения научных знаний. Охарактеризованы современные информационные системы управления научными изданиями и сервисы, определяющие их функциональность.

Введено понятие цифровой инфраструктуры электронного научного журнала как комплекса, который объединяет программную платформу, реализующую основные рабочие процессы управления электронным журналом, и информационные системы, которые обеспечивают функционирование как основных, так и дополнительных сервисов, учитывающих, в частности, специфику предметной области журнала.

Представлен подход к организации цифровой инфраструктуры электронного научного журнала на основе открытой программной системы Open Journal Systems (OJS). Предложены сервисы, расширяющие функциональные возможности этой системы и учитывающие специфику предметной области научных журналов. На основе технологии расширения функционала OJS созданы программные модули, обеспечивающие автоматизацию ряда редакционных процессов электронного научного журнала.

Представлена система сервисов автоматической обработки коллекций научных документов. Эти сервисы обеспечивают проверку соответствия документов коллекций принятым правилам формирования коллекций и преобразования документов в установленные форматы; структурный анализ документов и извлечение метаданных, а также их интеграцию в научное информационное пространство. Система сервисов позволяет автоматически выполнять набор операций, который не реализуем за практически приемлемое время при традиционной «ручной» обработке электронного контента, и предназначена для обработки больших коллекций научных документов.

Охарактеризованы алгоритмы автоматической стилевой валидации текстов на этапе регистрации статьи в информационной системе электронного научного журнала, автоматического подбора рецензентов, рассылки уведомлений и контроля сроков рецензирования.

Представлены методы обработки документов, содержащих математические формулы, в частности, алгоритм поиска по формулам в коллекциях математических документов. Указаны основные идеи, подходы и уже полученные результаты по разработке семантических технологий управления математическими знаниями, в том числе, подход к построению рекомендательных систем на основе онтологий математического знания и метод автоматизации процесса первичной обработки научной статьи, использующей TеX-нотацию.

Охарактеризована проблема построения системы анализа и оценки информационного и социального воздействия публикуемого научного контента на его пользователей. Проведено сопоставление традиционных (библиометрических и наукометрических) и альтернативных показателей такой оценки. Описан мировой опыт использования информетрических сервисов на сайтах научных журналов. Обсуждены варианты реализации этих подходов в рамках цифровой инфраструктуры электронного научного журнала.

Ключевые слова: издательские системы, современные модели публикации и распространения научных знаний, информационное общество, электронный научный журнал, информационные системы управления научными изданиями и публикациями, интеграция электронных ресурсов.

Развитие цифровой е-Инфраструктуры непрерывного доступа к научным ресурсам: формирование банка спектральных данных ДЗЗ

М.А. Попов, Е.Б. Кудашев, С.П. Ковальчук, С.А. Пикулик, С.А. Станкевич, С.Ю. Марков
Аннотация: При изучении природных и искусственных объектов с помощью спутниковых технологий важную роль играют спектральные данные, которые несут информацию о распределении отражающих/излучающих свойств физических объектов и материалов по длинам волн. Необходимо отметить, что оперативное получение необходимых спектральных данных из названных выше источников обычно является проблемой. В работе описан подход к построению банка спектральных данных с расширенными функциональными возможностями, позволяющими реализовывать не только справочно-поисковые процедуры, но и достаточно широкий круг расчетно-прикладных процедур относительно спектральных данных и их атрибутов. На основе системного анализа предметной области и реляционной модели предложена схема БД, реализованная средствами MS Access. Обоснована организационная структура БСД. Предложена простая схема интеграции БСД в е-Инфраструктуру непрерывного доступа к научным ресурсам ДЗЗ.
Ключевые слова: электронные библиотеки, спутниковые технологии, спектральные данные, цифровая инфраструктура непрерывного доступа, дистанционное зондирование Земли.

V Международная Конференция «Информационные технологии для наук о земле и приложения для геологии, горной промышленности и экономики. Ites&Mp-2019»

Вера Викторовна Наумова
1279-1300
Аннотация:

Охарактеризованы материалы, представленные на V международной конференции «Информационные технологии для наук о Земле и приложения для геологии, горной промышленности и экономики. ITES&MP-2019». Названная конференция описывает результаты последних лет в следующих областях:


  • открытый доступ к научным данным в области наук о Земле; особенности данных в науках о Земле: новые концепции и методы, инструменты их сбора, интеграции и обработки в различных информационных системах, в том числе в системах с интенсивным использованием данных;

  • анализ данных и математическое моделирование природных процессов в науках о Земле: новые подходы. Эволюция классических ГИС-приложений;

  • применение информационных технологий в области металлогении критических полезных ископаемых;

  • социальные аспекты горно-геологической отрасли;

  • прогнозные построения в области геологической разведки и землепользования;

  • интеллектуальный анализ данных, извлечение фактов и знаний из научных публикаций. Тезаурусы, онтологии, концептуальное моделирование. Семантический веб, связанные данные. Сервисы. Семантическое структурирование контента. Применение в науках о Земле;

  • применение методов и технологий дистанционного зондирования в науках о Земле и горной промышленности: от спутников до беспилотных летательных аппаратов;

  • информационные технологии для создания систем демонстрации и популяризации достижений в науках о Земле;

  • приложения: прогноз месторождений, экологические риски, опасные природные явления, управление водными ресурсами, геотермальная энергия и др.

Ключевые слова: информационные технологии, науки о Земле.

Анализ Russian Science Citation Index c bспользованием данных Math-Net.ru

Знаменская Екатерина Александровна, Печников Андрей Анатольевич, Чебуков Дмитрий Евгеньевич
778-795
Аннотация:

С весны 2022 в России ведется создание национальной системы оценки результативности научных исследований и разработок с использованием базы ведущих российских журналов Russian Science Citation Index (RSCI). В статье изложены некоторые результаты анализа нормированного рейтинга RSCI, опубликованного в декабре 2022 года. С применением графа цитирования журналов, построенного по данным Math-Net.Ru на примере тематической группы OECD 101. Mathematics показано, что при наличии большого количества самоцитирований журналов обнаруживается связь между нормированным рейтингом и количеством ссылок, а связь с учетом самоцитирования несколько сильнее, чем без самоцитирования. Анализ распределения журналов по тематическим группам показывает, что использование в качестве критерия единственного признака, такого как OECD, не позволяет сформировать группу как сообщество журналов, имеющее единственную компоненту сильной связности в графе цитирования. Делается вывод о том, что методы исследования графов цитирования журналов являются хорошей основой для сравнительного анализа характеристик журналов и их ранжирования, а значит, могут быть использованы как инструменты для дальнейшего развития и совершенствования рейтингов журналов.

Ключевые слова: рейтинг журналов, Russian Science Citation Index, Math-Net.Ru, граф цитирования журналов, импакт-фактор, степень влиятельности.

Семантическое сходство в задаче аспектно-эмоционального анализа

Евгений Вячеславович Котельников, Павел Дмитриевич Блинов
120-137
Аннотация:

Исследуется проблема аспектно-эмоционального анализа текста. По сравнению с общим анализом тональности такой вариант является более сложным по причине наличия ряда сопутствующих подзадач, таких, как выделение аспектных терминов, определение тональности по отношению к этим терминам и аспектным категориям. Однако решение данной проблемы значительно расширяет возможности систем автоматического анализа неструктурированного текста.

Приведен обзор предыдущих работ в области аспектно-эмоционального анализа, описаны обучающие и тестовые данные семинара SentiRuEval. Для задачи извлечения аспектных терминов использовано векторное пространство распределенных представлений слов. Тональность аспектных терминов определяется на основе функций совместной информации и семантического сходства. Приведены сравнительные результаты на тестовых данных и заключительные выводы.

Ключевые слова: аспектно-эмоциональный анализ текста, взаимная информация, распределённые представления слов, машинное обучение, SentiRuEval.

Использование методов тематического анализа в наукометрических системах

Александр Сергеевич Козицын, Сергей Александрович Афонин, Дмитрий Алексеевич Шачнев
315-338
Аннотация:

Во многих современных наукометрических системах и системах цитирования представлены различные механизмы тематического поиска и тематической фильтрации информации. В большинстве случаев для тематического анализа статей и журналов используется полнотекстовый подход, который имеет ряд ограничений. Использование алгоритмов, основанных на анализе графов как автономно, так и совместно с полнотекстовыми алгоритмами, позволяет устранить эти ограничения и улучшить полноту и точность тематического поиска. Алгоритм, разработанный авторами и представленный в этой работе, использует для анализа тематической близости журналов граф соавторства. Алгоритм нечувствителен к языку журнала и подбирает похожие журналы на разных языках, что сложно реализуемо для алгоритмов, основанных на анализе полнотекстовой информации. Апробация алгоритма проводилась в наукометрической системе ИАС ИСТИНА. В интерфейсе, разработанном для этих целей, пользователь может выбрать один близкий ему по тематике журнал, и система автоматически сформирует подборку журналов, которые могут представлять интерес для пользователя как с точки зрения изучения имеющихся в них материалов, так и с точки зрения публикации собственных статей. В перспективе разработанный алгоритм можно адаптировать для поиска похожих по тематике конференций, сборников публикаций и научных проектов. Наличие такого инструмента увеличит публикационную активность молодых сотрудников, повысит цитируемость статей и цитируемость между журналами. Результаты работы алгоритма определения тематической близости между журналами, сборниками, конференциями и научными проектами также могут использоваться для построения правил в моделях разграничения доступа к данным на основе онтологий предметной области.

Ключевые слова: тематическая классификация, библиографические данные, граф соавторства, информационные системы.

Автоматическая разметка обучающих выборок в компьютерном зрении с использованием методов машинного обучения

Алексей Константинович Журавлёв, Карен Альбертович Григорян
718-729
Аннотация:

Рассмотрена проблема автоматической разметки обучающих выборок в области компьютерного зрения с использованием методов машинного обучения.


Разметка данных является ключевым этапом в разработке и обучении моделей глубокого обучения, однако процесс создания размеченных данных зачастую требует значительных временных и трудовых затрат. В статье предложен механизм автоматической разметки, основанный на использовании сверточных нейронных сетей и методов активного обучения.


Предложенная методология включает анализ и оценку существующих подходов к автоматической разметке. Эффективность предложенных решений оценена на общедоступных наборах данных. Результаты показали, что предложенный метод в значительной мере сокращает время, необходимое для разметки данных, но в любом случае требует вмешательства оператора-разметчика.


Обзор литературы включает анализ современных методов разметки и существующих автоматических систем, что позволяет лучше понять контекст и преимущества предлагаемого подхода. В заключении обсуждены достижения, ограничения и возможные направления для будущих исследований в данной области.

Ключевые слова: компьютерное зрение, машинное обучение, автоматическая разметка данных, обучающая выборка, сегментация изображений.
1 - 25 из 59 результатов 1 2 3 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2025 Казанский (Приволжский) федеральный университет; Институт развития информационного общества