Найти

Процессный подход и построение базы данных по управлению непрофильными активами кредитной организации

Марат Хайдарович Шакиров

710-753

Аннотация:

Проведен анализ развития интеллектуальных систем в кредитных организациях (далее – Банках).

Предложен метод выстраивания сквозного управленческого учета в подразделении кредитной организации, специализирующегося на работе с непрофильными активами. На базе процессного подхода предложен алгоритм внедрения в работу подразделения базы данных для формирования ключевых индикаторов производительности и контроля.

Описаны ключевые этапы работы подразделения, атрибутный состав сущностей (множества), поступающих, обогащаемых и передаваемых на каждом этапе работы подразделения. Методом моделирования процесса выстроены ролевая модель, права доступа и редактирования для сотрудников. Предложены источники данных (справочники) для оптимизации и унификации процесса наполнения базы данных (кортежа). Предложен способ обращения к базе данных в надстройке Power Query Microsoft Excel, которая позволяет собирать данные из файлов всех основных типов данных, обрабатывать и дорабатывать полученные данные. На языке Python на основе данных построены математические и финансовые модели анализа данных (логистическая регрессия, дерево решений и метод дисконтированных денежных потоков) с целью прогнозирования расходов, сроков экспозиции активов и принятия решения об оптимальной стоимости постановки имущества на баланс Банка и цены реализации. На основе библиотек (matpotlib, seaborn, plotly) предложены варианты визуализации данных для менеджмента. На примере подразделения Банка описаны положительные эффекты и возможности, которые открываются перед менеджментом разного уровня в решении повседневных задач и планирования деятельности подразделения. Предложено техническое задание по разработке витрины реализации непрофильных активов на сайте Банка как среды накопления внешних данных для принятия гибких менеджерских решений.

Ключевые слова: непрофильный актив, процессный подход, база данных, Power Query, визуализация данных, математические и финансовые методы анализа данных, регрессионный анализ, дерево решений, метод дисконтированных денежных потоков.

Цифровая платформа для интеграции и анализа данных геофизического мониторинга байкальской природной территории

Андрей Павлович Григорюк, Людмила Петровна Брагинская, Игорь Константинович Семинский, Константин Жанович Семинский, Валерий Викторович Ковалевский

303-316

Аннотация:

Представлена цифровая платформа для данных комплексного мониторинга опасных геодинамических, инженерно-геологических и гидрогеологических процессов, протекающих в регионе интенсивного природопользования центральной экологической зоны Байкальской природной территории (ЦЭЗ БПТ). Платформа предназначена для интеграции и анализа данных, поступающих с нескольких полигонов, расположенных в пределах ЦЭЗ БПТ, с целью оценки состояния геологической среды и прогнозирования проявлений опасных процессов. Платформа построена по клиент-серверной архитектуре. Хранение, обработка и анализ данных осуществляются на сервере, к которому пользователи могут обращаться через интернет посредством веб-браузера. Блочная структура сервера позволяет легко расширять набор процедур обработки и анализа данных, а также визуализации результатов. В настоящее время доступны несколько методов фильтрации данных (линейная частотная, Савицкого–Голея и другие), различные методы спектрального и вэйвлет-анализа, мультифрактальный и энтропийный анализ, анализ пространственных данных. Цифровая платформа была опробована на реальных данных.

Ключевые слова: геофизический мониторинг, цифровая платформа, предвестники, сейсмический прогноз, землетрясения.

Разработка модуля проверки данных для удовлетворения метрики устаревания

Айгуль Ильдаровна Сибгатуллина, Азат Шавкатович Якупов

159-178

Аннотация:

Из года в год возрастает объем мирового рынка больших данных. Их анализ является неотъемлемой частью для принятия немедленных и надежных решений. Технологии больших данных ведут к значительному снижению стоимости за счет использования облачных сервисов, распределенных файловых систем, когда возникает потребность в хранении больших объемов информации. Их аналитика неразрывно связана с понятием качества данных, что особенно важно, если они имеют определенный срок хранения – метрику устаревания – и мигрируют из одного источника в другой, увеличивая риск потери данных. Предупреждение негативных последствий достигается за счет процесса сверки данных – комплексной проверки больших объемов информации с целью подтверждения их согласованности.

В статье рассмотрены вероятностные структуры данных, которые могут быть использованы для решения задачи, а также предложена реализация – модуль проверки целостности данных с использованием фильтра Блума с подсчетом. Данный модуль интегрирован в Apache Airflow для автоматизации процесса.

Ключевые слова: большие данные, метрика устаревания, партиция, parquet файл, фильтр Блума.

Методы и алгоритмы повышения выразительности связанных данных (обзор)

Ольга Авенировна Невзорова

808-834

Аннотация: В обзорной статье рассмотрены методы и алгоритмы повышения выразительности связанных данных, подготовленных для публикации в Вебе. Представлены основные подходы к обогащению онтологий, описаны методы, на которых они базируются, а также приведен инструментарий, реализующий эти подходы и инструменты применения соответствующих методов.Основным этапом в общей схеме жизненного цикла данных в облаке открытых связанных данных является этап построения набора связанных RDF-триплетов. Для улучшения классификации данных и анализа их качества применяются различные методы повышения выразительности связанных данных. Основные идеи рассматриваемых методов связаны с обогащением существующих онтологий (расширением базовой схемы знаний) путем добавления или совершенствования терминологических аксиом. Методы обогащения опираются на методы, применяемые в различных областях, таких как представление знаний, машинное обучение, статистика, обработка текстов на естественном языке, анализ формальных понятий и теория игр.

Ключевые слова: связанные данные, онтология, обогащение онтологии, семантический веб.

Методы виртуальной обсерватории в задаче оптического отождествления радиоисточников

О.П. Желенкова, Е.К. Майорова, Н.С. Соболева, А.В. Темирова

Аннотация: Массовое отождествление списка радиоисточников по данным обзоров неба разных диапазонов электромагнитного спектра представляет для астрономов несомненный интерес. Отождествление радиоисточников не является простой задачей из-за разного углового разрешения, предельной чувствительности, координатной точности радиокаталогов, а также из-за морфологической структуры самих радиоисточников.
Нами был разработан подход к массовому отождествлению радиоисточников каталога RC, полученного на крупнейшем российском радиотелескопе РАТАН-600, с использованием веб-сервисов, обеспечивающих доступ, визуализацию и анализ данных из оптических, инфракрасных и радио обзоров, которые являются ресурсами виртуальной обсерватории. Около 25% радиоисточников каталога RC не были подтверждены в обзоре NVSS, поэтому для уточнения координат и плотностей потоков была проведена повторная обработка данных обзоров “Холод” за 1980-1999 гг., результатом которой стал каталог RC Refined (RCR).
Средствами интерактивного атласа неба Aladin (Perl API для командного интерфейса и макроконтроллер), а также с помощью pysao (программный Python-интерфейс к SAOImage DS9) реализованы потоки работ по списку радиоисточников для подготовки данных и визуализации результатов. Радиоисточники каталога RCR были отождествлены с данными 5 радиообзоров неба: VLSS, TXS, NVSS, FIRST, GB6 (частоты 74, 365, 1440 и 4850 МГц), двух оптических обзоров: DSS2 и SDSS (полосы u,g,r,i,z) и инфракрасного обзора UKIDSS (полосы J, H, K). Поскольку предполагается дальнейший анализ многочастотных данных, особое внимание уделено компиляции разнородной информации в один ресурс, информационно-поисковую систему ObjectRadioSky. Для этого разработана схема базы данных, учитывающая добавление новых каталогов, интеграцию их параметров с UCDs и реализацию связи между объектами каталогов. Реализован веб-интерфейс для отображения всей имеющейся информации о выбранном радиоисточнике.

Ключевые слова: цифровые коллекции, виртуальная обсерватория, исследование радиоисточников, многочастотные обзоры неба, предметно-ориентированные поисковые системы.

Запросы к нереляционным данным на естественном языке на основе большой языковой модели

Адильбек Омирбекович Еркимбаев, Владимир Юрьевич Зицерман, Георгий Анатольевич Кобзев

76-98

Аннотация:

В работе рассмотрены новые возможности организации запросов на естественном языке к научным локальным базам данных нереляционного типа. Проведенный анализ исследований, выполненных за последние годы, показал активное внедрение запросов на естественном языке к базам данных различного типа. Отмечено активное применение методов машинного обучения (нейронных алгоритмов). Показано широкое использование в последние два года большой языковой модели для подготовки запросов в различных языковых средах и областях знаний. Проведено исследование новых возможностей графовой базы данных AllegroGraph по использованию больших языковых моделей для организации поиска на естественном языке. Функционал базы данных изучен на примере системы метаданных по теплофизическим свойствам веществ в форме предметной онтологии «Термаль». Тестирование поисковых запросов в двуязычной (английская и русская) среде базы данных выявило в целом преодолимые проблемы и дает хорошие надежды на дальнейшее применение новых прикладных сервисов с использованием больших языковых моделей.

Ключевые слова: запрос на естественном языке, большая языковая модель, эмбеддинг, нереляционные базы данных, графовая база данных, онтология предметной области.

Автоматическая разметка обучающих выборок в компьютерном зрении с использованием методов машинного обучения

Алексей Константинович Журавлёв, Карен Альбертович Григорян

718-729

Аннотация:

Рассмотрена проблема автоматической разметки обучающих выборок в области компьютерного зрения с использованием методов машинного обучения.

Разметка данных является ключевым этапом в разработке и обучении моделей глубокого обучения, однако процесс создания размеченных данных зачастую требует значительных временных и трудовых затрат. В статье предложен механизм автоматической разметки, основанный на использовании сверточных нейронных сетей и методов активного обучения.

Предложенная методология включает анализ и оценку существующих подходов к автоматической разметке. Эффективность предложенных решений оценена на общедоступных наборах данных. Результаты показали, что предложенный метод в значительной мере сокращает время, необходимое для разметки данных, но в любом случае требует вмешательства оператора-разметчика.

Обзор литературы включает анализ современных методов разметки и существующих автоматических систем, что позволяет лучше понять контекст и преимущества предлагаемого подхода. В заключении обсуждены достижения, ограничения и возможные направления для будущих исследований в данной области.

Ключевые слова: компьютерное зрение, машинное обучение, автоматическая разметка данных, обучающая выборка, сегментация изображений.

V Международная Конференция «Информационные технологии для наук о земле и приложения для геологии, горной промышленности и экономики. Ites&Mp-2019»

Вера Викторовна Наумова

1279-1300

Аннотация:

Охарактеризованы материалы, представленные на V международной конференции «Информационные технологии для наук о Земле и приложения для геологии, горной промышленности и экономики. ITES&MP-2019». Названная конференция описывает результаты последних лет в следующих областях:

открытый доступ к научным данным в области наук о Земле; особенности данных в науках о Земле: новые концепции и методы, инструменты их сбора, интеграции и обработки в различных информационных системах, в том числе в системах с интенсивным использованием данных;

анализ данных и математическое моделирование природных процессов в науках о Земле: новые подходы. Эволюция классических ГИС-приложений;

применение информационных технологий в области металлогении критических полезных ископаемых;

социальные аспекты горно-геологической отрасли;

прогнозные построения в области геологической разведки и землепользования;

интеллектуальный анализ данных, извлечение фактов и знаний из научных публикаций. Тезаурусы, онтологии, концептуальное моделирование. Семантический веб, связанные данные. Сервисы. Семантическое структурирование контента. Применение в науках о Земле;

применение методов и технологий дистанционного зондирования в науках о Земле и горной промышленности: от спутников до беспилотных летательных аппаратов;

информационные технологии для создания систем демонстрации и популяризации достижений в науках о Земле;

приложения: прогноз месторождений, экологические риски, опасные природные явления, управление водными ресурсами, геотермальная энергия и др.

Ключевые слова: информационные технологии, науки о Земле.

Исследование устойчивости совместной модели к возмущению начальных данных

Константин Павлович Беляев, Гурий Михайлович Михайлов, Алексей Николаевич Сальников, Наталия Павловна Тучкова

615-633

Аннотация: Задача устойчивости рассматривается в терминах классического определения Ляпунова. Для этого задается множество начальных условий, состоящих их данных предварительных расчетов, и анализируется разброс траекторий, полученных в результате численного моделирования. Эта процедура реализована как серия ансамблевых экспериментов с совместной моделью MPI-ESM института метеорологии М. Планка (Германия). Для численного моделирования задавалась серия различных начальных значений полей характеристик, и модель интегрировалась, начиная с каждого из этих полей, на различные временные периоды. Изучались экстремальные характеристики уровня океана за период 30 лет. Строилось их статистическое распределение, оценивались параметры этого распределения, изучался статистический прогноз на 5 лет вперед. Показано, что статистический прогноз уровня соответствует расчетному прогнозу, полученному по модели. Изучалась локализация экстремальных значений уровня и проводился анализ этих результатов. Численные расчеты выполнялись на суперкомпьютере Ломоносов-2 Московского государственного университета имени М.В. Ломоносова.

Ключевые слова: нелинейные модели циркуляции, численные ансамблевые эксперименты, анализ устойчивости модельных траекторий.

Результаты исследований по обнаружению заимствований с использованием анализа цитирований

Вадим Николаевич Гуреев, Николай Алексеевич Мазов

322-331

Аннотация:

Переводной плагиат как одна из наиболее распространенных в научном информационном пространстве разновидностей плагиата представляет собой трудноразрешимую проблему, поскольку практически не поддается автоматизированному выявлению. Между тем за последние пять лет в этом направлении наблюдается прогресс. Авторами настоящей работы, а также группой зарубежных исследователей из нескольких университетов независимо друг от друга был предложен подход к выявлению плагиата на основе анализа цитирований, при котором для анализируемой подозрительной публикации находится возможный первоисточник с идентичным или схожим списком цитируемой литературы, что в итоге позволяет сличать текст на разных языках. Разработанная методика обнаружения неправомерных заимствований в научных текстах успешно прошла тестовые исследования. В статье приведены результаты четырехлетних исследований.

Ключевые слова: обнаружение заимствований, переводной плагиат, выявление плагиата, анализ цитирования, база данных цитирований.

Извлечение данных из сканированных документов со сходной структурой

Рустем Дамирович Саитгареев, Булат Рифатович Гиниятуллин, Владислав Юрьевич Топоров, Артур Александрович Атнагулов, Фарид Радикович Аглямов

667-688

Аннотация:

На текущий момент времени значительная часть передаваемых и хранимых данных не структурирована. Количество неструктурированных данных растет большими темпами каждый год, несмотря на то, что по таким данным трудно производить поиск, к ним нельзя совершать запросы и в целом их обработка не автоматизирована. В то же время наблюдается развитие систем электронного документооборота.

Настоящая работа предлагает инструмент для извлечения данных из фотографий бумажных документов, принимая во внимание их структуру и разметку. Представлены результаты разных испытанных подходов, включая нейронные сети и алгоритмический метод, а также проведен анализ полученных результатов.

Ключевые слова: нейронные сети, машинное обучение, извлечение структуры, извлечение структуры документов, OCR , неструктурированные данные , распознавание текста.

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров

61-85

Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.

Ключевые слова: семантический анализ, издательские системы.

Электронная библиотека знаний для аннотации геномной ДНК

М.П. Пономаренко, Ю.В. Пономаренко, А.С. Фролов, А.В. Кочетов, Ф.А. Колпаков, Н.А. Колчанов, Н.Л. Подколодный

Аннотация: Создана электронная библиотека знаний GeneExpress для обеспечения полного цикла аннотации геномной ДНК, включая накопление первичных экспериментальных данных; автоматический анализ этих данных; документирование закономерностей, выявленных в качестве результатов этого анализа; генерацию активных приложений, использующих эти закономерности для аннотации геномной ДНК, и, что является новшеством GeneExpress, объяснение результатов аннотации геномной ДНК вплоть до указания первичных экспериментальных данных, на основании которых были созданы методы получения этих результатов. Таким образом, GeneExpress сочетает в себе поисковые возможности статического информационного ресурса и прогностические возможности активных приложений. Одна из этих возможностей заключается в объяснении результатов аннотации вплоть до первичных экспериментальных данных, с помощью которых были созданы методы получения этих результатов; вторая - в комплексном анализе расшифрованных фрагментов ДНК путем сопоставления результатов распознавания функциональных сайтов, координированная работа которых регулирует экспрессию генов. Реализация и применение этих новых возможностей демонстрируются на примере распознавания функциональных сайтов, предсказания их биологической активности и предсказания "высокого/низкого" уровня экспрессии генов. Электронная библиотека знаний GeneExpress является общедоступной через Интернет, http://wwwmgs.bionet.nsc.ru/systems/GeneExpress/.

Выпускная квалификационная работа: интеллектуальная собственность, источник персональных данных. правовые проблемы при проверке и использовании

Павел Петрович Гейко

305-321

Аннотация:

Затронуты проблемы правового характера, возникающие в связи с необходимостью осуществления обязательной проверки выпускных квалификационных работ на наличие заимствований при проведении итоговой аттестации по образовательным программам высшего образования, размещения этих работ в электронно-библиотечных системах образовательных организаций. В частности, исследованы вопросы необходимости соблюдения законодательства о персональных данных при обработке персональных данных в ходе проведения проверок работ на наличие заимствований, размещения работ в библиотечных системах. Уделено внимание вопросам соблюдения интеллектуальных прав авторов выпускных квалификационных работ при выполнении образовательными организациями возложенных на них обозначенных обязанностей. Анализ правовых проблем проведен с учетом внесенного Правительством РФ законопроекта, которым на образовательные организации высшего образования предлагается возложить обязанность по размещению в открытом доступе на официальном сайте образовательной организации в интернете полных текстов выпускных квалификационных работ по программам магистратуры и программам специалитета.

Ключевые слова: оригинальность, уникальность, обнаружение заимствований, плагиат, персональные данные, интеллектуальные права, исключительные права, квалификационная работа, учебная работа, научная работа, автор, размещение работ, обнародование, электронно-библиотечная с.

Анализ геоинформационных данных в распределенных инфраструктурах

Е.В. Шулькин, С.М. Краснопеев

Аннотация: В статье рассматривается проблема использования алгоритмов анализа пространственных данных в распределенных инфраструктурах, основанных на стандартах Открытого геопространственного консорциума. Вкратце затрагивается тема публикации алгоритмов анализа в виде исходного кода. Основное внимание уделено изложению нашего понимания о том, какой должна быть клиентская часть веб-сервисов обработки пространственных данных и как может быть организовано взаимодействие конечного пользователя с опубликованными средствами анализа данных.

Ключевые слова: анализ пространственных данных, открытый геопространственный консорциум, инфраструктура пространственных данных, Web Processing Service, WPS, клиент анализа данных.

Построение онтологии предметной области на основе логической модели данных

Александр Михайлович Гусенков, Наиль Раисович Бухараев, Евгений Васильевич Биряльцев

390-417

Аннотация: Представлена технология автоматизированного построения онтологии предметной области на основе информации, извлекаемой из комментариев реляционных баз данных ПАО «Татнефть». Технология основана на построении конвертора (компилятора), транслирующего логическую модель данных Epicentre Petrotechnical Open Software Corporation (POSC), представленную в виде ER-диаграмм и набора описаний на объектно-ориентированном языке EXPRESS, в язык описания онтологий OWL, рекомендованный консорциумом W3C. Описаны основные синтаксические и семантические аспекты преобразования.

Ключевые слова: онтология предметной области, реляционные базы данных, POSC, OWL.

Методика сетевого анализа научных публикаций

Инна Геннадьевна Ольгина

646-672

Аннотация:

Актуальность вопросов анализа значимости научных публикаций обусловлена тем, что с появлением интернет-технологий стал возможен сбор данных о сети цитирования публикаций. Между тем, существующий сегодня подход к анализу значимости научных публикаций базируется на библиометрических показателях, учитывающих только количество цитирований. Однако все более широкое применение начинает получать сетевой анализ, применяемый преимущественно в исследованиях социальных сетей. Автором разработана методика, позволяющая осуществить эффективный анализ значимости научных публикаций, которая основана на методах сетевого анализа, альтернативных библиометрическим методам. В качестве критериев оценки значимости научных публикаций, основанных на сетевом анализе, установлены релевантные меры центральности узлов сети цитирования: центральность по степени связности; близости к другим узлам; посредничеству; авторитетности; концентрации. Приведен результат эксперимента, позволивший продемонстрировать адекватность разработанной методики анализа научных публикаций на основе сетевых метрик. В качестве первичных источников данных о публикациях использованы наукометрические базы данных, позволяющие отслеживать цитируемость публикаций и выявлять соответствующие сети цитирования. Применение предложенной методики способствует выявлению важных публикаций в развитии соответствующих научных направлений.

Ключевые слова: сеть цитирования, публикации, наукометрия, библиометрический анализ, сетевой анализ, граф.

К проблеме создания Виртуальных Центров данных дистанционного зондирования Земли

Е.Б. Кудашев, М.А. Попов

Аннотация: Предствлен обзор европейских программ и проводится анализ современного состояния исследований и международного сотрудничества в области исследования Земли из космоса. Рассматриваются программы GEO/GEOSS, CEOS, GMES and и новейший проект APARSEN, выполняющийся 31 партнером по заданию европейской Комиссии. Эта статья рассматривает проблемы интеграции научных данных и развития научного сообщества с целью обеспечить максимальные преимущеста, возникающие в цифровую эру и эпоху Big Data для непрерывного доступа к спутниковым данным и их длительного хранения. Обсуждаются перспективы создания Виртуальных Центров данных дистанционного зондирования Земли из космоса.

Ключевые слова: Дистанционное зондирование Земли из космоса, Инфраструктура научных информационных ресурсов, Геопортал, Комитет по спутникам для исследования Земли из космоса, Программа глобального мониторинга для экологии и безопасности, проект APARSEN.

Технологии семантического веба для поддержки фундаментальных исследований в геологии

Игорь Вячеславович Бычков, Евгений Александрович Черкашин, Цзинь Чжан, Татьяна Юрьевна Черкашина, Виктория Алексеевна Попова, Оксана Анатольевна Мазаева, Оксана Викторовна Лунина

740-780

Аннотация:

Представлена инновационная методология применения технологий семантического веба для поддержки фундаментальных геологических исследований. Рассмотрена проблема семантической интеграции разнородных геологических данных, характеризующихся масштабом разного уровня и междисциплинарностью. Разработана пятиэтапная методология, включающая анализ предметной области, онтологическое концептуальное моделирование, трансформацию данных в граф знаний, развертывание инфраструктуры распределенного доступа к данным на основе концептуальной модели, а также интеграцию с процедурами обработки и анализа. Практическая апробация проведена на трех кейсах: анализе геохимических данных для оценки уровня загрязнения территории, создании информационной системы о разломах и исследовании динамики береговой зоны водохранилищ. Предложенный онтологический подход обеспечивает соответствие FAIR-принципам и преодоление «семантического барьера» в геологических исследованиях. Показано, что технологии семантического веба позволяют перейти от фрагментированных информационных массивов к целостному семантическому пространству геологических знаний, что открывает новые возможности для генерации комплексных научных гипотез и кросс-дисциплинарных исследований.

Ключевые слова: семантический веб, графы знаний, онтологическое моделирование, семантическое пространство научных знаний, фундаментальные геологические исследования.

О реализации веб-системы математической информации

А.С. Аджиев, А.Н. Бездушный, В.А. Серебряков

Аннотация: На основе проведенного ранее анализа российских математических электронных ресурсов, а так же опыта зарубежных математических информационных систем описан проект создаваемой математической информационной системы Math-Net.RU. Базовой платформой системы Math-Net.RU является универсальная информационная система ИСИР.
Проект описан в терминах перечня требований и условий, которым должна удовлетворять создаваемая система. Рассмотрены и проанализированы альтернативные варианты реализации различных компонент системы, а также пути решения возникающих при этом проблем. Очерчены категории хранимой информации, целевой круг пользователей системы и требуемая функциональность. Описана общая архитектура, схема данных, пользовательские интерфейсы, а также способы наполнения системы информацией, актуализации и синхронизации данных из других информационных систем и баз данных. Рассмотрены проблемы представления математических текстов и формул в информационных системах, дан сравнительный анализ существующих форматов хранения. Очерчены так же перспективы участия системы Math-Net.RU в создаваемой Всемирной математической информационной системе Math-Net, а также требования к системе-участнику.

Статистический анализ данных наблюдений потоков взаимодействия океана и атмосферы в северной Атлантике

Наталия Павловна Тучкова, Константин Павлович Беляев, Гурий Михайлович Михайлов

122-133

Аннотация:

Проанализированы данные наблюдений 1979–2018 гг. в районе Северной Атлантики, полученные в результате реализации проекта Российской академии наук по исследованию атмосферы в Северной Атлантике (РАН-НААД). Набор данных предоставляет множество параметров поверхности и свободной атмосферы на основе сигма-модели и отвечает многим требованиям метеорологов, климатологов и океанографов, работающих как в исследовательской, так и в оперативной областях. Проведен анализ сезонной и многолетней изменчивости тепловых потоков и температуры поверхности воды в Северной Атлантике. В качестве основного метода исследования использованы схемы анализа диффузионных процессов. На основе заданных рядов длиной в 40 лет с 1979 по 2018 годы вычислены такие параметры диффузионных процессов, как среднее (снос процесса) и дисперсия (диффузия процесса) и построены их карты и временные кривые. Численные расчеты выполнены на суперкомпьютере Ломоносов-2 Московского государственного университета имени М.В. Ломоносова.

Ключевые слова: УДК 519.6, УДК 519.2.

Классификация изображений с помощью сверточных нейронных сетей

Сергей Алексеевич Филиппов

366-382

Аннотация:

Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.

Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.

Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.

Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.

Ключевые слова: распознавание изображений, нейронная сеть, сверточная нейронная сеть, классификация изображений, машинное обучение.

Описание и использование тезаурусов в информационных системах, подходы и реализация

М.Х. Нгуен, А.С. Аджиев

Аннотация: В статье рассмотрены разные подходы к формализации тезаурусов, а также стандарты ISO, ANSI и ГОСТ. Сделан анализ некоторых возможных платформ для такой формализации, описаны особенности работы с тезаурусами в информационных системах, а также проблемы при этом возникающие, требования к реализации тезауруса в рамках SemanticWeb [12].
Рассмотрены особенности и различия классификаторов ресурсов и обычных терминологических и лингвистических тезаурусов. Дан сравнительный анализ существующих схем данных и подходов к реализации тезаурусов для информационных систем на основе RDF. Рассмотрены также вопросы организации пользовательских интерфейсов для работы с тезаурусами, и использования их при поиске в информационной системе, а также интерфейсы администрирования тезаурусов.
Во второй части статьи на основании проделанного анализа сформулированы требования к описанию тезауруса в ИСИР, и приведена общая универсальная схема данных для представления тезауруса в этой информационной системе, удовлетворяющая перечисленным требованиям, и небольшой пример реализации в ней классификатора MSC.
На основании предложенной общей универсальной схемы и сформулированных требований описана реализация тезауруса в ИСИР.

Онлайн-инструмент Tula для балансировки видеоигр

Валерия Рашидовна Рахманкулова, Влада Владимировна Кугуракова

903-930

Аннотация:

Разработан инструмент Tula для балансировки видеоигр. Его необходимость обоснована растущими требованиями к качеству и экономической эффективности в индустрии видеоигр, особенно в аспектах управления внутри-игровой экономикой и логикой игрового мира. Проанализированы существующие инструменты и подходы к балансировке игр, выявлены их ограничения, на основе которых построен функционал нового инструмента, интегрирующего функции современных решений и предоставляющего расширенные возможности для анализа и тестирования игровых параметров, включая генерацию прототипов через описание классов и симуляцию в реальном времени. Описаны технологическая база и архитектура инструмента. Рассмотрены ключевые аспекты реализации: отзывчивость интерфейса, непрерывное обновление данных и безопасность. Проведенный сравнительный анализ с известным инструментом Machinations показал преимущества в корректности обработки данных, удобстве интерфейса и гибкости модификации прототипов.

Ключевые слова: видеоигры, игровой процесс, игровые механики, игровой баланс, игровой дизайн, Machinations.

Описание контекстно-свободных грамматик в формате данных JSON для генераторов синтаксических анализаторов

Олег Константинович Осипов

1301-1323

Аннотация:

Рассмотрены варианты представления контекстно-свободных грамматик, предлагаемые средствами генерации синтаксических анализаторов. Приведён анализ существующих решений. Предложен новый формат описания грамматики. Дано описание грамматики в виде JSON-документа. Разработана концепция нового генератора, основанная на формате данных JSON для контекстно-свободных грамматик. Описана схема построения анализатора на основе концепции.

Ключевые слова: JSON-документ, контекстно-свободные грамматики, лексема, форма Бэкуса-Наура, дерево разбора, терминальные символы (токены), конечный детерминированный автомат, парсер, Parglare, ANTLR.

Результаты поиска