• Main Navigation
  • Main Content
  • Sidebar

Электронные библиотеки

  • Главная
  • О нас
    • О журнале
    • Цели и задачи
    • Тематика
    • Главный редактор
    • Редакция
    • Отправка материалов
    • Заявление об открытом доступе
    • Заявление о конфиденциальности
    • Контакты
  • Текущий выпуск
  • Архивы
  • Регистрация
  • Вход
  • Поиск
Издается с 1998 года
ISSN 1562-5419
16+
Language
  • Русский
  • English

Найти

Расширенные фильтры

Результаты поиска

Восстановление многомерной формы обращений к линеаризованным массивам в системе SAPFOR

770-787
Аннотация: Система автоматизированного распараллеливания SAPFOR (System FOR Automated Parallelization) включает инструменты для анализа и преобразования программ, основной ее целью является снижение сложности распараллеливания программ. Система SAPFOR ориентирована на исследования многоязыковых вычислительных комплексов, разрабатываемых на языках программирования Фортран и Си. Для анализа программ в этой системе используется низкоуровневое их представление в виде LLVM IR, которое позволяет проводить различные оптимизации с целью повышения качества анализа программ. При этом оно теряет некоторые особенности программы, отражаемые ее представлением на языке высокого уровня. Одной из таких особенностей является многомерная структура используемых массивов. Анализ зависимостей по данным является одним из ключевых при исследовании возможности параллельного выполнения программ. При этом такой анализ относится к классу NP-трудных задач. Знание многомерной структуры массивов позволяет во многих случаях учесть структуру индексных выражений в обращениях к массивам и снизить сложность проводимого анализа. Кроме того, использование многомерных массивов позволяет повысить уровень параллелизма в программе за счет использования многомерных решеток процессоров и распараллеливания гнезд циклов, а не отдельных циклов в гнезде. Данная возможность естественным образом поддерживается в DVM-системе. В настоящей работе рассмотрен подход, применяемый в системе SAPFOR для восстановления формы многомерных массивов и обращений к ним по их линеаризованному представлению в LLVM IR. Предложенный подход был успешно протестирован на различных приложениях, включая тесты производительности из набора NAS Parallel Benchmarks.
Ключевые слова: анализ программ, автоматизация распараллеливания, SAPFOR, DVM, LLVM.

Создание научных архивов с помощью системы EPrints

А.В. Новицкий, В.А. Резниченко, Г.Ю. Проскудина
Аннотация: В работе рассматриваются основные возможности и особенности EPrints как свободно распространяемой системы построения электронных научных архивов на основе Веб. Описан также первоначальный опыт построения многоязычной электронной библиотеки с особенностями адаптации под определенные задачи и требования.

Семантический рекомендательный сервис присвоения кода УДК математическим статьям

Ольга Авенировна Невзорова, Дамир Альбертович Альмухаметов
203-224
Аннотация:

Классификация документов с присвоением кодов-классификаторов является традиционным способом систематизации и поиска документов по определенной тематике. Универсальная десятичная классификация (УДК) лежит в основе систематизации знаний, представленных в библиотеках, базах данных и других хранилищах информации. В России УДК является обязательным реквизитом всей книжной продукции и информации по естественным и техническим наукам. Выбор классификационных кодов связан с анализом структуры дерева классификатора и традиционно выполняется автором научной статьи.


В настоящей работе предложено решение задачи автоматизации подбора классификационного кода УДК для математической статьи на основе специального ресурса – онтологии OntoMathPRO профессиональной математики, разработанной в Казанском федеральном университете. Подходом к решению задачи автоматизации является создание «кодовых карт» для каждого классифицирующего кода в дереве УДК в области математики. Под «кодовой картой» понимается взвешенный набор всех математических именованных сущностей, извлеченных с помощью онтологии OntoMathPRO из коллекции статей с заданным кодом УДК. Создание «кодовых карт» основано на гипотезе о том, что выбор кода УДК обуславливается определённым набором классифицирующих признаков, которые можно представить классами из онтологии OntoMathPRO. Предложенная гипотеза проверена и подтверждена: проверка гипотезы проведена на коллекции математических статей, опубликованных в журнале «Известия ВУЗов. Математика» в течение 1999–2009 гг.

Ключевые слова: Универсальная десятичная классификация, кодовая карт, кодовая карта, онтология OntoMathPRO, математическая статья.

Об особенностях проектирования индивидуальных образовательных маршрутов по математике

Анжела Ринатона Хасаншина, Ольга Викторовна Разумова
730-736
Аннотация: Раскрыты некоторые подходы решения проблемы педагогического проектирования учебной деятельности обучающихся с учетом их индивидуальных особенностей. Рассмотрены особенности проектирования индивидуальных образовательных маршрутов по математике.
Ключевые слова: индивидуализация обучения, индивидуальный образовательный маршрут, проектирование индивидуальных образовательных маршрутов по математике.

О вопросе измерения вклада программистских решений в производительность программ

Лидия Васильевна Городняя, Татьяна Анатольевна Андреева
738-759
Аннотация:

Статья нацелена на привлечение внимания к вопросам, возникающим в связи с проблемой оценки влияния программируемых решений на продуктивность программирования и производительность программ в процессе обучения программированию и улучшения программных приложений с сохранением их правильности. Проанализированы результаты некоторых экспериментов по этим вопросам. Рассматривается гипотеза, что функциональные модели могут быть полезны как метрическая шкала, позволяющая отделять особенности используемых языков и систем программирования от характеристик программ и запрограммированных решений. Описаны результаты небольшого демонстрационного эксперимента, направленного на исследование зависимости производительности программ от выбора компилятора и отдельно от представления программируемых решений на определённом языке программирования. Анализ полученных результатов позволяет наметить подход к созданию методики, позволяющей выяснять такие зависимости. При создании методики может быть учтён многолетний опыт оценки учебных и олимпиадных работ по программированию, проявивший ряд не вполне очевидных аспектов проблемы.

Ключевые слова: измерение качества программ, продуктивность программирования,, производительность программ, программистские решения, функциональное программирование.

Cистема контролируемой генерации лица, построенная с использованием сети StyleGAN2

Марат Вильданович Исангулов, Разиль Рустемович Миннеахметов, Алмаз Рустамович Хамеджанов, Тимур Робертович Хафизьянов, Эмиль Асифович Пашаев, Эрнест Ришатович Калимуллин
466-482
Аннотация:

Представлен новый подход к контролируемой генерации лиц, использующий генеративные модели с открытым исходным кодом, включая StyleGAN2 и Гребневую регрессию. Разработана методология, расширяющая возможности StyleGAN2 для контроля характеристик лиц, таких как возраст, раса, пол, выражение лица и атрибуты волос, а также использован обширный набор данных человеческих лиц с аннотациями атрибутов. Лица закодированы в 256-мерном латентном пространстве с использованием кодировщика StyleGAN2, что привело к набору характерных латентных кодов. Применен алгоритм t-SNE для кластеризации этих кодов на основе признаков, продемонстрирована возможность контроля генерации лиц, впоследствии обучены модели регрессии Риджа для каждого измерения латентных кодов с использованием размеченных признаков. При декодировании с использованием StyleGAN2 полученные коды успешно восстанавливали изображения лиц, сохраняя связь с входными признаками. Разработанный подход дает легкий и эффективный способ контролируемой генерации лиц с использованием существующих генеративных моделей, таких как StyleGAN2, и открывает новые возможности для различных областей применения.

Ключевые слова: машинное обучение, генерация лица, StyleGan, энкодер, декодер, скрытые коды, отображение признаков, гребневая регрессия.

О взаимодействии единого цифрового пространства научных знаний с национальной электронной библиотекой

Анна Валерьевна Лопухина, Сергей Александрович Кириллов, Анастасия Геннадьевна Калина
1031-1054
Аннотация:

Статья посвящена вопросам взаимодействия Единого цифрового пространства научных знаний (ЕЦПНЗ) с Национальной электронной библиотекой (НЭБ). Приведены основные архитектурные особенности ЕЦПНЗ и задачи, решаемые в его рамках. Исследованы особенности структуры Национальной электронной библиотеки (НЭБ), технологии ее наполнения, проанализирован актуальный состав фондов. Рассмотрены правовые основы создания и функционирования НЭБ. Предложены направления взаимодействия ЕЦПНЗ с НЭБ.

Ключевые слова: ЕЦПНЗ, НЭБ, оператор НЭБ, информационные ресурсы, цифровой контент, электронные библиотеки.

Где находятся лучшие признаки? Послойный анализ слоев трансформера для эффективной классификации эндоскопических изображений

Ахмад Таха, Рустам А. Лукманов
1207-1229
Аннотация:

В поисках путей развития медицинского искусственного интеллекта показано, что предварительно обученный Vision Transformer с линейным классификатором может достигать высокой и конкурентоспособной производительности в классификации эндоскопических изображений. Представлен систематический послойный анализ, который выявляет источник наиболее важных признаков, оспаривая общепринятую эвристику использования только последнего слоя. Установлен отчетливый феномен «пика перед концом», когда поздне-промежуточный слой предлагает более обобщаемое представление для последующей медицинской задачи. На стандартных наборах данных Kvasir и HyperKvasir предложенный подход с малым количеством параметров не только получить достаточно высокую точность, но и значительно сокращает вычислительные затраты. Полученные работы могут быть рекомендованы в качестве практического руководства по эффективному использованию признаков общих базовых моделей в клинических условиях.

Ключевые слова: классификация эндоскопических изображений, замороженный кодировщик, извлечение признаков, послойный анализ, визуальный трансформер (ViT), перенос обучения, самоконтролируемое обучение (SSL), медицинский искусственный интеллект.

Цифровая платформа для суперкомпьютерного математического моделирования процессов напыления

Никита Игоревич Тарасов, Виктория Олеговна Подрыга, Сергей Владимирович Поляков, Алексей Валерьевич Тимаков
697-721
Аннотация:

Представлена цифровая платформа суперкомпьютерного моделирования в задачах напыления частиц на подложки. Целью работы является обсуждение общей архитектуры, технологического стека и особенностей реализации пользовательского интерфейса платформы. В ее основу положены веб-технологии доступа и управления расчетами, позволяющие реализовать пользовательскую систему для проведения полного цикла вычислительного эксперимента, включающего конфигурацию прикладных приложений, их запуск на удаленных вычислительных ресурсах, мониторинг прохождения задач, анализ и интерактивную визуализацию результатов. Взаимодействие пользователя с вычислительными ресурсами реализовано посредством графического интерфейса, не требующего от компьютера пользователя наличия дополнительного программного обеспечения, кроме веб-браузера. Важным преимуществом платформы является возможность проведения широкомасштабных компьютерных исследований в многопользовательском режиме, вытекающая из естественных принципов построения клиент-серверных приложений. Представляемая цифровая веб-платформа была успешно апробирована на вычислительных кластерах ИПМ им. М.В. Келдыша РАН при решении ряда актуальных математических задач нанотехнологии. Также с ее помощью последние 3 года проводится групповое обучение студентов МФТИ современным информационным технологиям.

Ключевые слова: суперкомпьютерное моделирование, цифровая платформа, веб-интерфейс, газодинамическое напыление частиц.

Методика построения информационно-справочной системы по истории математической науки

В.Б. Барахнин, А.М. Федотов
Аннотация: В работе изложена методика построения информационно-справочной системы по истории науки. В качестве одного из возможных подходов предлагаются следующие основные принципы построения таких систем. Информация группируется вокруг персон, при этом подробно структурируются биографические данные в плане хронологии, географии и т.п. Библиографический список в описании персоны включает в себя, наряду с публикациями данного ученого, и публикации о нем самом. Четко отражена связь научной деятельности исследователя со структурированным описанием предметной области, в которой этот исследователь работал. Приведенное описание включает в себя информационную модель справочника, особенности реализации подсистем создаваемой информационной системы, а также основные виды информационных запросов пользователя, необходимых для полноценной работы с системой.

Препринты ИПМ им. М. В. Келдыша: конвертация из MS Word в HTML

Андрей Артурович Воробьев, Римма Юрьевна Скорнякова
369-398
Аннотация:

В последние годы широкое распространение получило представление полных текстов научных статей в формате HTML, обладающем для онлайн-публикаций рядом преимуществ по сравнению с традиционно используемым форматом PDF за счет имеющихся в HTML более развитых средств для структуризации материала, встраивания мультимедийного контента и реализации разного рода интерактивных и динамических возможностей. В связи с этим актуальной становится задача преобразования рукописей из традиционно используемых авторами форматов MS Word и LaTeX в полноценную HTML-версию, способную реализовать преимущества такого формата. В работе представлены результаты применения к препринтам ИПМ им. М. В. Келдыша подхода к конвертации научных статей из формата MS Word в HTML, предложенного в предыдущих работах. Описаны интерактивные возможности полученных HTML-версий.

Ключевые слова: HTML-версия научной статьи, преобразование научных статей из формата .docx в .html, препринты ИПМ им. М. В. Келдыша, JATS XML.

Метавселенная «История Земли» – новый взгляд на популяризацию геологических знаний

Александр Сергеевич Еременко
2-21
Аннотация:

Работа посвящена проектированию концепции Метавселенной как нового взгляда на способы популяризации научного знания путём взаимодействия пользователя с виртуальным окружением. Рассмотрены особенности построения Метавселенных и технологические решения, необходимые для их реализации.

Ключевые слова: Метавселенная, история Земли, геология Земли, научно-популярный портал, популяризация науки, научно-образовательный ресурc, компьютерная игра.

Генерация индивидуальных образовательных траекторий и расписания обучения в парадигме индивидуализации образования

Михаил Михайлович Абрамский, Эльвира Феликсовна Батырова, Айгуль Рустамовна Марданова, Татьяна Алексеевна Ахметзянова
129-145
Аннотация:

Представлен подход к индивидуализации образования, основанный на автоматизированной генерации индивидуальной образовательной траектории и расписания, учитывающих особенности каждого обучающегося и его пожелания. Описан принцип действия разработанных инструментов генерации. Затронуты вопросы применения разработанных подходов и инструментов в высшем образовании.

Ключевые слова: smart-образование, индивидуализация образования, индивидуальный учебный план, индивидуальная траектория, генетические алгоритмы, генерация расписания.

Информационно-поисковые компетенции студентов в условиях удаленного и смешанного форматов обучения

Алла Александровна Витухновская
446-464
Аннотация:

Рассмотрены проблемы и особенности информационно-поисковой деятельности студентов в условиях экстремального перехода вузов в дистанционный режим. Описаны результаты опроса студентов, позволяющие получить первое представление об информационно-поисковых компетенциях студентов, оказавшихся в ситуации, когда единственной возможностью для них остался удаленный доступ к электронным информационным системам и электронным образовательным ресурсам. Определен комплекс информационно-поисковых компетенций, необходимых для эффективного поиска информации в условиях удаленного и смешанного форматов обучения.

Ключевые слова: информационно-поисковая деятельность, информационно-поисковые компетенции, студенты, информационные системы, удаленный формат обучения, дистанционное обучение, смешанный формат обучения, опрос.

Онлайн-инструмент Tula для балансировки видеоигр

Валерия Рашидовна Рахманкулова, Влада Владимировна Кугуракова
903-930
Аннотация:

Разработан инструмент Tula для балансировки видеоигр. Его необходимость обоснована растущими требованиями к качеству и экономической эффективности в индустрии видеоигр, особенно в аспектах управления внутри-игровой экономикой и логикой игрового мира. Проанализированы существующие инструменты и подходы к балансировке игр, выявлены их ограничения, на основе которых построен функционал нового инструмента, интегрирующего функции современных решений и предоставляющего расширенные возможности для анализа и тестирования игровых параметров, включая генерацию прототипов через описание классов и симуляцию в реальном времени. Описаны технологическая база и архитектура инструмента. Рассмотрены ключевые аспекты реализации: отзывчивость интерфейса, непрерывное обновление данных и безопасность. Проведенный сравнительный анализ с известным инструментом Machinations показал преимущества в корректности обработки данных, удобстве интерфейса и гибкости модификации прототипов.

Ключевые слова: видеоигры, игровой процесс, игровые механики, игровой баланс, игровой дизайн, Machinations.

Семантический анализ документов в системе управления цифровыми научными коллекциями

Шамиль Махмутович Хайдаров
61-85
Аннотация: Предложены методы семантического анализа документов в системе управления цифровыми научными коллекциями, в том числе электронными научными журналами. Рассмотрены методы обработки документов, содержащих математические формулы, а также способы конвертации этих документов из формата OpenXML в формат TeX. Разработан алгоритм поиска по формулам в коллекциях математических документов, хранящихся в формате OpenXML. Алгоритм реализован в виде онлайн-сервиса на платформе science.tatarstan.
Ключевые слова: семантический анализ, издательские системы.

Как в библиографической ссылке «На лету» формируется дата размещения последней версии публикации

Михаил Михайлович Горбунов-Посадов
554-565
Аннотация:

Размещенную в интернете научную работу, которую ее автор постоянно поддерживает в актуальном состоянии, будем называть живой публикацией. У жанра живой публикации есть множество привлекательных черт. Однако он требует определенного расширения состава метаатрибутов публикации: наряду с традиционными атрибутами здесь на первый план выдвигается дата появления очередной, свежей редакции. Такая дата размещается на видном месте в тексте публикации. Наряду с этим весьма желательной становится включения такой динамически («на лету») формируемой даты в библиографическую ссылку на живую публикацию.


В статье рассмотрены применяющиеся сейчас способы динамического извлечения искомой даты для простой онлайновой публикации, для публикации, получившей DOI посредством Crossref, и для публикаций, размещенных в arXiv.org и preprints.org.

Ключевые слова: живая публикация, динамический компонент библиографической ссылки, свежая дата редакции, Crossref, arXiv.org, Preprints.org.

Формы для показа результатов сравнения языков программирования на примере диалектов языка LISP

Лидия Васильевна Городняя
24-59
Аннотация:

Статья посвящена выработке форм для показа результатов анализа и сравнения особенностей языков, систем и парадигм программирования. Предлагаемая форма продемонстрирована на примере результатов сравнения языка Lisp, наиболее успешных его диалектов (Scheme, Common Lisp, Racket, Clojure) и парадигмы функционального программирования на разных уровнях определения языков и систем программирования. Форма позволила лаконично показать наследование ряда особенностей языка Lisp и их развитие в диалектах на уровне конкретного синтаксиса, абстрактной семантики и системной прагматики.

Ключевые слова: язык программирования, Lisp, Scheme, Common Lisp, Racket, Clojure, функциональное программирование, сравнение языков программирования, конкретный синтаксис, абстрактная семантика, системная прагматика.

Добавление статической типизации в язык функционально-потокового параллельного программирования

Александр Иванович Легалов, Игорь Александрович Легалов, Иван Васильевич Матковский
788-807
Аннотация: Предложено добавить статическую систему типов в функционально-потоковую модель параллельных вычислений и разработанный на ее основе язык функционально-потокового параллельного программирования. Использование статической типизации повышает возможность трансформации функционально-потоковых параллельных программ в программы, выполняемые на современных параллельных вычислительных системах. Предложены языковые конструкции. Описаны их синтаксис и семантика. Отмечена необходимость использования принципа единственного присваивания при формировании хранилищ данных конкретного типа. Рассмотрены особенности инструментальной поддержки предлагаемого подхода.
Ключевые слова: парадигмы программирования, параллельное программирование, функционально-потоковое параллельное программирование, статическая типизация, модели параллельных вычислений.

Учёт структуры документа в методе автоматического аннотирования математических понятий в образовательных текстах

Константин Сергеевич Николаев
558-577
Аннотация:

Обогащение образовательных текстов семантическим содержимым (в частности, дополнение документа гиперссылками на страницы сервиса, отображающего подробную информацию о понятиях, используемых в тексте) способствует повышению эффективности усвоения материала обучающимися. Существующие методы семантической разметки образовательных текстов не учитывают структурные особенности таких документов, что приводит к избыточному распознаванию понятий.


В статье описано развитие метода автоматического аннотирования математических понятий в образовательных математических текстах путем добавления функционала для учета структуры образовательного документа. Основное назначение метода заключается в обработке образовательных материалов курса дистанционного образования «Технология решения планиметрических задач». Соблюдение единого шаблона при создании страниц курса позволяет применить анализ веб-разметки страниц и ключевых слов, примененных создателями курса. Основной задачей в данном процессе является определение типа ячеек таблицы, в которых находятся текстовые фрагменты образовательных материалов. В соответствии с рекомендациями создателей курса, определения необходимо выделять в ячейках, содержащих постановку задачи, а также в тех блоках, где указаны входные данные задачи. Определение типа ячеек таблиц производится с помощью анализа их атрибутов и поиска ключевых слов в их содержимом. Такое ограничение распознаваемых фрагментов текста позволяет улучшить восприятие страниц курса учеником и повысить качество усвоения учебного материала.

Ключевые слова: семантический анализ, математическая онтология, дидактические отношения, математическое образование, разметка документа.

Эффективная разработка приложений при микросервисной архитектуре

Анастасия Эдуардовна Порфильева, Рустем Фаритович Шайхутдинов, Гульшат Атласовна Нуриева, Марсель Рафаэлевич Сидиков, Михаил Михайлович Абрамский, Артур Иванович Карпов, Динар Ильдусович Раимов, Руслан Радикович Новиков
357-368
Аннотация:

Рассмотрены особенности внедрения микросервисной архитектуры в процесс разработки. Проиллюстрированы преимущества данного подхода по сравнению с традиционным монолитным подходом. Показана связь использования микросервисной архитектуры с возможностью работы команды по гибким методологиям разработки.

Ключевые слова: микросервисы, микросервисная архитектура, эффективная разработка, гибкие методологии.

Идентификация авторов в рамках предметной области в семантической библиотеке

Ольга Муратовна Атаева, Владимир Алексеевич Серебряков, Наталия Павловна Тучкова
198-217
Аннотация:

Рассмотрены особенности задачи идентификации авторов и определения авторского вклада в публикации в цифровых библиографических коллекциях. Особенности проблемы недостаточной идентификации проявляются в повторах информации, двойниковании, наличии авторов с полностью совпадающими именами, самоцитировании, автоплагиате и собственно плагиате. Предлагается использовать информацию о публикациях, которая уже накоплена в цифровой библиотеке в виде связанных данных предметной области и множества данных тезауруса адресата, как автора и пользователя библиотеки. Эта информация содержит связи, благодаря которым для идентификации авторства можно использовать контексты ключевых слов, множества соавторов и ассоциативные связи терминов в словарях и тезаурусах. Важно, что рассматривается массив научных публикаций, поскольку они имеют сложившуюся традиционную структуру, что позволяет сравнивать фиксированные элементы текста (аннотации, ключевые слова, коды классификаторов и т. д.). Таким образом, даже при полном совпадении имен в публикациях можно ставить вопрос об авторстве, если в цифровой библиотеке публикации соответствуют различным предметным областям. Разрешение таких противоречий осуществляется путем оценки множества связей всех элементов вторичной информации о публикации. Результатом сравнения может быть добавление автора в некоторую предметную область, т. е. расширение тезауруса адресата и персонального тезауруса автора, или появление в библиотеке полных тезок, но из разных областей знаний. Показано, что современные средства анализа данных позволяют оценить вклад автора в публикацию, несмотря на то, что конечно, реальный вклад в научное исследование может оценить только научное сообщество.

Ключевые слова: сравнение научных текстов, семантический поиск, тезаурус для онтологии знаний, информационный запрос с помощью тезауруса, семантические библиотеки, способы идентификации авторов, тезаурус адресата, вторичная информация, частотный словарь индивидуума, LibMeta.

Методы и инструменты, используемые при подготовке публикаций научных статей в формате HTML

Римма Юрьевна Скорнякова
252-302
Аннотация:

Наряду с традиционной формой электронного представления полных текстов научных статей – форматом PDF – в последние годы все большее распространение получает формат HTML, обладающий для онлайн-публикаций рядом преимуществ за счет имеющихся в нем средств для лучшей структуризации материала, вставки мультимедийного контента и реализации разного рода интерактивных и динамических возможностей. В связи с этим становится весьма актуальной задача получения HTML-версии научной статьи из исходного формата материала, присланного автором. В настоящей работе рассмотрены различные подходы к подготовке HTML-версий полных текстов научных статей, применяемые в издательствах, и описаны используемые при этом программные инструменты. Основное внимание уделено инструментам, применяемым для исходных материалов в формате Word. Изложены также основы стандарта JATS XML, широко применяемого при подготовке онлайн-публикаций журнальных статей.

Ключевые слова: HTML-версия научной статьи, XML-версия научной статьи, стандарт обмена научными статьями, JATS, преобразование форматов научных статей.

Использование синтаксиса для анализа тональности твитов на русском языке

Юлия Владимировна Адаскина, Полина Вадимовна Паничева, Андрей Михайлович Попов
163-184
Аннотация:

Представлен подход к решению задачи анализа тональности в рамках тестирования SentiRuEval – открытого соревнования систем анализа тональности на русском языке. Описанный алгоритм был применен в дорожке по анализу тональности твитов о банках и телекоммуникационных компаниях. Для этих данных была разработана и оценена классификация на три класса: положительный, отрицательный и нейтральный.

Для решения поставленной задачи использовались различные алгоритмы машинного обучения. Признаками для классификатора являлись лингвистические данные, полученные из текста с помощью разработанного нами морфо-синтаксического анализатора. Нормализованные слова, а также синтаксические связи, оказались решающими признаками для достижения наилучшего результата, который был получен с помощью статистического алгоритма опорных векторов.

Оценка, проведенная организаторами конкурса, выявила высокое качество предложенного подхода, который занял первую строчку по трем из четырех мерам качества.
Ключевые слова: анализ тональности, синтаксические связи, русский язык, статистические методы, классификация текстов.

Унифицированное представление онтологии единого цифрового пространства научных знаний

Николай Евгеньевич Каленов, Александр Николаевич Сотников
80-103
Аннотация:

Единое цифровое пространство научных знаний (ЕЦПНЗ) представляет собой цифровую информационную среду, агрегирующую разнородную информацию, связанную с различными аспектами научных знаний. Одной из важных функций ЕЦПНЗ является предоставление информации для решения задач искусственного интеллекта, что обусловливает необходимость поддержки данных в структуре, соответствующей правилам Semantic Web. Особенностями ЕЦПНЗ являются, с одной стороны, политематичность и разнородность элементов контента, с другой – высокая динамика появления новых видов объектов и связей между ними, что обусловлено спецификой развития науки. При реализации ЕЦПНЗ должна быть обеспечена возможность навигации по разнородным ресурсам пространства с использованием семантических связей между ними. Возможности ЕЦПНЗ в значительной мере определяются структурой онтологии пространства, модель которой предложена в данной работе. В рамках модели проведена иерархическая структуризация онтологии ЕЦПНЗ; выделены и определены такие элементы, как «подпространство», «класс объектов», «объект», «атрибуты объекта», три типа попарных связей объектов и атрибутов (универсальные, квазиуниверсальные и специфические). Структура каждого типа элементов определяется «справочником» унифицированного вида; конкретные значения атрибутов и связей содержатся в словарях унифицированной структуры. Выделен класс объектов «Форматы», описывающих правила формирования атрибутов и значений связей. Предложена формализация представлений справочников и словарей ЕЦПНЗ. Предлагаемая модель позволяет достаточно просто добавлять в пространство, по мере необходимости, новые виды объектов, их попарных связей и атрибутов.

Ключевые слова: цифровое пространство научных знаний, онтологии, структуризация, связанные данные, атрибуты данных, семантический WEB.
1 - 25 из 58 результатов 1 2 3 > >> 
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Отправить материал
Текущий выпуск
  • Логотип Atom
  • Логотип RSS2
  • Логотип RSS1

Электронные библиотеки

ISSN 1562-5419

Информация

  • О журнале
  • Цели и задачи
  • Тематика
  • Руководство для авторов
  • Отправка материалов
  • Заявление о конфиденциальности
  • Контакты
  • eLIBRARY.RU
  • dblp computer science bibliography

Отправить статью

Авторам нужно зарегистрироваться в журнале перед отправкой материалов, или, если вы уже зарегистрированы, можно просто войти со своей учетной записью и начать процесс отправки, состоящий из пяти шагов.

Отправить материал
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.

© 2015-2026 Казанский (Приволжский) федеральный университет; Институт развития информационного общества