Том 26 № 4 (2023) | Электронные библиотеки

Решение задачи классификации эмоционального тона сообщения с определением наиболее подходящей архитектуры нейронной сети

Данис Ильмасович Багаутдинов, Рихам Салман, Владислав Алексеевич Алексеев, Рустамджон Муроджонович Усмонов

396-413

Аннотация:

Для определения наиболее эффективного подхода к решению задачи классификации эмоционального тона сообщения проведено обучение выбранных моделей нейронной сети на различных наборах обучающих данных. На основе такого показателя, как процентное соотношение правильно данных ответов на тестовом наборе данных, сравнены комбинации наборов обучающих данных и различных моделей, обученных на основе этих данных. Произведено обучение четырех моделей нейронной сети на трех различных наборах обучающих данных. В результате сравнения точности ответов каждой модели, обученной на разных обучающих данных, сделаны выводы о выборе модели нейронной сети, наиболее подходящей для решения поставленной задачи.

Ключевые слова: NLP, sentiment detection, neural networks, comparison of neural network models, LSTM, CNN, BiLSTM.

PDF

Инструмент последовательного снятия снимков агрегированных данных из потоковых данных

Артем Игоревич Гурьянов, Азат Шавкатович Якупов

414-436

Аннотация:

В современном мире потоковые данные получили широкое распространение во многих предметных областях. Высокую актуальность имеет решение задачи обработки потоковых данных в реальном времени, с минимальной задержкой.

При потоковой обработке данных часто применяются различные приближенные алгоритмы, имеющие гораздо более высокую эффективность по времени и памяти, чем точные алгоритмы. Кроме того, часто возникает потребность прогнозирования состояния потока.

Таким образом, в настоящее время существует потребность в инструменте последовательного снятия снимков агрегированных данных из потоковых данных, дающем возможность прогнозирования состояния потока и применения приближенных алгоритмов обработки потоковых данных.

Авторами статьи разработан такой инструмент, рассмотрены архитектура и механизм его функционирования, а также оценены перспективы его дальнейшего развития.

Ключевые слова: потоковые данные, потоковая обработка данных, анализ потоковых данных, материализованные представления, потоковые алгоритмы, приближенные алгоритмы, прогнозирование потока.

PDF

Нейронная сеть для генерации изображений на основе текста песен с применением моделей OpenAI и CLIP

Алсу Ришатовна Давлетгареева, Ксения Александровна Едкова

437-455

Аннотация:

Исследована эффективность моделей ImageNet diffusion model и CLIP для генерации изображений по текстовому описанию. С использованием различных текстовых вводов на разных параметрах проведены два эксперимента для определения лучших параметров при генерации изображений на основе текстового описания. Результаты показали, что, хотя ImageNet хорошо справляется с созданием изображений, CLIP лучше обеспечивает соединение текстовых подсказок с релевантными изображениями. Полученные результаты характеризуют высокий потенциал объединения названных моделей для создания высококачественных и контекстно релевантных изображений на основе текстового описания.

Ключевые слова: генерация изображений, ImageNet diffusion model, CLIP, глубокое обучение, нейронные сети, обработка естественного языка.

PDF

Комбинирование алгоритмов SfM и ORB при 3D-реконструкции

Ильназ Азатович Даминов; Александр Юрьевич Арсенюк; Александр Сергеевич Тощев

456-465

Аннотация:

Представлен новый алгоритм 3D-реконструкции с использованием комбинации существующих методов – Structure from Motion (SfM), Oriented FAST и Rotated BRIEF (ORB). Предложен подход, объединяющий преимущества названных методов для повышения точности и эффективности восстановления 3D-структуры сцен изображений. Для улучшения качества реконструкции применены фильтрация и устранение выбросов, а также другие оптимизации. Результаты сравнения нового алгоритма с существующими методами показали его превосходство в точности и устойчивости к шуму. Предложенный подход обладает высокой масштабируемостью и может быть успешно применен в различных областях, требующих точной 3D-реконструкции сцен изображений.

Ключевые слова: 3D-реконструкция, компьютерное зрение, фотограмметрия, пространственная точность, sfm, orb, плотная реконструкция, облако точек.

PDF

Cистема контролируемой генерации лица, построенная с использованием сети StyleGAN2

Марат Вильданович Исангулов, Разиль Рустемович Миннеахметов, Алмаз Рустамович Хамеджанов, Тимур Робертович Хафизьянов, Эмиль Асифович Пашаев, Эрнест Ришатович Калимуллин

466-482

Аннотация:

Представлен новый подход к контролируемой генерации лиц, использующий генеративные модели с открытым исходным кодом, включая StyleGAN2 и Гребневую регрессию. Разработана методология, расширяющая возможности StyleGAN2 для контроля характеристик лиц, таких как возраст, раса, пол, выражение лица и атрибуты волос, а также использован обширный набор данных человеческих лиц с аннотациями атрибутов. Лица закодированы в 256-мерном латентном пространстве с использованием кодировщика StyleGAN2, что привело к набору характерных латентных кодов. Применен алгоритм t-SNE для кластеризации этих кодов на основе признаков, продемонстрирована возможность контроля генерации лиц, впоследствии обучены модели регрессии Риджа для каждого измерения латентных кодов с использованием размеченных признаков. При декодировании с использованием StyleGAN2 полученные коды успешно восстанавливали изображения лиц, сохраняя связь с входными признаками. Разработанный подход дает легкий и эффективный способ контролируемой генерации лиц с использованием существующих генеративных моделей, таких как StyleGAN2, и открывает новые возможности для различных областей применения.

Ключевые слова: машинное обучение, генерация лица, StyleGan, энкодер, декодер, скрытые коды, отображение признаков, гребневая регрессия.

PDF

Разработка cистемы поиска и индексирования контента аудиозаписей

Роман Алексеевич Климов, Азат Шавкатович Якупов

483-497

Аннотация:

Статья посвящена разработке системы поиска и индексации аудиофайлов с использованием автоматического распознавания речи (ASR) и Elasticsearch. Проанализированы актуальные системы транскрибирования аудиофайлов на русском языке и выбрана система whisper как лучшая. Создан алгоритм оптимизации скорости транскрибирования с помощью параллелизации процессов обработки файла, продемонстрирована его эффективность. Построена система на микросервисной архитектуре, способная индексировать контент аудиофайлов и их мета-данные для поиска. Результаты исследования показали, что предложенный подход может быть применен для создания эффективных и гибких систем поиска и аналитики аудиоинформации.

Ключевые слова: транскрибирование, индексирование, параллелизация, микросервисы, масштабируемость.

PDF

О разработке NoSQL СУБД GoldenRaceDB как альтернативы Google Firebase

Роман Валерьевич Мосолов

498-517

Аннотация:

Описаны опыт разработки новой нереляционной системы управления базами данных, названной GoldenRaceDB, и предпосылки, располагавшие к ее созданию в контексте проблемы импортозамещения зарубежных технологий. Новая технология реализована на базе серверного окружения Node.js.

Материал статьи предполагает наличие у читателя опыта разработки серверной части системы минимум на одном высокоуровневом языке программирования либо опыта разработки СУБД. Описанная технология не является свободно распространяемой (open source) и была предназначена исключительно для решения задач внутри организации, места ее создания. Однако по прилагаемым в статье листингам можно понять общий вектор создания аналогичной СУБД для разработки собственной упраздненной СУБД на другом высокоуровнем языке программирования.

Ключевые слова: система управления базами данных, СУБД, NoSQL СУБД, разработка СУБД, создание СУБД, оператор СУБД, СУБД примеры, запросы в СУБД, средства СУБД, импортозамещение софт, аналоги СУБД.

PDF

Естественнонаучные музеи в цифровом пространстве геологических знаний

Вера Викторовна Наумова, Сергей Владимирович Черкасов, Виталий Сергеевич Ерёменко, Алексей Андреевич Загумённов

518-537

Аннотация:

Охарактеризованы роль музейных данных в научных геологических исследованиях, а также интеграция этих данных в цифровое пространство геологических знаний для более эффективного использования и анализа распределенных геологических и музейных ресурсов и возможности построения цифровых моделей.

Ключевые слова: геологические данные, естественнонаучные музеи, открытые данные, интеграция музейных данных, цифровое пространство геологических знаний.

PDF

Cемантические сервисы цифровой экосистемы ontomath для математического образования

Ольга Авенировна Невзорова, Евгений Константинович Липачёв, Константин Сергеевич Николаев

538-569

Аннотация:

Представлен набор семантических сервисов, разработанных с целью поддержки образовательного процесса в области математики. Функционал этих сервисов основан на использовании математических онтологий OntoMath^Edu и OntoMath^PRO. Онтология профессионального математического знания OntoMath^PRO предназначена для классификации и систематизации математических понятий и включает несколько важнейших областей математики. Образовательная математическая онтология OntoMath^Edu системно представляет знания по учебному курсу «Планиметрия». Для применения онтологий в образовательных приложениях разработан подход к проектированию пререквизитных отношений в названных онтологиях. Для поддержки математического образования разработаны сервисы семантического поиска по математическим формулам, семантического аннотирования учебных материалов, визуализации подграфов семантической сети онтологии OntoMath^Edu, а также параллельный формальный/неформальный корпус математических утверждений и система автоматической генерации тестовых вопросов по математическим дисциплинам.

Приведены примеры успешного применения разработанных программных инструментов. Эти инструменты встроены в цифровую экосистему OntoMath, в рамках которой осуществляется взаимодействие семантических сервисов управления математическим знанием.

Ключевые слова: Цифровая экосистема, экосистема OntoMath, предметная онтология, математическая онтология OntoMathPRO, образовательная онтология OntoMathEdu, пререквизитное отношение, семантический сервис.

PDF

«Вычислительное мышление» как вторая грамотность в современном цифровом образовании и обществе

Тимур Расимович Файзрахманов

570-587

Аннотация:

В ходе невероятного роста популярности цифровых технологий и цифрового образования появилось такое понятие, как «вычислительное мышление». Его резкий спрос и популяризация, как ответ на современные нужды цифрового мира, послужили реструктуризации образования и возникновению большого количества литературы на данную тему. Не всегда ясно, чем же является вычислительное мышление, какие аспекты оно включает и с чем его сравнивать. В данной работе мы рассмотрели смысл данного понятия, его значение в современном цифровом образовании и провели аналогию наличия вычислительного мышления с навыком написанием обычного текста.

Ключевые слова: вычислительное мышление, цифровое образование, кодинг, программирование, информатика, STEM.

PDF

Весь выпуск

Статьи

Решение задачи классификации эмоционального тона сообщения с определением наиболее подходящей архитектуры нейронной сети

Инструмент последовательного снятия снимков агрегированных данных из потоковых данных

Нейронная сеть для генерации изображений на основе текста песен с применением моделей OpenAI и CLIP

Комбинирование алгоритмов SfM и ORB при 3D-реконструкции

Cистема контролируемой генерации лица, построенная с использованием сети StyleGAN2

Разработка cистемы поиска и индексирования контента аудиозаписей

О разработке NoSQL СУБД GoldenRaceDB как альтернативы Google Firebase

Естественнонаучные музеи в цифровом пространстве геологических знаний

Cемантические сервисы цифровой экосистемы ontomath для математического образования

«Вычислительное мышление» как вторая грамотность в современном цифровом образовании и обществе