Опубликован: 28.09.2023
Весь выпуск
Статьи
Решение задачи классификации эмоционального тона сообщения с определением наиболее подходящей архитектуры нейронной сети
Для определения наиболее эффективного подхода к решению задачи классификации эмоционального тона сообщения проведено обучение выбранных моделей нейронной сети на различных наборах обучающих данных. На основе такого показателя, как процентное соотношение правильно данных ответов на тестовом наборе данных, сравнены комбинации наборов обучающих данных и различных моделей, обученных на основе этих данных. Произведено обучение четырех моделей нейронной сети на трех различных наборах обучающих данных. В результате сравнения точности ответов каждой модели, обученной на разных обучающих данных, сделаны выводы о выборе модели нейронной сети, наиболее подходящей для решения поставленной задачи.
Инструмент последовательного снятия снимков агрегированных данных из потоковых данных
В современном мире потоковые данные получили широкое распространение во многих предметных областях. Высокую актуальность имеет решение задачи обработки потоковых данных в реальном времени, с минимальной задержкой.
При потоковой обработке данных часто применяются различные приближенные алгоритмы, имеющие гораздо более высокую эффективность по времени и памяти, чем точные алгоритмы. Кроме того, часто возникает потребность прогнозирования состояния потока.
Таким образом, в настоящее время существует потребность в инструменте последовательного снятия снимков агрегированных данных из потоковых данных, дающем возможность прогнозирования состояния потока и применения приближенных алгоритмов обработки потоковых данных.
Авторами статьи разработан такой инструмент, рассмотрены архитектура и механизм его функционирования, а также оценены перспективы его дальнейшего развития.
Нейронная сеть для генерации изображений на основе текста песен с применением моделей OpenAI и CLIP
Исследована эффективность моделей ImageNet diffusion model и CLIP для генерации изображений по текстовому описанию. С использованием различных текстовых вводов на разных параметрах проведены два эксперимента для определения лучших параметров при генерации изображений на основе текстового описания. Результаты показали, что, хотя ImageNet хорошо справляется с созданием изображений, CLIP лучше обеспечивает соединение текстовых подсказок с релевантными изображениями. Полученные результаты характеризуют высокий потенциал объединения названных моделей для создания высококачественных и контекстно релевантных изображений на основе текстового описания.
Комбинирование алгоритмов SfM и ORB при 3D-реконструкции
Представлен новый алгоритм 3D-реконструкции с использованием комбинации существующих методов – Structure from Motion (SfM), Oriented FAST и Rotated BRIEF (ORB). Предложен подход, объединяющий преимущества названных методов для повышения точности и эффективности восстановления 3D-структуры сцен изображений. Для улучшения качества реконструкции применены фильтрация и устранение выбросов, а также другие оптимизации. Результаты сравнения нового алгоритма с существующими методами показали его превосходство в точности и устойчивости к шуму. Предложенный подход обладает высокой масштабируемостью и может быть успешно применен в различных областях, требующих точной 3D-реконструкции сцен изображений.
Cистема контролируемой генерации лица, построенная с использованием сети StyleGAN2
Представлен новый подход к контролируемой генерации лиц, использующий генеративные модели с открытым исходным кодом, включая StyleGAN2 и Гребневую регрессию. Разработана методология, расширяющая возможности StyleGAN2 для контроля характеристик лиц, таких как возраст, раса, пол, выражение лица и атрибуты волос, а также использован обширный набор данных человеческих лиц с аннотациями атрибутов. Лица закодированы в 256-мерном латентном пространстве с использованием кодировщика StyleGAN2, что привело к набору характерных латентных кодов. Применен алгоритм t-SNE для кластеризации этих кодов на основе признаков, продемонстрирована возможность контроля генерации лиц, впоследствии обучены модели регрессии Риджа для каждого измерения латентных кодов с использованием размеченных признаков. При декодировании с использованием StyleGAN2 полученные коды успешно восстанавливали изображения лиц, сохраняя связь с входными признаками. Разработанный подход дает легкий и эффективный способ контролируемой генерации лиц с использованием существующих генеративных моделей, таких как StyleGAN2, и открывает новые возможности для различных областей применения.
Разработка cистемы поиска и индексирования контента аудиозаписей
Статья посвящена разработке системы поиска и индексации аудиофайлов с использованием автоматического распознавания речи (ASR) и Elasticsearch. Проанализированы актуальные системы транскрибирования аудиофайлов на русском языке и выбрана система whisper как лучшая. Создан алгоритм оптимизации скорости транскрибирования с помощью параллелизации процессов обработки файла, продемонстрирована его эффективность. Построена система на микросервисной архитектуре, способная индексировать контент аудиофайлов и их мета-данные для поиска. Результаты исследования показали, что предложенный подход может быть применен для создания эффективных и гибких систем поиска и аналитики аудиоинформации.
О разработке NoSQL СУБД GoldenRaceDB как альтернативы Google Firebase
Описаны опыт разработки новой нереляционной системы управления базами данных, названной GoldenRaceDB, и предпосылки, располагавшие к ее созданию в контексте проблемы импортозамещения зарубежных технологий. Новая технология реализована на базе серверного окружения Node.js.
Материал статьи предполагает наличие у читателя опыта разработки серверной части системы минимум на одном высокоуровневом языке программирования либо опыта разработки СУБД. Описанная технология не является свободно распространяемой (open source) и была предназначена исключительно для решения задач внутри организации, места ее создания. Однако по прилагаемым в статье листингам можно понять общий вектор создания аналогичной СУБД для разработки собственной упраздненной СУБД на другом высокоуровнем языке программирования.
Естественнонаучные музеи в цифровом пространстве геологических знаний
Охарактеризованы роль музейных данных в научных геологических исследованиях, а также интеграция этих данных в цифровое пространство геологических знаний для более эффективного использования и анализа распределенных геологических и музейных ресурсов и возможности построения цифровых моделей.
Cемантические сервисы цифровой экосистемы ontomath для математического образования
Представлен набор семантических сервисов, разработанных с целью поддержки образовательного процесса в области математики. Функционал этих сервисов основан на использовании математических онтологий OntoMathEdu и OntoMathPRO. Онтология профессионального математического знания OntoMathPRO предназначена для классификации и систематизации математических понятий и включает несколько важнейших областей математики. Образовательная математическая онтология OntoMathEdu системно представляет знания по учебному курсу «Планиметрия». Для применения онтологий в образовательных приложениях разработан подход к проектированию пререквизитных отношений в названных онтологиях. Для поддержки математического образования разработаны сервисы семантического поиска по математическим формулам, семантического аннотирования учебных материалов, визуализации подграфов семантической сети онтологии OntoMathEdu, а также параллельный формальный/неформальный корпус математических утверждений и система автоматической генерации тестовых вопросов по математическим дисциплинам.
Приведены примеры успешного применения разработанных программных инструментов. Эти инструменты встроены в цифровую экосистему OntoMath, в рамках которой осуществляется взаимодействие семантических сервисов управления математическим знанием.
«Вычислительное мышление» как вторая грамотность в современном цифровом образовании и обществе
В ходе невероятного роста популярности цифровых технологий и цифрового образования появилось такое понятие, как «вычислительное мышление». Его резкий спрос и популяризация, как ответ на современные нужды цифрового мира, послужили реструктуризации образования и возникновению большого количества литературы на данную тему. Не всегда ясно, чем же является вычислительное мышление, какие аспекты оно включает и с чем его сравнивать. В данной работе мы рассмотрели смысл данного понятия, его значение в современном цифровом образовании и провели аналогию наличия вычислительного мышления с навыком написанием обычного текста.