Найти

Классификация изображений с помощью сверточных нейронных сетей

Сергей Алексеевич Филиппов

366-382

Аннотация:

Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.

Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.

Для классификации изображений в настоящее время можно применить множество различных инструментов, каждый из которых направлен на решение определенного спектра задач. В статье проведен краткий обзор библиотек и технологий для классификации изображений. Построена архитектура простой свёрточной нейронной сети для классификации изображений.

Были проведены эксперименты по распознаванию изображений с такими популярными нейронными сетями, как VGG16 и ResNet 50. Обе нейронные сети показали хорошие результаты. Однако ResNet 50 переобучилась из-за того, что в наборе данных присутствовали однотипные изображения для обучения, поскольку в данной нейронной сети больше слоев, позволяющих считывать признаки объектов на изображениях. С обученными моделями был проведен сравнительный анализ по распознаванию изображений, специально подготовленных для этого эксперимента.

Ключевые слова: распознавание изображений, нейронная сеть, сверточная нейронная сеть, классификация изображений, машинное обучение.

Программное средство оптимизации процессов видеопроизводства

Рустем Фаридович Давлетшин, Ирина Сергеевна Шахова

478-502

Аннотация:

Предложены программные механизмы, направленные на оптимизацию процессов видеопроизводства для авторов художественных видеоматериалов – материалов, предполагающих предварительную постановочную работу. Разработан механизм создания анимированных трехмерных планов съемки (раскадровок) с использованием дополненной реальности для позиционирования и анимации перемещения актеров. С целью преодоления ограничений операционной системы iOS, связанных с доступом к сенсорам, разработан механизм раздельного захвата аудио- и видеопотоков с датчиков устройства для проведения записи, а также их последующей синхронизации по временным меткам для сохранения в память устройства. Отслеживание соблюдения правил композиционного построения и анализ качества изображения на предмет расфокусировки камеры реализованы с использованием технологий компьютерного зрения. Также представлены механизмы работы со сценарием, включающие алгоритмы обработки текста для вывода на экран в виде субтитров, а также распознавания речи актеров и сравнения её с текстом сценария.

Ключевые слова: видеопроизводство, мобильное кино, дополненная реальность, раскадровка, видеозапись, автоматизация, программное решение.

Оценка усталости человека методом анализа фотографий лица с помощью сверточных нейронных сетей

Байрамов Азат Ильгизович, Фасхутдинов Тимур Русланович, Тимергалин Денис Марселевич, Ямиков Рустем Рафикович, Муртазин Виталий Рудольфович, Никита Алексеевич Туманов

582-603

Аннотация:

Представлены решения проблемы распознавания усталости человека по изображению его лица. Сначала рассмотрены уже существующие алгоритмы, а затем предложена и реализована модель собственной архитектуры. В заключении приведены итоговые показатели работы модели.

Ключевые слова: степень усталости, сверточные нейронные сети, машинное обучение, ResNet-152v2, распознавание усталости, обработка изображений, оценка усталости по изображению лица.

Экспериментальное исследование порогового метода HSV и нейронной сети U-Net в задаче распознавания пожаров

Максим Владимирович Бобырь, Наталья Анатольевна Милостная, Богдан Андреевич Бондаренко, Максим Максимович Бобырь

829-851

Аннотация:

Проведен сравнительный анализ методов сегментации изображений пожара с использованием пороговой обработки в цветовом пространстве HSV и нейронной сети U-Net. Цель исследования заключалась в оценке эффективности этих подходов по времени выполнения и точности детекции огня на основе метрик RMSE, IoU, Dice и MAPE. Эксперименты были проведены на четырех различных изображениях пожара с вручную подготовленными истинными масками пожаров. Результаты показали, что метод HSV обеспечивает высокую скорость обработки (0.0010–0.0020 с), но склонен к детекции не только огня, но и дыма, что снижает его точность (IoU 0.0863–0.3357, Dice 0.1588–0.5026). Нейронная сеть U-Net демонстрирует более высокую точность сегментации огня (IoU – до 0.6015, Dice – до 0.7512) за счет избирательного выделения пламени, однако требует значительно большего времени (1.2477–1.3733 с) и может недооценивать общую площадь пожара (MAPE – до 78.5840%). Визуальная оценка подтвердила различия в поведении методов: HSV захватывает дым как часть целевой области, тогда как U-Net фокусируется исключительно на огне. Выбор между методами зависит от приоритетов задачи: скорости или точности. Предложены направления дальнейших исследований, включая оптимизацию U-Net и разработку гибридных подходов.

Ключевые слова: сегментирование, локализация пожаров, HSV-сегментация, U-Net.

Система тестирования контроллеров, основанная на распознавании текста на экране

Александр Александрович Докукин

1368-1384

Аннотация:

Описано решение задачи тестирования контроллеров на основе чтения информации с их экрана. Для этого разработана программно-аппаратная система, состоящая из камеры и программных модулей, реализующих необходимые алгоритмы и методы: модуля предобработки изображения; модуля определения типа меню; модуля обработки символов шрифта; модуль чтения текста, в том числе, написанного различными шрифтами; собственно модуля тестирования. Система реализована для контроллеров определенного типа с монохромным дисплеем 128 х 64 точек. Все методы реализованы на языке Python с использованием популярных библиотек. Система внедрена в эксплуатацию и на данный момент осуществляет автоматизацию нескольких наиболее трудоемких тестов. Поддерживается расширение их набора в виде плагинов.

Ключевые слова: компьютерное зрение, распознавание текста, тестирование контроллеров.

Двухуровневая информационно-аналитическая система управления интеллектуальным светофором

Максим Владимирович Бобырь, Наталия Игоревна Храпова

696-717

Аннотация:

В современном мире проблемы, возникающие в сфере дорожного движения, имеют большую значимость. С целью решения существующих задач разрабатываются различные интеллектуальные системы, одной из которых является система «Умный город». Данная работа посвящена разработке информационно-аналитической системы (ИАС) для управления интеллектуальным светофором. Представленная система состоит из двух уровней, каждый из которых реализует набор определенных операций. Первый уровень отвечает за обнаружение объектов, в частности, пешеходов и автомобилей, находящихся на перекрестке, а второй уровень осуществляет расчёт времени работы сигналов светофора для управляющего сигнала, который передаётся на устройство. Для сравнительного анализа выбран комбинационный метод (HOG+SVM) Histogram of Oriented Gradients, основанный на подсчёте числа направлений градиента на отдельных областях изображения и Support Vector Machines, с помощью которого строятся гиперплоскости в n-мерном пространстве с целью разделения объектов, относящихся к разным классам. Результаты экспериментального исследования, в ходе которого проводилось распознавание объектов на изображениях, показали превосходство разработанной информационно-аналитической системы над существующими. Среднее значение точности выявления пешеходов и автомобилей посредством ИАС составило 69,4%. Кроме того, по результатам проведенного эксперимента сделан вывод, что точность выявления объектов на изображениях прямо пропорциональна расстоянию от видеокамеры до объекта.

Ключевые слова: интеллектуальный светофор, детектирование объектов, машинное обучение, нечётко-логический метод детектирования границ, YOLO, HOG, SVM.

Результаты поиска

Классификация изображений с помощью сверточных нейронных сетей

Программное средство оптимизации процессов видеопроизводства

Оценка усталости человека методом анализа фотографий лица с помощью сверточных нейронных сетей

Экспериментальное исследование порогового метода HSV и нейронной сети U-Net в задаче распознавания пожаров

Система тестирования контроллеров, основанная на распознавании текста на экране

Двухуровневая информационно-аналитическая система управления интеллектуальным светофором