Найти

Поиск статей

Расширенные фильтры

Опубликовано после

Опубликовано до

По автору

Результаты поиска

Классификация изображений с использованием обучения с подкреплением

Артем Александрович Елизаров, Евгений Викторович Разинков

1172-1191

Аннотация:

В последнее время активно развивается такое направление машинного обучения, как обучение с подкреплением. Как следствие предпринимаются попытки использования обучения с подкреплением для решения задач компьютерного зрения, в частности для решения задачи классификации изображений. Задачи компьютерного зрения являются на сегодняшний день одними из наиболее актуальных задач искусственного интеллекта.

В статье предложен метод классификации изображений в виде глубокой нейронной сети с использованием обучения с подкреплением. Идея разработанного метода сводится к решению задачи о контекстном многоруком бандите с помощью различных стратегий достижения компромисса между эксплуатацией и исследованием и алгоритмов обучения с подкреплением. Рассмотрены такие стратегии, как -жадная, -softmax, -decay-softmax и метод UCB1, и такие алгоритмы обучения с подкреплением, как DQN, REINFORCE и A2C. Проведен анализ влияния различных параметров на эффективность работы.

Ключевые слова: машинное обучение, классификация изображений, обучение с подкреплением, задача о контекстном многоруком бандите.

Автоматическая разметка обучающих выборок в компьютерном зрении с использованием методов машинного обучения

Алексей Константинович Журавлёв, Карен Альбертович Григорян

718-729

Аннотация:

Рассмотрена проблема автоматической разметки обучающих выборок в области компьютерного зрения с использованием методов машинного обучения.

Разметка данных является ключевым этапом в разработке и обучении моделей глубокого обучения, однако процесс создания размеченных данных зачастую требует значительных временных и трудовых затрат. В статье предложен механизм автоматической разметки, основанный на использовании сверточных нейронных сетей и методов активного обучения.

Предложенная методология включает анализ и оценку существующих подходов к автоматической разметке. Эффективность предложенных решений оценена на общедоступных наборах данных. Результаты показали, что предложенный метод в значительной мере сокращает время, необходимое для разметки данных, но в любом случае требует вмешательства оператора-разметчика.

Обзор литературы включает анализ современных методов разметки и существующих автоматических систем, что позволяет лучше понять контекст и преимущества предлагаемого подхода. В заключении обсуждены достижения, ограничения и возможные направления для будущих исследований в данной области.

Ключевые слова: компьютерное зрение, машинное обучение, автоматическая разметка данных, обучающая выборка, сегментация изображений.

Сравнительный анализ библиотек для детектирования позы человека в условиях работы на мобильных устройствах

Егор Игоревич Ярко

573-600

Аннотация:

Оценка положения тела человека (Human Pose Estimation, HPE) стала одной из наиболее актуальных тем в исследованиях в области компьютерного зрения. Эта технология может применяться в различных сферах, таких как видеонаблюдение, медицинская помощь и анализ спортивных движений.

В связи с растущим спросом на HPE за последние 20 лет было разработано большое количество библиотек для этой технологии. C 2017 года опубликовано множество алгоритмов HPE, основанных на скелетной модели, которые были упакованы в библиотеки для удобства использования исследователями. Эти библиотеки важны для исследователей, которые хотят интегрировать их в реальные приложения для видеонаблюдения, медицинской помощи и анализа спортивных движений.

В работе рассмотрены преимущества и недостатки четырёх популярных передовых библиотек HPE для распознавания поз человека, которые могут работать на мобильных устройства: Lightweight OpenPose, PoseNet, MoveNet и Blase Pose.

Ключевые слова: поза человека, Human Pose Estimation, HPE, детектирование позы, компьютерное зрение, мобильные устройства, дополненная реальность, Lightweight OpenPose, PoseNet, MoveNet, BlazePose, скелетная модель.

Информационно-аналитическая система сегментации изображений с помощью нейро-нечеткого подхода

Максим Владимирович Бобырь, Богдан Андреевич Бондаренко

601-621

Аннотация:

Представлена информационно-аналитическая система (ИАС) для высокоскоростной сегментации изображений в градациях серого, основанной на модифицированном методе дефаззификации с использованием треугольных функций принадлежности. Цель исследования заключается в анализе влияния упрощения формулы дефаззификации на точность и контрастность выделения объектов. Предложенный подход включает адаптивное обучение весового коэффициента, позволяющее динамически корректировать процесс дефаззификации в зависимости от целевых значений. Проведено сравнение базового метода усреднения значений принадлежности и модифицированного варианта с учетом нелинейных весов. Эксперименты, проведенные на изображениях формата 1024x720, продемонстрировали, что разработанная ИАС обеспечивает высокую точность сегментации и улучшенную контрастность объектов при минимальных вычислительных затратах. Результаты подтверждают превосходство предложенного метода над традиционными подходами, подчеркивая перспективы применения искусственного интеллекта в задачах компьютерного зрения.

Ключевые слова: ИАС, нейро-нечеткий алгоритм, сегментация изображений, дефаззификация, искусственный интеллект, метод отношения площадей.

Программное средство оптимизации процессов видеопроизводства

Рустем Фаридович Давлетшин, Ирина Сергеевна Шахова

478-502

Аннотация:

Предложены программные механизмы, направленные на оптимизацию процессов видеопроизводства для авторов художественных видеоматериалов – материалов, предполагающих предварительную постановочную работу. Разработан механизм создания анимированных трехмерных планов съемки (раскадровок) с использованием дополненной реальности для позиционирования и анимации перемещения актеров. С целью преодоления ограничений операционной системы iOS, связанных с доступом к сенсорам, разработан механизм раздельного захвата аудио- и видеопотоков с датчиков устройства для проведения записи, а также их последующей синхронизации по временным меткам для сохранения в память устройства. Отслеживание соблюдения правил композиционного построения и анализ качества изображения на предмет расфокусировки камеры реализованы с использованием технологий компьютерного зрения. Также представлены механизмы работы со сценарием, включающие алгоритмы обработки текста для вывода на экран в виде субтитров, а также распознавания речи актеров и сравнения её с текстом сценария.

Ключевые слова: видеопроизводство, мобильное кино, дополненная реальность, раскадровка, видеозапись, автоматизация, программное решение.

Применение методов компьютерного зрения к распознаванию старотатарского текста

Искандер Айратович Валишин

448-477

Аннотация:

Разработан инструмент, распознающий строки, слова и арабские символы с отсканированного изображения. Рассмотрены возможности и перспективы применения инструмента в исследовательской деятельности. Приведены результаты экспериментов по проверке работоспособности инструмента на примере старотатарских оцифрованных произведений.

Ключевые слова: YOLO, распознавание арабских символов, нейронные сети, компьютерное зрение.

О подходе к детектированию движения пешеходов методом гистограмм направленных градиентов

Максим Владимирович Бобырь, Наталья Анатольевна Милостная, Наталия Игоревна Храпова

429-447

Аннотация:

Рассмотрен подход к автоматическому распознаванию движения людей на пешеходном переходе. Он включает две основные процедуры, для каждой из которых приведены команды программного кода на языке программирования C# с помощью библиотеки компьютерного зрения EMGU. На первой процедуре с помощью комбинации методов гистограмм направленных градиентов и опорных векторов осуществляется детектирование пешеходов. Вторая процедура позволяет считывать кадры из видеопоследовательности и обрабатывать их. Данный подход позволяет детектировать движения людей на пешеходном переходе без использования специализированных нейронных сетей. При этом метод, предложенный в статье, продемонстрировал достаточную надежность распознавания движения людей, что свидетельствует о его применимости в реальных условиях.

Ключевые слова: распознавание движения пешеходов, EMGU, гистограммы направленных градиентов, метод опорных векторов.

Раскадровка как одно из представлений сценарного прототипа компьютерных игр

Влада Владимировна Кугуракова, Гульнара Фаритовна Сахибгареева, Олег Александрович Бедрин

408-444

Аннотация:

Работа посвящена изучению и усовершенствованию процесса проектирования, разработки и тестирования повествования видеоигр. Изучены существующие практики написания и поддержки в актуальном состоянии сценария интерактивных произведений. Сформулированы определение сценарного прототипа, а также требования к его форме. Выдвинута идея об эффективности автоматизации создания сценарного прототипа в виде инструмента-генератора. Составлено видение такого инструмента. Представлено влияние такого инструмента на порядок разработки. Реализован компонент инструмента и проведен эксперимент, который доказывает эффективность на таком примере, как генерация раскадровки из текста. Сформулированы планы на будущую разработку.

Ключевые слова: компьютерные игры, разработка видеоигр, интерактивное повествование, сценарный прототип, нарративный дизайн, сценаристика, игровая документация, раскадровка, генерация раскадровки, интерактивная раскадровка.

1 - 8 из 8 результатов