Представлен мультимодальный подход к обнаружению объектов на основании данных теле- и тепловизионного видеопотока. Цель исследования состоит в проверке возможности и целесообразности использования многоканального обучения сверточных нейросетей в задачах распознавания объектов на видео. Для достижения поставленной цели использовались методы компьютерного моделирования, машинного обучения, глубоких аналогий, в результате чего была разработана структура модели машинного обучения и распознавания объектов видеопотока. Теоретическим выводом исследования является алгоритм обучения и распознавания, практическим — архитектура модели в программном коде.
< ... >
A multimodal approach to object detection based on tele- and thermal imaging video stream data is presented. The purpose of the study is to test the possibility and feasibility of using multi-channel training of convolutional neural networks in object recognition tasks on video. To achieve this goal, methods of computer modeling, machine learning, and deep analogies were used. The result is the developed structure of the machine learning model and object recognition of the video stream. The theoretical conclusion is the learning and recognition algorithm, the practical one is the architecture of the model in the program code.
Keywords:
object detection, convolutional neural networks, machine learning, computer vision, multi-channel learning