УДК 004.65
Целью работы является разработка модификации алгоритма агломеративной кластеризации для повышения качества последней и возможности поиска по разнородным коллекциям, а также структуры системы управления базами данных для применения данного алгоритма и хранения изображений с возможностью дальнейшего уменьшения времени поиска. Для решения поставленных в работе задач использовались основные методы теории распознавания образов, машинного обучения, методов цифровой обработки изображений, а также сравнительный анализ. Результатом работы является алгоритм поиска изображений в БД, причем не только исходных, но также зашумленных, отредактированных и испорченных. Также разработан поиск похожих изображений, который по достоверности и производительности может конкурировать с существующими методами поиска изображений в сети. Приведены экспериментальные результаты, полученные для базы данных произвольных изображений размером около 20 млн объектов. Практическая ценность работы заключается в повышении эффективности средств автоматизированной обработки и поиска изображений в графических базах данных.
< ... >
The task of the work is to develop a modification of the agglomerative clustering algorithm to improve the quality of clustering and the possibility of searching through heterogeneous collections. The second task is to develop a DBMS for applying this algorithm and storing images with the possibility of further reducing the search time. To solve problems in the work, the main methods of the theory of pattern recognition, machine learning, digital image processing methods, as well as comparative analysis were used. The result is an algorithm for searching images in the DB, not only original ones, but also noisy, edited and corrupted ones. A search for similar images has been developed, which in terms of reliability and performance can compete with existing methods for searching for images on the network. Experimental results obtained for a DB of arbitrary images with a size of about 20 million objects are presented. The practical part of the work is to increase the efficiency of automated processing and image search tools in graphic DB.
Keywords:
theory of active perception, CBIR, recognition, computer vision, image search, data clustering algorithms, methods for constructing feature vectors