Метод распознавания объектов на базе алгоритма Виолы-Джонса. Часть 2

Первую часть можно найти в предыдущей части Метод распознавание объектов на базе алгоритма Виолы-Джонса. Часть 1.

Кластеризация данных с учетом мягкого выхода

Процесс кластеризации занимается поиском структуры в коллекции не-маркированных данных, это процесс организации объектов в группы, члены которой в некотором смысле похожи. Кластер – множество похожих объектов, между тем как непохожие принадлежат другим кластерам.

Основные требования к алгоритму кластеризации:

Под указанные требования подходит алгоритм DBSCAN [6]. Алгоритм прост в реализации. Оперирует понятием сосед, расстояние до соседей и количество соседей. Параметры на базе этих понятий могут быть использованы для повышения эффективности решаемой задачи.

В задаче кластеризации данных можно учитывать дополнительную информацию, которой является значение мягкого выхода. Кроме того, используя эту информацию можно искусственно снизить порог распознавания и учитывать полученные регионе на этапе кластеризации данных.

При снижении порога значительно увеличивается количество найденных регионов. На рис. 6 показано среднее количество найденных объектов, в зависимости от значения мягкого выхода.

Идея предложенного метода заключается в проверке гипотезы:

При уменьшении порога срабатывания алгоритма распознавания и применяя алгоритм кластеризации объектов возможно улучшить эффективность распознавания.

При этом следует заметить, что параметры в ал-горитме кластеризации подбираются эмпирически.

Зависимость количества найденных объектов от порога срабатывания

Проведя серию экспериментов был сформирован график зависимости (рис. 7), по которому была определена оптимальная пара значений для алгоритма кластеризации (количество соседей, минимальное расстояние между соседями).

Зависимость Ground Truth от порога алгоритма распознавания и количества ближайших соседей

Учитывая вероятность ложного срабатывания (таблица 1), выбираем подходящие параметры.

Таблица 1 Вероятность ложного срабатывания в зависимости от порога алгоритма распознавания

Вероятность ложного срабатывания в зависимости от порога алгоритма распознавания

Анализ полученных результатов

Проводимые эксперименты анализируют изображения из базы данных YouTube Faces DB [3]. Изображения из этой базы данных представляют из себя отдельные кадры из видеозаписей, снятых на фиксированную камеру людей в различных позах и действиях. К каждому изображению вручную приписана информация о положении и размере лиц в кадре (Ground Truth).

Сравнение производилось с использованием 300 тестовых фотографий разных людей. При сравнении использовались следующие критерии оценки: ложный пропуск (FN) и ложное обнаружение (FP). Оценка эффективности распознавания в данной работе ведется с двумя альтернативными реализациями алгоритмами Виолы-Джонса: Open CV [7] и открытой реализация стандартного алгоритма Viola Jones [8].

 

На рис. 8 показан результат по обоим критериям сравнения. Видно, что предложенный алгоритм эффективнее обрабатывает ошибки I рода чем стандартный алгоритм и реализация Open CV. В это же время ошибки II рода обрабатываются хуже, чем в Open CV, но заметно лучше, чем в оригинальном алгоритме. Это позволяет сделать вывод, что предложенный метод распознавания объектов эффективнее оригинального алгоритма.

При различных значениях параметров алгоритма кластеризации изменяется процентное соотношение ошибок I и II родов. Подобранные параметры алгоритма кластеризации и пороговое значение мягкого выхода показывают одинаковые результаты на различных тестовых выборках. Это позволяет сделать вывод, что предложенный метод инвариантен к рассматриваемым исходным данным.

Сравнение алгоритмов

Выводы

В рамках статьи был рассмотрен алгоритм Виолы-Джонса. Определены его основные недостатки: большое количество выходных данных алго-ритма распознавания и длительное время работы алгоритма обучения. Было установлено, что использование мягкого выхода для однозначно-го ответа о принадлежности рассматриваемого региона к искомому объ-екту невозможна.

Предложен метод распознавания объектов, использующий измененное значение мягкого выхода и дополнительную постобработку в виде кла-стеризации полученных регионов. Приведенный метод показал хорошие результаты распознавания, что подтверждается большим количеством тестов.

Полученные результаты позволяют сделать вывод, что предложенный алгоритм на 59% эффективнее базового алгоритма Виолы-Джонса справляется с ошибками I рода и на 81% эффективнее против ошибок II рода. В сравнении с известной реализацией алгоритма в библиотеки OpenCV предложенный алгоритм на 31% эффективнее справляется с ошибками I рода и на 64% хуже с ошибками II рода. В дальнейшей ра-боте планируется улучшить эффективность работы предложенного ал-горитма в борьбе с ошибками II рода.

Список литературы

  1. P. Viola, M. Jones Rapid Object Detection using a Boosted Cascade of Simple Features, 2001
  2. Линда Шапиро, Джордж Стокман, Компьютерное зрение, Бином. Лаборатория знаний, 2006 г. 752 стр.
  3. http://www.cs.tau.ac.il/~wolf/ytfaces/
  4. R Grosse, Micah K. Johnson, Edward H. Adelson William T. Freeman Ground truth dataset and baseline evaluations for intrinsic image algorithms, 2009
  5. Lotfi A. Zadeh, Fuzzy Logic, Neural Networks, and Soft Computing, 1994
  6. H. Bäcklund, A. Hedblom, N. Neijman A Density-Based Spatial Clus-tering of Application with Noise, 2011 
  7. http://opencv.org

Статья в PDF paper-2014.pdf

Комментарии

comments powered by Disqus