Распознавание образов. Часть 1 Введение

Введение

С развитием вычислительной техники стало возможным решать задачи, которые ранее считались невыполнимыми на персональных компьютерах. Создание устройств, выполняющих функции распознавания объектов в видеопотоке, в большинстве случаев позволит заменить человека – специализированным автоматом. Стоит заметить, что качество выполнения работы человеком зависит от многих факторов (квалификация, опыт, усталость, интерес). В то же время исправная и настроенная система будет работать, обеспечивая всегда одинаковое качество выполнения работы. Еще одним плюсом замещения человека машиной – несравнимое преимущество автоматических систем в быстродействии.

Области применения

области применения распознавания образов

В настоящее время ученые вкладывают гигантское количество денег в исследования для решения проблемы автоматического распознавания объектов в видеопотоке. Это стимулируется практическими требованиями, связанными с созданием систем военного и коммерческого назначения. 

В задаче распознавания объектов существует несколько серьезных проблем: 

Для достижения поставленной цели решены следующие этапы:

Основные понятия и определения

Задача распознавания объектов в кадре сводится к необходимости от-ветить на вопрос «Где на изображении (и есть ли) искомый объект?». Структурный выход предполагает ответ в виде ограничивающего прямо-угольника вокруг объекта. Задача осложняется сложными фонами на изоб-ражениях и достаточно большой внутриклассовой изменчивостью объектов. Например, существуют сотни видов обычного кресла.

Бинарное изображение (далее изображение) – это изображение, пик-селы которого имеют значения 0 или 1. Полутоновое изображение – это монохромное изображение I[r,c], у которого каждому пикселю соответству-ет одно значение интенсивности. Цифровое изображение – это двумерное изображение I[r,c], представленное в виде двумерного массива дискретных значений интенсивности, каждое из которых представлено с ограниченной точностью. 

Под образом будем понимать квалификационную группировку в си-стеме классификации, объединяющую группу объектов по некоторому при-знаку. Для составления человеком представления об образе ему необходи-мо посмотреть на несколько объектов определенного класса. Примерами образов могут быть: дома, лицо, машина, стул, символ.

Класс – множество объектов, у которых есть некоторые важные об-щие свойства. Классификация – процесс назначения меток объектам соглас-но некоторому описанию свойств объектов. Классификатор – устройство или алгоритм, получающий в качестве входных данных описание объекта и выдающий в качестве результата метку класса. Классификатор использует признаки, найденные среди исходных данных, для присвоения объекту мет-ки одного из m известных классов C1, C2,…,Cm.

Общая схема классификации показана на рисунке. Входными данными служит d-мерный вектор признаков x. В системе для каждого возможного класса имеется по одному блоку, в котором хранятся некоторые сведения K об этом классе и некоторые характеристики обработки. Результаты m вы-числительных операций передаются на последний этап классификации, где принимается решение о классе объекта.

Критерии оценки эффективности

Коэффициент ошибок системы классификации - одна из численных мер, позволяющих охарактеризовать, насколько хорошо система решает свою задачу. Другими характеристиками являются скорость работы (количество объектов, обрабатываемых за единицу времени) и доля верных определений классов объектов. Ошибка классификации происходит, когда классификатор относит входной объект к классу Ci, в то время как верный класс Cj, причем i≠j и Ci≠Cj.

Отдельно стоит отметить ложные срабатывания и ложные пропуски. Наиболее наглядно можно продемонстрировать на следующем примере. У человека обнаружено заболевание B или нет. Если система ошибочно говорит, что у человека есть заболевание B, то это называется позитивная ошибка. Если же система ошибочно говорит, что заболевания B у человека не обнаружено, то такая ошибка называется ложным пропуском или негативной ошибкой.

Введем определения решений классификаций:

Истинно положительные примеры (TP) – верно классифицированные примеры. Истинно отрицательные примеры (TN) – верно классифицированные отрицательные случаи. При пропуске классификатором присутствующего на изображении объекта возникает ошибка I рода – ложный пропуск (FN). Если классификатор определяет искомый объект на изображении, которого в действительности там нет, то возникает ошибка II рода – ложное обнаружение (FP).

Доля истинно положительных примеров (True Positives Rate):

Доля ложно положительных примеров (False Positives Rate):

Постановка задачи

Формально задачу распознавания шаблонов можно описать двумя устройствами: датчик и классификатор. Датчик преобразует физические характеристики объекта, подлежащего распознаванию в набор признаков x = (x1…xn), которые характеризуют данный объект.

Пусть X – множество описаний объектов. W=(w1…wM) – конечное множество номеров классов. Будем считать, что система распознавания допускает ошибку в том случае, если она относит к классу wi объект, на самом деле принадлежащий классу отличному от wi. Система распознавания R1 лучше системы R2, в том случае, если вероятность совершения ошибки для системы R1 меньше, чем для системы R2. Датчик выдает информацию в виде вектора x=(x1,x2,…xn), где n – число измеренных характеристик каждого физического объекта. Предполагается, что вектор измерений (признаков) x принадлежит одному из M классов образов w1…wM.

Решающая функция представляет собой функцию y(x), относящую x точно к одному из M заданных классов. Оптимальной считается функция которая дает наименьшую вероятность ошибки при всех допустимых значениях x.

Функция y относит набор x к классу wi в том и только в том случае, если выполняется неравенство

Общая схема распознавания

Общая схема системы распознавания образов

Комментарии

comments powered by Disqus