РАЗДЕЛ 2 ОБОСНОВАНИЕ НАПРАВЛЕНИЙ ИССЛЕДОВАНИЙ И МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ ПОСТРОЕНИЯ СИСТЕМЫ ИДЕНТИФИКАЦИИ
В данном разделе будет дано описание объекта и обоснование выбранных направлений исследований, предложена методология объединения выделенных в ходе анализа литературы методов обнаружения и распознавания человека по изображению лица в единый комплекс.
2.1. Объект исследования
Условия применения систем идентификации, основанных на анализе изображения лица человека, достаточно разнообразны. Это могут быть снимки, полученные в лабораторных условиях при однородном и постоянном освещении, или изображения, получаемые в среде с неоднородным и изменяющимся освещением. От системы идентификации может требоваться обработка статических фотографий одного лица, сделанных в контролируемом окружении, или наблюдение в реальном времени за видеоизображением, содержащим неизвестное количество лиц на совершенно произвольном фоне. Таким образом, класс изображений, содержащих лица, достаточно широкий, и построение системы автоматической идентификации может быть чрезвычайно затруднено вследствие разнообразия представлений образа лица одного и того же человека. Поэтому, прежде всего, необходимо выделить ряд ограничений, накладываемых как на свойства изображений поступающих на обработку, так и на параметры лиц, которые на нем присутствуют.
Как правило, изображения на выходе используемых в настоящее время устройств получения цифровых изображений (видеокамеры, цифровые фотоаппараты) являются цветными. Различие настроек цветности в аппаратуре ввода изображений существенно усложняет задачу анализа таких данных. Поэтому удобно предварительно перейти к черно-белым (полутоновым) изображениям, когда каждый пиксель характеризуется одним значением яркости. Обычно такое преобразование заключается в суммировании интенсивностей каждого цвета из RGB тройки (в случае других кодировок цветных изображений используются похожие методы) с определенными весовыми коэффициентами, такими, что их сумма равна 1. В настоящей работе все исследуемые алгоритмы и методы работают с полутоновыми изображениями, имеющими 256 градаций яркости (0...255).
Используемые для анализа изображения могут быть как статические, так и принадлежать видеопоследовательности. В последнем случае каждый кадр обрабатывается отдельно от предыдущего и последующего, т.е. при анализе не используются связи между последовательными кадрами.
Размеры области лица определяются межзрачковым расстоянием в пикселях. На размеры входных изображений и масштабы изображений лиц ограничения не накладываются. Однако необходимый рабочий диапазон масштабов должен быть задан для построения пирамиды изображений, на каждом уровне которой, будет осуществляться поиск области лица. Более подробно вопрос построения пирамиды изображений будет рассмотрен в пункте 2.3.2.
Для успешного анализа изображения лица необходимо, чтобы оно полностью попадало в кадр, и не было закрыто никакими предметами. Изображение лица должно быть фронтальным без каких-либо мимических искажений (нейтральное состояние), ось симметрии лица должна быть вертикальной.
На окружающий фон дополнительных ограничений не накладывается. Изображение может быть получено обычной видеокамерой в произвольной обстановке.
Описанное подмножество множества изображений, содержащих лица, в сочетании с корреляционными методами автоматического обнаружения и распознавания представляют собой объект исследования диссертационной работы. Под распознаванием в данном случае понимается отнесение изображения к одному из нескольких взаимоисключающих классов, соответствующих изображениям лиц разных людей, или принятие решения о том, что оно не принадлежит ни одному из известных классов. В такой постановке распознавание эквивалентно идентификации. Обнаружением (или поиском) области лица на изображении будем считать определение наличия, положения и масштаба лица. Соответственно методы решающие такую задачу будем называть методами обнаружения (поиска) лица на изображении.
2.2. Обоснование направлений исследований
Большинство алгоритмов и методов, так или иначе связанных с обработкой изображений лиц, предполагают, что положение лица в кадре известно или же оно легко выделяется на окружающем фоне. Однако, во многих случаях это далеко не так. Кроме того, методы идентификации предполагают более точный анализ изображения лица, поэтому время работы таких методов значительно больше, чем требуется при обнаружении лица, как правило, занимающего небольшую часть всего изображения. Поэтому проблема обнаружения и локализации лица на изображении является весьма актуальной и имеет самостоятельное значение.
Таким образом, задачу автоматической идентификации человека по изображению лица можно разделить на две самостоятельные подзадачи, представляющие собой два последовательных этапа обработки входных данных:
1) локализация области лица на изображении;
2) распознавание.
Общая схема двухуровневой системы автоматической идентификации человека по изображению лица представлена на рис.2.1.
Рис.2.1. Общая схема системы идентификации
На схеме пунктиром выделен блок распознавания, включающий: методы извлечения признаков лица, методы сопоставления с базой данных, базу данных и методы ее пополнения. Шестиугольниками выделены данные или информация, прямоугольниками - виды ее обработки, стрелками показаны направления передачи данных.
На результат распознавания, а в итоге и на качество работы системы идентификации, влияет большое количество как внешних факторов (яркость, контрастность входных изображений; направление освещения лица; масштаб лица и т.д.), так и внутренних параметров системы (точность обнаружения лица, точность определения масштаба лица, точность при извлечении признаков лица). Поэтому на каждом этапе очень важно разработать методы, устойчивые как к внешним ошибкам, так и к внутренним, возн
- Київ+380960830922