РОЗДІЛ 2
ВДОСКОНАЛЕННЯ ОДНОВИМІРНИХ МЕТОДІВ
ОБРОБКИ СТЕРЕОЗОБРАЖЕНЬ
Більшість алгоритмів обробки стереозображень оперують із так званими ідеальними стереопарами, на яких будь-яка точка тривимірної сцени спроектована в однакові рядки лівого та правого знімку. Якщо ж стереопара не є ідеальною, то під час ототожнення точок певного рядку лівого зображення з точками того ж рядку правого зображення, виникає ситуація, коли відповідні точки фактично відсутні. Ідеальні стереопари можна отримати у випадку, коли оптичні осі камер мають однакові напрямки, а лінія, що з'єднує оптичні центри камер перпендикулярна до цих осей. Домогтися точного юстування камер, за якого стереознімки будуть ідеальними, дуже складно. Навіть за допомогою методів калібровки (ректифікації), що перетворюють стереозображення на ідеальні стереопари [19-21], практично неможливо досягти абсолютно ідеальної калібровки, бо, як правило, завжди існуватимуть відповідні точки, що знаходитимуться в різних рядках. Це пов'язано з тим, що камери вносять у зображення спотворення та деформацію внаслідок недосконалості своїх апаратурних можливостей - оптики, ССD матриці, систем розгортки та ін. Отже, при обробці стереозображень необхідно бути готовим до випадку коли стереозображення складають стереопару, що незначним чином відрізняється від ідеальної. Одним із результатів дисертаційного дослідження, що наводиться в цьому розділі, є алгоритм, який відновлює просторову конфігурацію сцени за неідеальною стереопарою. Його суть полягає у застосуванні методів динамічного програмування для пошуку відповідностей між точками певного рядку лівого зображення та точками зі смуги рядків правого зображення.
Також в цьому розділі наводиться постановка та алгоритм розв'язку задачі стереореконструкції, як байєсівської задачі прийняття рішень [8, 41, 43]. Суть наведеного алгоритму складатиме наближений підрахунок маргінальних ймовірностей станів марківського випадкового поля. Ця задача є досить складною, і на сьогоднішній день відомі лише наближені методи її вирішення. Більшість з них ґрунтується на випадковому генеруванні розв'язків задачі, як наприклад, відомий метод "генератор Гіббса" [33]. На відміну від нього, запропонований алгоритм використовуватиме не методи генерування, а певний метод вирішення задач розмітки на прямокутному полі зору з малим вертикальним розміром. Значення наведеного байєсівського підходу до обробки стереозображень полягає в тому, що за його допомогою можна досліджувати такі задачі стереореконструкції, як пошук тривимірної моделі об'єкта, кількість правильно відновлених точок якої є максимальним, чи знаходження тривимірної моделі об'єкта, що має найменшу метричну відстань від дійсної конфігурації об'єкта. Буде показано, що ці постановки є більш виправданими, аніж пошук найімовірнішої моделі об'єкта.
2.1. Прийняті позначення
Існують дві камери (ліва та права), поле зору яких є множина . Вертикальний розмір поля зору , а горизонтальний - . Елементи поля зору камер називатимемо пікселями та позначати парою змінних , або ж однією змінною . Множину сусідів пікселя позначимо . В залежності від постановки задачі ("одновимірна" чи "двовимірна" обробка стереопари), сусідами пікселя будуть чи .
Зображенням називатимемо функцію, що ставить у відповідність кожному пікселю число - його яскравість. На знімках, що поступають з двох камер, міститься зображення деякої тривимірної сцени чи об'єкта. Значення сигналів в елементах поля зору камер позначимо та відповідно.
Пару пікселів та лівого та правого зображення будемо називати відповідною парою, якщо вони являються проекціями однієї і тої самої точки тривимірного простору на поле зору лівої і правої камери.
Ідеальною стереопарою будемо називати два таких зображення, де кожному пікселю в рядку лівого зображення відповідає піксель в такому самому рядку правого зображення . Тобто, відповідні один одному елементи ідеальної стереопари знаходяться лише в однакових рядках.
Паралаксом або ж станом пікселя лівого зображення будемо називати різницю , де та - координати відповідного йому пікселя на правому зображенні. Допустимі значення паралакса визначені множиною .
Розміткою називатимемо функцію , що ставить у відповідність кожному пікселю лівого зображення його паралакс (стан). Значення паралаксу в пікселі лівого зображення позначатимемо . Вважатимемо, що розмітка є випадковою реалізацією марківського поля. Ймовірність розмітки обчислюється за формулою . Значення функції прийнято називати потенціалами Гіббса, а функції - факторами Гіббса. Вони визначені для кожної пари сусідніх пікселів і , що мають паралакси та відповідно.
Вважається, що умовна ймовірність стереопари за умови відомої розмітки є добуток , де значення функції характеризують кожен стан кожного пікселя поля зору і обчислюються з точністю до певних констант як, наприклад, . В цьому випадку ймовірність підраховується за формулою
Рис. 2.1 ілюструє прийняті позначення. Поле зору складається із масиву 4х3 пікселі, що зображені як прямокутники. Кожен піксель може мати до чотирьох сусідів: двох вертикальних та двох горизонтальних. Множина паралаксів містить три елементи. Вони зображені як круглі фігури. Кожен з пікселів може знаходитись в одному з трьох станів. Ці стани характеризуються значеннями . Приклад розмітки, що визначає стан кожного пікселя, зображено а за допомогою червоного кольору. Фактори Гіббса, що визначають апріорну ймовірність розміток, є характеристикою ребер, які поєднують стани сусідніх пікселів. Ребра позначені синім кольором.
Рис. 2.1. Ілюстрація прийнятих позначень.
2.2. Фізична модель процесу побудови тривимірних моделей неперервних поверхонь за стереопарами зображень.
Розглянемо процес формування зображення точок тривимірного простору на проекційних площинах пари камер - лівої та правої (рис. 2.2). Вважатимемо, що ліва камера знаходиться в центрі системи координат, а права камера