7.8.  БИБЛИОГРАФИЧЕСКИЕ И ИСТОРИЧЕСКИЕ СВЕДЕНИЯ

Можно указать очень немного работ общего характера по автоматическому анализу сцен. Единственная монография, посвященная специально этому вопросу, принадлежит Розенфельду (1969). Хорошие сборники работ были изданы Фишером и др. (1962), Тип- петом и др. (1965), Уром (1966), Кеналом (1968), Ченгом и др.

(1968), Колерсом и Иденом (1968), Граселли (1969), Ватанабе (1969), а также Липкином и Розенфельдом (1970). Другим полезным сбор

ником трудов является «Специальный выпуск по выделению и отбору признаков при распознавании образов» 1).

Мы не будем уделять большого внимания ни проблеме улучшения качества изображений для последующей интерпретации их человеком, ни проблеме кодирования изображений для их более эффективной передачи и хранения. Обзор по этим вопросам написан Хуангом и др. (1971); он снабжен большим списком литературы.

Большая часть тех идей, которые обсуждались в этой главе, была выдвинута на ранней стадии исследований, когда «анализ сцен» состоял почти исключительно из опознавания знаков. Далее мы ссылаемся на некоторые наиболее представительные источники этих идей, причем наши ссылки подбирались по принципу ясности и разносторонности изложения, а не по принципу приоритета.

Проблема представления изображений в ЭВМ состоит из двух частей: должны быть выбраны способы как амплитудной, так и пространственной дискретизации. Проблема амплитудного квантования для общего случая была решена путем обращения к физиологическим аналогиям. В работе Грегори (1966) содержится изложенный в доступной форме обзор по этому вопросу; более исчерпывающе эта проблема освещена Грэхемом и др. (1965). Работа Корнсвита

(1970)    содержит обширные сведения о системе зрительного восприятия человека. Проблема пространственного квантования решалась почти всегда путем дискретизации изображения с помощью сетки квадратных элементов. Ченг и Ледли (1968), а также Симон и Гюйо

(1971)    исследуют этот процесс аналитически, рассматривая его с точки зрения теории аппроксимации. (Другой аналитический подход — преобразование Фурье — будет обсуждаться в следующей главе.) Топологические преимущества гексагональной сетки в сравнении с квадратной сеткой рассматривались во многих работах, но немногие авторы действительно их использовали. Голэй (1969) предложил конструкцию вычислительного устройства параллельного действия, способного осуществлять ряд интересных операций над изображениями, представленными в виде массивов гексагональных элементов. Ингрэм и Престон (1970) впоследствии использовали его методы для обработки изображений кровяных телец.

Взаимно дополнительные операции пространственного дифференцирования и пространственного сглаживания появились в литературе по опознаванию знаков еще в работе Диннина (1955). Дойль

(I960)    применил логическое усреднение в тех же задачах. Градиентные операторы использовались на предварительных стадиях в обработке изображений трехмерных сцен Робертсом (1965) и Фор- сеном (1968). Кенал и Рендал (1964) применили аппроксимацию лапласиана функции интенсивности для подчеркивания перепадов полутонового уровня. Ярбус (1965) представил интересные психо

физические доказательства важности краев с помощью регистрации движений глаза при рассматривании изображения человеком.

Задача сравнения с эталоном возникает в.той или иной форме во многих работах, посвященных анализу зрительных сцен. Хайлиман

(1961)    использовал глобальные эталоны для распознавания «печатных» букв и цифр, написанных от руки. Мансон (1968) использовал локальные эталоны для той же цели. Кенал и Рендал (J964) применяли эталоны для обнаружения признаков объектов на аэрофотографиях. Робертс (1965) использовал локальные эталоны, чтобы обнаруживать короткие сегменты прямых линий. Гриффит (1971) взял вероятностную модель за основу при проектировании детектора линий. Розенфельд и Тэрстон (1971) использовали семейство эталонов для обнаружения переходов текстуры. Барни и Сильверман (1972) обсуждают семейство эффективных алгоритмов сравнения с эталоном. И наконец, классическая работа Хьюбеля и Визеля, итог которой был подведен Хьюбелем (1963), показала, что зрительный аппарат кошки при обнаружении сегментов прямых линий действительно выполняет действия, эквивалентные локальному сравнению с эталоном.

Разбиение сцены в процессе анализа областей — это уже более поздний метод по сравнению с другими обсуждавшимися в этой главе. Гузман (1968) анализировал идеальные контурные рисунки путем группировки областей, принадлежащих одному трехмерному объекту. Брайс и Феннема (1970) разработали методы выделения существенных областей прямо на дискретном изображении; разд. 7.5 (гл.7) в основном написан по материалу их работы. Хэрэ- лик и Келли (1969) использовали для разбиения изображения на области кластерный анализ. Можно упомянуть здесь, что характеристики текстуры изображений также были предложены в качестве средства для выделения областей. Гибсон. (1950) исследовал текстурные признаки, которые, используются человеком в особенности при оценке глубины. Бродац (1966) собрал интересный альбом с фотографиями текстур, представляющий своего рода вызов всем, кто собирается создавать алгоритмы для опознавания текстур.

Прослеживание контуров применялось как на непрерывных, так и на дискретных изображениях главным образом потому, что эту процедуру легко реализовать с помощью устройства сканирования с «бегущим лучом». Гриниас и др. (1963) использовали такое устройство для того, чтобы получить информацию о контуре непосредственно с изображений написанных от руки цифр. Мейсон и Клеменс (1968) использовали некоторым образом измененный вариант алгоритма прослеживания контуров, описанного выше, на дискретных изображениях знаков, напечатанных машинкой. Розенфельд (1970) обсуждал более сложный алгоритм прослеживания контуров и доказал, что этот алгоритм работает правильно, приведя предварительно доказательства некоторых теорем о связности в

дискретных изображениях. Ледли (1964) использовал операцию прослеживания контуров в анализе дискретных изображений хромосом. Остроумная комбинация алгоритмов прослеживания контуров и сглаживания была разработана Цанем (1969), в то время как Пингл (1969) построил оператор, объединяющий алгоритм прослеживания контуров с алгоритмом обнаружения края. Келли (1971) сообщил о новом «планирующем алгоритме прослеживания», который сначала получает грубую аппроксимацию контура на копии того же изображения с пониженной разрешающей способностью.