7.2.  ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ

Предположим, что у нас имеется обыкновенный фотографический диапозитив и мы хотим проанализировать его с помощью цифровой вычислительной машины. Одной из первых задач является, очевидно, выбор способа представления изображения, пригодного для машины. Существует много вариантов такого выбора, но мы можем упорядочить их, обратив внимание на то, что черно-белое изображение можно рассматривать как вещественную функцию двух переменных. Для определенности предположим, что изображение лежит в плоскости, снабженной координатными осями х и у. Определим функцию интенсивности g(x,y) как величину, пропорциональную интенсивности света, падающего на изображение в точке (х, у)2),3). Интенсивность

1)   В оригинале picture function.— Прим. ред.

2)   Не следует смешивать применяемое здесь обозначение g(x, у) с разделяющими функциями, описанными в ч. I.

8) Подразумевается изображение при проектировании слайда.— Прим. ред.

изображения в некоторой точке называется также уровнем полутонов или яркостью. Во всяком случае, с математической точки зрения изображение определяется путем задания его функции интенсивности.

Теперь, поскольку мы условились рассматривать изображения как функции, очевидно, что любые средства для представления функции в цифровой вычислительной машине могут быть использованы и для представления изображения. Некоторые методы можно отвергнуть сразу же как неподходящие для решаемой задачи. Многочлены, например, обычно задают в памяти машины набором их коэффициентов, но немногие интересующие нас функции интенсивности представляют собой просто многочлены невысокой степени. И вообще, поскольку функция интенсивности, представляющая интерес, редко имеет простую аналитическую форму, ее задают обычно путем измерения ее значений в достаточно большом числе дискретных точек в плоскости (X, Y) и запоминания величин этих отсчетов. Этот процесс называется взятием отсчетов или квантованием. Для того чтобы задать алгоритм квантования, мы должны сначала установить, где нужно брать отсчеты. Самым простым решением является разбиение плоскости изображения с помощью сетки на квадратные клетки и взятие отсчета функции интенсивности в центре каждой клетки. Далее, функция интенсивности, вообще говоря, может принимать любые значения между некоторым минимумом (черное) и максимумом (белое), в то время как в цифровой вычислительной машине можно задавать только конечное число значений. Поэтому мы должны также разбить диапазон амплитуд функции интенсивности на ограниченное число градаций. Сделав это, мы зададим некоторый алгоритм представления исходной функции интенсивности массивом целых чисел, где каждый элемент массива приблизительно определяет уровень полутонов соответствующей клетки изображения.

Рассмотрим несколько более подробно проблему разбиения полутоновой шкалы на ряд дискретных градаций. Простейший способ выполнить эту задачу состоит в разбиении диапазона изменения интенсивностей изображения от черного к белому на одинаковые интервалы. Если мы выберем этот вариант, мы должны только определить число градаций, или, другими словами, степень подробности разбиения. К сожалению, по этому вопросу не существует теоретического обоснования, и поэтому обычно приходится идти на некоторый компромисс между желанием точно задать изображение и необходимостью сохранять объем данных для вычислений в разумных пределах. Не обязательно, однако, выбирать ступени квантования одинаковыми. Пусть, например, у нас есть основания полагать, что большинство деталей в изображении приходится на темные области. Тогда, если число градаций не должно превосходить некоторого заданного значения, имело бы смысл, конечно,

квантовать неравномерно. Мы бы тогда разбили «темные» области полутоновой шкалы на сравнительно мелкие ступени, а «светлые» области — на сравнительно крупные. Если же у нас нет специальных предварительных знаний об изображении, можно руководствоваться сведениями об устройстве зрительной системы человека, реакция которой на освещенность приблизительно-описывается логарифмической характеристикой. Другими словами, логарифмические 1) изменения физической интенсивности зрительного стимула воспринимаются человеком как «в равной степени заметные на глаз» изменения. Этот феномен (который, по-видимому, имеет место и для слухового и тактильного стимулов) подсказывает, что следует взять сначала логарифм от функции интенсивности и квантовать затем равномерно величину log g(x, у).

Перейдем теперь к вопросу о шаге сетки отсчетов. Эта проблема аналогична проблеме квантования полутоновой шкалы, но здесь мы располагаем некоторым теоретическим руководством jb виде известной теоремы отсчетов Шеннона 2). Для обсуждения этой теоремы требуются некоторые сведения о двумерных преобразованиях Фурье, поэтому мы отложим этот вопрос до следующей главы. Можно лишь отметить, что плоскость изображения может быть разбита не только с помощью сетки из квадратных элементов. В такой сетке два элемента, имеющие, общий угол, не всегда имеют общую сторону. Эта особенность при осуществлении ряда операций по обработке изображения, которые будут рассматриваться позднее, вызывает определенные неудобства. Для устранения этих неудобств иногда предлагают разбивать плоскость изображения на шестиугольники, но во многих случаях достигнутое преимущество не оправдывает связанных с таким вариантом дополнительных усложнений. В дальнейшем всюду, где это удобно, мы будем полагать, что изображение может быть представлено обычной матрицей, вещественные элементы которой определяют (приближенно) значения функции интенсивности в соответствующей области плоскости изображения. В тех случаях, когда нет опасности различного толкования, мы будем обозначать элемент і-й строки /-го столбца этой матрицы через g(i, /) и тогда будем говорить о g как о дискретной функции интенсивности. Неквантованная функция интенсивности g(x, у) будет называться аналоговой функцией интенсивности. Для удобства мы условимся также, что малые и большие значения квантованной функции интенсивности изображают соответственно темные и светлые уровни этой величины.

В качестве примера, иллюстрирующего изложенное выше, рассмотрим рис. 7.1 и 7.2. На рис. 7.1 показана трехмерная сцена, содержащая объекты простой геометрической формы. Изображение

было взято прямо с обычного телевизионного монитора, но для наших непосредственных целей безразлично, имеем ли мы дело с телевизионными изображениями, фотографическими диапозитивами или любыми другими видами изображений. На рис. 7.2 показан квантованный вариант изображения рис. 7.1. Мы использовали квадратную сетку отсчетов со 120 элементами по каждой стороне и прокван- тобали полутоновую шкалу на 16 равномерно расположенных уровней. Само по себе квантованное изображение представляет собой, кшечно, некоторую матрицу, но мы вывели на экран этот массив чисел в виде «картинки», т. ё. как совокупность дискретных точек.

Каждая точка в изображенном массиве имеет один из 16 полутоновых уровней, и номер этого уровня определяется соответствующим числом Б матрице. Можно было бы заметить здесь, что задний край клина едва отличим в квантованном изображении от стены позади этого клина. Действительно, между этими областями существует разность интенсйвности в один уровень квантования. К сожалению, на середине пола и стены имеется много перепадов интенсивности в один уровень квантования, вызванных тенями на исходном изображении. Следовательно, в упрощенном изображении окружающего мира разность в один полутоновый уровень квантования может считаться «незначительной». Мы не будем подробно останавливаться сейчас на этом вопросе, но можем сказать заранее, что задача определения, какие полутоновые перепады «значительные», является важной проблемой, которая, по-видимому, в общем случае не допускает быстрых и легких решений.