9.3.3. МЕТРИЧЕСКИЕ СВОЙСТВА

Остаток этой главы мы посвятим свойствам объектов, которые связаны в конечном счете с понятием метрики. Смысл этого термина заключается в обобщении понятия евклидова расстояния, и поэтому метрические свойства будут в общем изменяться, если плоскость изображения подвергать каким-либо деформациям. В таком случае, следовательно, мы можем ожидать, что метрические свойства будут чаще приводить к более информативным описаниям объекта, чем топологические, которые обсуждались ранее.

Мы начнем с повторения формального определения метрики, данного в гл. 6. Метрикой d называется вещественная функция двух точек плоскости изображения, которая для любых точек этой плоскости X, у я Z обладает следующими свойствами;

i)   d(x, 1/)>0, причем d(x, у)=0 тогда и только тогда, когда х=у (положительность);

ii)  d(x, y)=d{y, х) (симметрия);

iii) d(x, y)+d(y, z)^d(x, z) (неравенство треугольника). Самой обычной метрикой является, конечно, евклидово расстояние. Пусть точками будут х=(хі, Хг) и у=іуи Уі)\ нетрудно убедиться, что функция

удовлетворяет условиям і — ііі. Двумя другими метриками, полезными в анализе сцен, являются метрика абсолютного значения

и метрика максимального значения

Читатели, знакомые с функциональным анализом, узнают в величине d^ метрику, основанную на норме L^, а в величине dj^ метрику, основанную на норме L“. Один из способов уяснить себе смысл этих определений заключается в том, чтобы построить для каждой метрики геометрическое место точек на плоскости изображения, удаленных на единичное расстояние от начала координат. Эти геометрические Места вычерчены на рис. 9.14. Метрику иногда называют «метрикой городских кварталов» (хотя геометрическое место имеет форму бриллианта) из-за того, что расстояния измеряются параллельно осям координат. Покажем в качестве упражнения, что функция d^ действительно удовлетворяет условиям 1 — ііі. Сразу же видно, что функция dji положительна и симметрична. Чтобы проверить неравенство треугольника, напишем

Но

согласно неравенству треугольника для вещественных чисел, и то же самое имеет место для вторых компонент; поэтому

и условие ііі удовлетворяется. Прежде чем покончить с формальными определениями, мы хотели бы обратить внимание на несколько привлекательных с виду функций, которые не являются метриками. Функция не является метрикой, поскольку, как можно устано-

вить, при х={\, 0), г/=(2, 0) и г=(3, 0) неравенство треугольника нарушается. Когда мы имеем дело с квантованными изображениями, появляются некоторые дополнительные тонкости. Точки изображения будут иметь целые координаты, но если мы вычисляем, например, евклидово расстояние между парой точек изображения, результат в общем случае не будет целым. Если мы непременно хотим иметь целые расстояния, у нас может появиться соблазн округлять истинное евклидово расстояние. Для этой функции округленного евклидова расстояния неравенство треугольника, к сожалению, нарушается, что можно видеть, взяв x=(0, 0), у=(\, 1) и г=(2, 2) и получив при этом й{х, у)=\, d(y, z)=l и d(x, г)=3. В качестве альтернативы мы можем попытаться уменьшать евклидово расстояние до ближайшего целого вместо того, чтобы округлять его, но это также нарушит неравенство треугольника, в чем можно убеди'^ься, взяв л:=(0, 0), у—{1, 1) и г=(3, 4). На практике эти трудности часто обходят, либо просто пренебрегая ими, либо используя более простую в вычислительном отношении метрику абсо-

лютного значения, которая всегда дает целые расстояния, если точки имеют целые координаты.

Выполнив эти предварительные формальности, перечислим теперь некоторые наиболее очевидные метрические свойства, которые могут использоваться при опознавании формы. К простейшим метрическим свойствам объекта относятся площадь и периметр. Их легко вычислить для дискретных объектов, и они часто используются либо как составные части более сложных описаний, либо как параметры начальной сортировки, позволяющие определить, который из нескольких объектов в сцене должен обрабатываться первым. Совместно их используют, чтобы вычислить отношение толщины Т, которое для объекта с площадью А и периметром Р определяется формулой

Знаменитая теорема, известная еще в древности, гласит, что максимальное значение Т равно единице и достигается в том случае, если объект, форма которого исследуется, представляет собой круг. Аналогично из всех треугольников равносторон^іий треугольник имеет максимальное значение Т (для него Т=я]/3/9), а из всех четырехугольников максимальное значение Т имеет квадрат (для него 7"=л/4). В более общем случае отношение толщины правильного л-угольника равно

и эта величина монотонно стремится к единице при возрастании числа сторон. Грубо говоря, чем толще объект, тем больше связанное с ним отношение толщины; напротив, объекты, похожие на линию, будут иметь отношение толщины, близкое к нулю. Более того, отношение толщины безразмерно и, следовательно, зависит только от формы (но не от масштаба) объекта.

Второе свойство, которое можно использовать для измерения удлиненности объектов, называется отношением аспекта. Отношение аспекта прямоугольника есть отношение его длины к ширине, поэтому отношение аспекта, близкое к единице, соответствует «толстому» прямоугольнику. Для того чтобы распространить это понятие на произвольные объекты, заключим объект в некоторый прямоугольник и отношением аспекта для него будем называть отношение аспекта описанного прямоугольника. Возможны несколько различных определений, соответствующих различным способам построения прямоугольника вокруг объекта. Простейшее определение предполагает, что стороны прямоугольника параллельны координатным осям плоскости изображения. Однако, как показано на рис. 9.15, расположение координатной системы иногда может случайно привести к ситуации, при которой очень тонкий объект имеет отношение

 

аспекта, близкое к единице. Более сложное определение предполагает, что стороны прямоугольника параллельны собственным векторам матрицы рассеяния точек объекта. Как мы видели в случае подбора линий, линия, параллельная главному собственному вектору, сама по себе является хорошей аппроксимацией точек объекта, если объект похож на линию. Для произвольного объекта собственные векторы физически соответствуют направлениям, относительно которых объект имеет максимальный и минимальный моменты инерции; таким образом, они хорошо согласуются с нашим интуитивным представлением о направлениях, по которым объект толстый и тонкий. Более того, сами собственные значения представляют собой два момента инерции относительно этих осей; поэтому, согласно третьему альтернативному определению, отношение аспекта есть отношение собственных значений матрицы рассеяния. На практике вычисления, которые требуются в связи с этим усовершенствованным определением, должны компенсироваться количеством получаемой информации.