9.3.4.2. Локальные экстремумы границы объекта

В предыдущем пункте мы обсуждали способ описания кривой через ее точки высокой кривизны. Довод здесь заключался в том, что информативными следует считать такие точки, в которых имеют место какие-либо резкие изменения. Подобным же образом мы можем описать границу объекта с помощью точек, в которых она достигает локального экстремума по оси X или Y. На рис. 9.17, например, точки 1, 2, 3 и 5 представляют собой попеременно локальные минимумы и максимумы в направлении оси X, а точки 4 и б — максимум и минимум (единственные) в направлении оси У. Как видно из рисунка, эти точки находятся вблизи точек границы с высокой кривизной, что бывает часто, хотя и не всегда.

Если должно использоваться описание объекта через экстремальные точки, необходимо, очевидно, сгладить малые флуктуации границы объекта. Один из способов выполнить эту операцию заключается в регуляризации объекта посредством скользящего среднего, но при этом неизбежно возникает существенная потеря разрешающей способности. Более мощный метод называется гистерезисным сглаживанием. Гистерезисное сглаживание на самом деле представляет собой нелинейную процедуру для отыскания «существенных» экстремумов вещественной функции; для целей описания объекта она просто применяется отдельно к координатам X и У точек границы. Имея это в виду, проиллюстрируем ее действие на примере функции одной переменной.

Предположим, как показано на рис. 9.18, нам дана функция ^(д:), существенный экстремум которой мы ищем. Вообразим, что вертикальный проволочный прямоугольник перемещается вдоль кривой посредством указателя, который точно отслеживает функцию g. Считается, что проволочный прямоугольник обладает следующим свойством: не перемещается вверх до тех пор, пока его не потянет вверх указатель, и, наоборот, не перемещается вниз до тех пор, пока его не потянут вниз. Другими словами, прямоугольник просто тянут в сторону вдоль кривой, не изменяя его вертикального положения. В точке А объекта указатель при его движении вдоль кривой тянет прямоугольник вверх. В точке В указатель только что прошел малый локальный максимум, а прямоугольник просто перемещается в сторону на одной и той же высоте, поскольку его не тя-

нут ни вверх, ни вниз. В точке С был достигнут другой локальный максимум (то, что здесь имеет место также и глобальный максимум, сейчас несущественно). В точке D прямоугольник перемещался в сторону, не двигаясь ни вверх, ни вниз, а в точке Е указатель начал тянуть прямоугольник вниз. Функция g(x), вычерченная центром проволочного прямоугольника при его движении за указателем, представляет собой гистерезисно сглаженный вариант функции g(x). Высота прямоугольника h называется зазором гистерезиса

и играет роль независимого параметра, аналогичного ширине окна в процедуре получения скользящего среднего. Локальный экстремум сглаженной функции определяет существенный локальный экстремум исходной функции. В типичном случае, как показано на рис. 9.18, сглаженная функция достигает локального экстремума не в единственной точке*). Когда это имеет место, разумно в качестве экстремальной выбрать точку с наименьшей координатой X — в данном случае точку С. (Заметим, что область функции g{x) вблизи точки В является «областью перегиба», а не экстремума.)

Было бы поучительным сравнить общие характеристики гисте- резисного сглаживания с регуляризацией, поскольку это два основных метода, конкурирующих в решении текущей задачи отыскания экстремума функций. Основная трудность при использовании регуляризации как метода отыскания экстремума заключается в том, что, если мы хотим сглаживать малые флуктуации полностью, то должны применять относительно широкое усредняющее окно; такое окно, видимо, может также смазать и существенный экстремум.

Пример такого случая показан на рис. 9.19, где мы изобразили функцию ^(л:), имеющую два заметных пика и несколько малых шумовых выбросов. Мы регуляризировали^(;с), чтобы получить функцию gw(x), применяя в процессе усреднения’окно ширины, достаточной, чтобы полностью подавить шумовые выбросы. К сожалению, нам удалось при этом ликвидировать также всякий намек на то, что функция g(x) имеет два заметных пика. Конечно, можно использовать более узкое усредняющее окно. Тогда функция gw(x) сохранит

какие-то признаки двугорбости, но она будет содержать также некоторый шум. Мы были бы поэтому вынуждены искать-некоторое правило, позволяющее решать, какие из ее локальных экстремумов существенны. Скорее всего, мы выбрали бы правило, очень похожее на гистерезисное сглаживание; следовательно, можно с таким же успехом решить использовать только гистерезисное сглаживание и исключить предварительное усреднение.

Возвращаясь к первоначальной теме — описанию объекта через экстремумы его границы,— мы приведем несколько примеров, чтобы дать читателю возможность почувствовать «вкус» этого метода. Читатель может сам убедиться, что знак плюс и круг имеют идентичные описания в терминах экстремумов, хотя их дефициты выпуклости совершенно различны. С другой стороны, знак плюс в обычной ориентации и знак плюс, повернутый на 45°, имеют совершенно различные описания экстремумов. Если знак плюс повернут на 45°,

описание через экстремумы близко совпадает с описанием через точки высокой кривизны. Это не так в случае, когда знак плюс имеет свою обычную ориентацию. Ясно, что в общем случае на описание через экстремумы влияет ориентация объекта относительно координатных осей.