6.4.4. ПРОСТАЯ ПРИБЛИЖЕННАЯ ПРОЦЕДУРА

Из различных способов, которые используются для упрощения вычисления и ускорения сходимости, мы кратко рассмотрим один элементарный приближенный метод. Из соотношения (17) ясно, что вероятность P((Oj jXft, 0^) велика, когда квадрат махалонобисова расстояния (Xft—|Li;)' 2~‘(х^—ц;) мал. Предположим, что мы просто вычисляем квадрат евклидова расстояния Цх^—и находим среднее |и„, ближайшее к х^, и аппроксимируем Р (cojlxft, 0^) как

Тогда итеративное применение формулы (15) приводит к следующей процедуре ^) нахождения Ці, . .

Процедура-. Базовые Изоданные

1. Выбираем некоторые начальные значения для средних • • •» Цс"

Цикл: 2. Классифицируем п выборок, разбивая их на классы по ближайшим средним.

3.   Вновь вычисляем средние как средние значения выборок в своем классе.

4.   Если какое-нибудь среднее изменило значение, переходим к Циклу; иначе останов.

Это типичные для некоторого класса процедуры, известные как процедуры группировки (кластер-процедуры). Позже мы поместим ее в класс итерационных оптимизационных процедур, поскольку средние имеют тенденцию изменяться так, чтобы минимизировать функцию критерия квадратичной ошибки. В настоящий момент мы рассматриваем это просто как приближенный способ получения оценки по максимуму правдоподобия для средних. Полученные значения можно принять за ответ или использовать как начальные точки для более точных вычислений.

Интересно посмотреть, как эта процедура ведет себя на примере данных из табл. 6.1. Рис. 6.4 показывает последовательность значений для |іі и |І2, полученных для нескольких различных начальных точек. Так как взаимная замена и просто взаимозаменяет метки, присвоенные данным, траектория симметрична относительно линии    Траектория приводит или к точке   2,176,

1,684, или к ее отображению. Это близко к решению, найденному методом максимума правдоподобия (|Іі=—2,130 и |Ij= 1,668), и траектории в общем сходны с траекториями, показанными на рис. 6.3. В общем случае, когда пересечение между плотностями компонент мало, можно ожидать, что метод максимального правдоподобия и процедура Изоданные дадут похожие результаты.