4.9.3. РАЗЛОЖЕНИЕ ЧОУ

Другой интересный класс аппроксимаций совместного распр>е- деления вероятностей Р(х) основан на тождестве

Если переменные статистически независимы, оно сводится к произведению отдельных вероятностей Р(хі). Предположим, что переменные не являются независимыми, но что Р(х,-1х,-1, . . Хі) зависит только от непосредственно предшествующей переменной Хі-1. Тогда имеем марковскую цепь первого порядка и

Мы увидим, что каждый сомножитель Р (хі \Хі--^ можно определить с помощью двух коэ(^ициентов; значит, Р (х) можно определить с помощью 2d—1 коэффициентов, что будет менее сложно, чем если

бы мы допустили все^ g ) корреляций второго порядка. Аналогичные марковские аппроксимации более высокого порядка можно по-

лучйть, если допустить, что Хі зависит только от k непосредственно предшествующих переменных.

Допущение, что заданная переменная Хі зависит только от определенных предшествующих переменных, приемлемо, если мы имеем Дело с временным процессом; для более общих случаев это допу- щеяйіе выглядит довольно нелепо. Тем не менее есть основание полагать, что заданная переменная Хі может в основном зависеть только от нескольких других переменных. Предположим, что мы можем занумеровать переменные так, что Р{хі\хі-і     Хі) целиком зависит от некоторой предшествующей переменной xj^.

Например, допустим, что

Тогда из (59) следует, что Р{хі, Хі, х^, х^ можно записать как Р {хі) Р {хі]хі) Р {xg]xi) Р (Хі\Хі). Вообще мы получаем разложение S виде произведения

Подставляя О или 1 вместо Хі и Xj^i^, читатель может проверить, что

где

и

Полагая ^i=P(jCi=l), подставляя (62) в соотношение (61), беря логарифм и собирая члены, получаем разложение Чоу

Аналогичные результаты легко можно получить для зависимости более высокого порядка.

Следует сделать несколько замечаний относительно этих результатов. Во-первых, если переменные действительно независимы, мы замечаем, что pi~qi и последние две суммы в разложении исчезают, оставляя уже знакомые разложения для случая с независимыми перемшінымй. Когда зависимость имеется, мы получаем дополнительные линейные и квадратичные члены. Конечно, линейные члены можно объединить так, чтобы в разложении содержались константа, d линейных членов и d—l квадратичных членов.

Сравнивая это разложение с разложением второго порядка Радемахера — Уолша или Бахадура — Лазерсфельда, для каждого из которых требуется d{d—1)/2 квадратичных членов, видим, что преимущества данного разложения могут быть значительными. Конечно, эти преимущества можно реализовать только в том случае, если мы знаем дерево зависимости — функцию / (і), которая показывает ограниченную зависимость одной переменной от предыдущих переменных. Если дерево зависимости нельзя вывести из физической значимости переменных, то может возникнуть необходимость в вычислении всех коэффициентов корреляции просто для того, чтобы найти значимые. Однако следует заметить, что даже в этом случае может быть предпочтительнее использовать разложение Чоу, так как получаемые при этом приближенные вероятности будут всегда неотрицательными и их сумма будет равна единице.