2.7.2. МНОГОМЕРНАЯ НОРМАЛЬНАЯ ПЛОТНОСТЬ

Многомерная нормальная плотность распределения в общем виде представляется выражением

где х есть d-компонентный вектор-столбец, р. есть d-компонентный вектор среднего значения, 2 — ковариационная матрица размера dxd, (х—р)* — транспонированный вектор х—р, 2-1— матрица, обратная 2, а |2 | — детерминант матрицы 2. Для простоты выражение (23) часто записывается сокращенно в виде р (x)~N (jli, 2). Формально можно написать

и

где ожидаемое значение вектора или матрицы находится поэлементным вычислением математических ожиданий компонент. Выражаясь конкретнее, если xt есть i-я компонента х, |хг есть г-я компонента ц, a Ofj есть (/-/)-я компонента 2, то получаем

и

Ковариационная матрица 2 всегда симметрична и положительно полуопределена. Ограничимся рассмотрением случаев, когда 2 положительно определена, так что ее детерминант строго положителен г). Диагональный элемент оц есть дисперсия хь а недиагональный элемент оі} есть ковариация xt и х,. Если xt и Xj статистически независимы, то Ои=0. Если все недиагональные элементы равны нулю, то р(х) сводится к произведению одномерных нормальных плотностей компонент вектора х.

Нетрудно показать, что любая линейная комбинация нормально распределенных случайных величин также распределена нормально. В частности, если А есть матрица размера dxn, а у=Л'х есть я-компонентный вектор, то р(у)~Лг(Л fp, Лг2 Л). В частном случае, если А есть вектор единичной длины а, то величина у=Л*х является скаляром, представляющим проекцию вектора х на направление а. Таким образом, а*2а есть дисперсия проекции х на а. Вообще знание ковариационной матрицы дает возможность вычислить дисперсию вдоль любого направления.

Многомерная нормальная плотность распределения полностью определяется d+d(d-М)/2 параметрами — элементами вектора среднего значения р. и независимыми элементами ковариационной матрицы 2. Выборки нормально распределенной случайной величины имеют тенденцию попадать в одну область или кластер (рис. 2.7). Центр кластера определяется вектором среднего значения, а форма — ковариационной матрицей. Из соотношения (23) следует, что точки постоянной плотности образуют гиперэллипсоиды, для которых квадратичная форма (х—ц)*2_1(х—ц) постоянна. Главные оси этих гиперэллипсоидов задаются собственными векторами 2, причем длины осей определяются собственными значениями. Величину

иногда называют квадратичным махаланобисовым расстоянием от х до р. Линии постоянной плотности, таким образом, представляют собой гиперэллипсоиды постоянного махаланобисова расстояния до р. Объем этих гиперэллипсоидов служит мерой разброса выборок относительно среднего значения. Можно показать, что объем гиперэллипсоида, соответствующего махаланобисову расстоянию г, равен

где Vd есть объем d-мерной единичной гиперсферы, равный

Таким образом, при заданной размерности разброс выборок изменяется пропорционально величине |2|‘/«.