4.3.4. ДВА ПРИМЕРА

Интересно проследить, как метод парзеновского окна проявляется на простых примерах. Рассмотрим сначала случай, где р{х) является одномерной нормальной плотностью распределения с нулевым средним значением и дисперсией, равной единице. Пусть функция окна будет иметь тот же вид:

И наконец, пусть h^—hiYп, где — параметр, находящийся в нашем распоряжении. Таким образом, р„(х) есть среднее нормальных плотностей распределения, центрированных в выборках:

Нетрудно из соотношений (20) и (21) найти выражения среднего значения и дисперсии для р„(л:), но еще интереснее увидеть численные результаты. На рис. 4.1 показаны результаты, полученные при вычислении р„(л:)с помощью конкретно выбранного множества нормально распределенных случайных выборок. Эти результаты зависят от /г и . Для п= 1 функция (л:) будет просто единственным холмом гауссовского распределения с центром в первой выборке. Для /г=16 и hi=ll4 влияние отдельных выборок ясно различимо, а для Лх = 1 и /іі=4—нет. По мере увеличения п способность р„ отражать особенности р возрастает. При этом р„ оказывается более чувствительной к локальным нерегулярностям выборок, когда п велико, хотя мы уверены, что р„ будет сходиться к сглаженной нормальной кривой номере устремления п к бесконечности. Ясно, что нельзя судить по одному внешнему виду и что для получения точной оценки требуется много выборок.

В качестве другого примера пусть ф (ы) и Нц будут такими же, а неизвестная плотность распределения пусть будет смесью двух однородных плотностей

На рис. 4.2 показано поведение оценок этой плотности, полученных методом парзеновского окна.

Как и прежде, случай с п= 1 говорит больше ©функции окна, чем о неизвестной плотности распределения. Для п=16 ни одна из оценок не годится, а вот для п=256 и /іі=1 результаты уже кажутся приемлемыми.

Эти примеры показывают некоторые достоинства и некоторую ограниченность непараметрическйх методов. Достоинства заключаются в их общности. Одна и та же процедура Использовалась для унимодального нормального И бимодального смешанного случаев. При достаточном количестве выборок мы уверены в сходимости к сколь угодно сложной неизвестной плотности распределения. С другой стороны, может Потребоваться очень большое количество выборок, намного превышающее то количество, которое нам потребовалось бы, если бы мы знали вид неизвестной плотности распределения. Нет почти никаких способов уменьшения объема данных, поэтому потребности во времени вычисления и памяти слишком велики. Более того, потребность большего количества выборок растет экспоненциально с увеличением размерности пространства признаков. Этот недостаток непараметрических процедур, с&язанный с явлением, которое Веллман назвал «проклятием размерности», намного ограничивает их практическую применимость.