4.6.3. УРОВЕНЬ ОШИБКИ ДЛЯ ПРАВИЛА БЛИЖАЙШЕГО СОСЕДА

Обратимся теперь к вычислению условной вероятности ошибки Р„(е\х, х'п). Чтобы избежать недоразумений, необходимо поставить задачу более тщательно, чем это делалось до сих пор. Когда мы говорим, что у нас имеется п независимо сделанных помеченных выборок, то мы имеем в виду п пар случайных переменных (хі, Ѳі), (xj, Ѳа), . . ., (х„, Ѳ„), где Ѳ; может быть любым из с состояний природы Ml, . . . Мы полагаем, что эти пары получались путем выбора состояния природы coj для Ѳі с вероятностью P{a)j), а затем путем выбора Хі в соответствии с вероятностным законом р(х| Wj), причем каждая пара выбирается независимо. Положим теперь, что природа выбирает пару (х, Ѳ) и что х'„, помеченное Ѳ', есть ближайшая к х выборка. Поскольку состояние природы при выборе х^ не зависит от состояния при выборе х, то

Теперь, если применяется решающее правило ближайшего соседа, мы совершаем ошибку всякий раз, когда Ѳ=?^Ѳ'. Таким образом, условная вероятность ошибки (е [ х, х'п) задается в виде

Чтобы получить Рп (е), надо подставить это выражение в (29) вместо Р„(е|х), а затем усреднить результат по х. Вообще это очень трудно сделать, но, как мы уже замечали ранее, интегрирование в (29) становится тривиальным по мере устремления п к бесконечности, а р (х^ 1 х) к дельта-функции. Если Р (со; | х) непрерывна в х, получаем

Так что асимптотический уровень ошибки правила ближайшего соседа, если можно поменять местами интегрирование и переход

к пределу 1), задается выражением