4.8. АППРОКСИМАЦИИ ПУТЕМ РАЗЛОЖЕНИЯ В РЯД

Все описанные до сих пор непараметрические методы имеют тот недостаток, что требуют хранения в памяти всех выборок. А так как для получения хороших оценок необходимо большое количество выборок, потребность в памяти может быть слишком велика.

Кроме того, может потребоваться значительное время вычисления каждый раз, когда один из этих методов используется для оценки величины р(х) или классификации нового х. При определенных обстоятельствах процедуру окна Парзена можно несколько видоизменить, чтобы значительно сократить эти требования. Основная идея заключается в аппроксимации функции окна путем разложения ее в конечный ряд, что делается с приемлемой точностью в представляющей интерес области. Если нам сопутствует удача и мы можем найти два множества функций %(х) и хЛ*). которые допускают разложение

тогда

и из уравнения (8) имеем

где

Этот подход имеет некоторые очевидные преимущества в том сл> - чае, когда можно получить достаточно точное разложение с приемлемым значением т. Информация, содержащаяся в п выборках, сводится к т коэффициентам Если получают дополнительные выборки, соотношение (39) для Ь) можно легко обновить, причем количество коэффициентов остается неизменным’).

Если функции ypj и Xj являются полиномами от компонент х и х,, то выражение для оценки /?„ (х) есть также полином, который можно довольно эффективно вычислить. Более того, использование этой оценки для получения разделяющих функций р(х|{о,) Р(оЗг) приводит к простому способу получения полиномиальных разделяющих функций.

Тут все же следует отметить одну из проблем, возникающую при применении этого способа. Основным достоинством функции окна является ее тенденция к возрастанию в начале координат и снижению в других точках. Так что Ф ((х—хО//іп) будет иметь резкий максимум при х=хі и мало влиять на аппроксимацию рп(х) для х, удаленного от Хг. К сожалению, полиномы обладают досадным свойством, заключаюшнмся в том, что они могут содержать неограннчен- HOf количество членов. Поэтому при разложении полинома могут обнаружиться члены, ассоциируемые с х<, удаленным от х, но сильно, а не слабо влияющим на разложение. Следовательно, мжно убедиться, что разложение каждой функции окна действительно точное в представляющей интерес области, а для этого может потребоваться бел!>ціое число членов.

Существует много видов разложения в ряд. Читатели, знакомые с интегральными уравнениями, вполне естественно интерпретируют соотношение (37) как разложение ядра ф (х, х*) в ряды по собственным функциям. Вместо вычисления собственных функций МОЖНО выбрать любое приемлемое множество функций, ортогональных в интересующей нас области, и получить согласие по методу наименьших квадратов с функцией окна. Мы применим еще более непосредственный подход и разложим функцию окна в ряд Тейлора. Для про-

стоты ограничимся одномерным случаем с гауссовской функцией окна:

Самым точным это разложение будет в окрестности и=0, где ошибка будет составлять менее   Если мы подставим

то получим полинсжі степени 2 {т—1) от л: и Например, если т=2, то

и, таким образом; где

Эго простое разложение «сжимает» информацию из п выборок в три коэффициента Ьо, h и Ьг. Оно будет точным, если наибольшее значение |д;—д:і| не превышает h. К сожалению, это заставляет нас пользоваться очень широким окном, которое не дает большого разрешения. Беря большое количество членов, мы можем использовать более узкое окно. Если мы считаем г наибольшим значением \х—Хі\, то, пользуясь тем фактом, что ошибка в т-членном разложении функции Y^f^{(x—xi)lh\ меньше, чем (г/Л)“т!, и пользуясь аппроксимацией Стирлинга для /и!, найдем, что ошибка в аппроксимаций рп{х) будет меньше, чем

Таким образом, ошибка мала только тогда, когда rrOe(r/hy. Это говорит о том, что требуется много членов, если ширина окна h невелика по сравнению с расстоянием /• от д: до наиболее удаленной выборки. Несмотря на то что этот пример элементарен, аналогичные рассуждения действительны и для многомерного случая, даже при использовании более сложных разложений; процедура выглядит более привлекательной, когда ширина окна относительно велика.