Задачи

1.   a) Покажите, что расстояние между гиперплоскостью g(x)=w<x-ftt)o=0 и точкой X при наличии ограничения g(x^)=0 может быть сделано равным |g(x)[/l|wl| путем минимизации Цх—х^ІР.

б) Покажите, что проекция вектора х на гиперплоскость задается выражением

2.   Рассмотрим линейную машину для трех классов с разделяющими функциями вида g;(x)=w,x+a)^o> 2, 3. Случай, когда размерность х равна 2 и величины порогов w о равны нулю, схематически изобразим так; весовые векторы изобразим отрезками, которые сходятся в начале координат; соединим на-

чала этих отрезков и проведем границу области решений. Как изменится этот рисунок, если к каждому из весовых векторов будет добавлен постоянный вектор?

3.   В случае многих классов говорят, что множество выборок линейно разделяемо, если существует линейная машина, которая правильно классифицирует все выборки. Если для любого (О,- выборки, помеченные символом ю,-, могут быть отделены от всех остальных с помощью единственной гиперплоскости, будем говорить, что выборки полностью линейно разделяемы. Покажите, .что Полностью линейно разделяемые выборки должны быть линейно разделяемы, но что обратное утверждение неверно. (Указание: для проверки второй части утверждения рассмотрите такую же линейную машину, как в задаче двух последовательных разделений выборок.)

4.   Говорят, что множество выборок является попарно линейно разделяемым, если существуют с(с—\)!2 гиперплоскостей Я,у, таких, что Я,у отделяет выборки, помеченные со,-, от выборок, помеченных Wy. Покажите, что множество попарно линейно разделяемых образов может не быть линейно разделяемым. {Указание: найдите такие конфигурации выборок, для которых границы области решений являются такими, как на рис. 5.26.)

5.   Рассмотрите линейную машину с разделяющими функциями g/(x)=w;x+ +аі;о- •••> с. Покажите, что области решения являются выпуклыми, доказав, что если и    то Яхі+ (1—Я)х2€5І/ при 0<А,<1.

в. Пусть {уі, ..., у„} — конечное множество линейно разделяемых выборок, а — вектор решения, если а^у,-^й для всех і. Покажите, что вектор решения минимальной длины есть единичный вектор. {Указание: рассмотрите эффект усреднения двух векторов решения.)

7.   Выпуклой оболочкой множества векторов Xj   называют множество всех

векторов вида

где коэффициенты а, неотрицательны и сумма их равна 1. Заданы два множества векторов. Покажите, что либо они линейно разделяемы, либо их выпуклые оболочки пересекаются. {Указание: допустив справедливость обоих утверждений, рассмотрите классификацию точки пересечения выпуклых оболочек.)

8.   Говорят, что классификатор является кусочно линейной машиной, если его разделяющие функции имеют вид

где

а)   Укажите, каким образом кусочно линейная машина может быть описана как линейная для классификации подклассов образов.

б)   Покажите, что область решения кусочно линейной машины может быть невыпуклой, многосвязной.

9.   Пусть d компонент х равны либо О, либо 1. Допустим, что мы относим х к о)і, если число ненулевых компонент х нечетно, и к (о^ — в противном случае. (В теории переключения это называется функцией четности.)

а) Покажите, что такая дихотомия не является линейно разделяемой, если d>l.

б) Покажите, что даииая задача может быть решена с помощью кусочно линейной машины с d+1 весовыми векторами (см. задачу 8). {Указание', рассмотрите вёкторы вида 4iij=(Xij (1, 1, ..., 1)^)

10.  При доказательстве сходимости процедуры персептрона масштабный коэффициент а может быть выбран равным рѴѵ- Используя обозиачения п. 5.5.2, покажите, что если а больше рѴ2ѵ, то максимальное число коррекций может быть вычислено по формуле

При каком значении а число достигает минимального значения для аі—О?

11.  Опираясь на доказательство сходимости, приведенное в п. 5.5.2, попытайтесь изменить его для того, чтобы доказать сходимость такой процедуры коррекций: задавшись произвольным начальным весовым вектором aj, корректируем

в соответствии с выражением

тогда и только тогда, когда а* у* не достигает допуска 6, где р/і ограничено неравенствами 0<p„<pft<pb<oo. Что происходит в случае отрицательного й?

12.  Пусть {уі, ..., у„} — конечное множество линейно разделяемых выборок. Предложите процедуру, с помощью которой разделяющий вектор может быть получен через конечное число шагов. {Указание: рассмотрите весовые векторы, компонентами которых являются целые числа.)

13.  Рассмотрим функцию критерия

где 2/ (а) — множество выборок, для которых л^у<Ь. Пусть Уі — единственная выборка в 3/(а*). Покажите, что yJg (а*)=2(аіуі—6)уі, а матрица вторых частных производных определяется выражением D=2yjyf. Используя этот результат, покажите, что если в выражение (8) подставить оптимальное значение pk< то алгоритм градиентного спуска примет вид

14.  Покажите, что при использовании метода наименьших квадратов масштабный коэффициент а в решении, соответствующем разделяющей функции Фишера (п. 5.8.2), определяется выражением

15.  Обобщите результаты п. 5.8.3 для того, чтобы показать, что вектор а, который минимизирует функцию критерия

обеспечивает асимптотически наилучшее в смысле минимума среднеквадратичной ошибки приближение для байесовской разделяющей функции {Кі—Кі)Р —(^12—^22)^ (согіх)-

16.  Рассмотрим функцию критерия (а)=£[(а*у (х)—г)*] и байесовскую разделяющую функцию go(x).

а)   Покажите, что

б)   Используя тот факт, что условное среднее значение г равно й>(*)> покажите, что вектор а, минимизирующий J„, одновременно доставляет минимум функционалу £[(а*у—gc)*l.

17.  Скалярный аналог отношения ^fc+i= Л* *+у*уА, используемого в методе стохастической аппроксимации, имеет вид Ра+і=Р~й+і/|. Покажите, что решение в замкнутой форме для данного уравнения имеет вид

Приняв рі>0 и 0<асі/* Сб<оо, покажите, почему указанная последовательность коэффициентов удовлетворяет соотношениям

18.  Задача линейного программирования, сформулированная в п. 5.10.2, включала в себя минимизацию единственной искусственной переменной t при ограничениях а*у,-|-^>6/ и />0. Покажите, что результирующий весовой вектор минимизирует функцию критерия

19.  Предложите обобщение на случай многих классов метода потенциальных функций, включающего с разделяющих функций; предложите итеративную процедуру юррэхции'ошибок для определения разделяющих функций.