5.2.2. СЛУЧАЙ МНОГИХ КЛАССОВ

Существует немало способов создания классификаторов для многих классов, основанных на использовании линейных разделяющих функций. Например, можно свести задачу к с—1 задачам для двух классов, где решением /-й задачи служит линейная разделяющая функция, определяющая границу между точками, соответствующими решению С0(, и точками, не соответствующими решению (О;. При ином подходе следовало бы использовать с(с—1)/2 линейных разделяющих функций, по одному для каждой пары классов. Как показано на рис. 5.2, оба эти подхода могут приводить к обла

стям, аналогичным представленным здесь заштрихованными областями, в которых классификация не определена. При данном исследовании указанная трудность будет исключена в результате использования подхода, принятого в гл. 2, при котором определяется с линейных разделяющих функций вида

и X приписывается к coj, если g, (x)>gy(x) для всех ]=фг, в случае равенства классификация остается неопределенной. Получаемый таким путем классификатор называется линейной маишной. Линейная машина делит пространство признаков на области решений, при этом gi (х) является наибольшей из разделяющих функций, если X находится в области еЯ;. Если области и §1] соприкасающиеся, то границей между ними будет часть гиперплоскости Hij, определяемая следующим соотношением:

или

 

Из этого сразу же следует, что вектор w—Wj- нормален гиперплоскости Hij, а взятое со знаком расстояние от х до выражается отношением (gi—g^)/||(w^—w^•)|. Таким образом, в случае использования линейной машины важны не сами векторы веса, а их разности. При наличии с {с—1)/2 пар областей не требуется,, чтобы все они были соприкасающимися, и общее число участков гиперплоскостей, входящих в поверхности решения, часто может быть менее чем с (с—1)/2. Примеры двумерных случаев для таких поверхностей представлены на рис. 5.3.

Легко показать, что области решений для линейной машины являются выпуклыми. Данное ограничение определенно снижает возможности классификатора. В частности, каждая область решения должна быть односвязной; это делает линейную машину в наибольшей мере соответствующей задачам, для которых условная плотность р(х|(Оі) унимодальна. В рамках этих ограничений линейная машина представляет собой достаточно гибкую конструкцию, допускающую простое аналитическое исследование.