2.5.1.       СЛУЧАЙ МНОГИХ КЛАССОВ

Допустимы различные способы описания классификаторов. Один из способов, дающий нечто вроде канонической формы классификатора, состоит в представлении его посредством системы разделяющих функций gt(x), і=1, ..., с. Говорят, что классификатор

ставит в соответствие вектор признаков х классу со*, если справедливо неравенство

Классификатор, таким образом, рассматривается как устройство, вычисляющее с разделяющих функций и выбирающее решение, соответствующее наибольшей из них. Такое представление классификатора изображено в виде блок-схемы на рис. 2.3.

Это естественный и простой способ представления байесовского классификатора. В общем случае положим g*(x) =—£?(аг|х), так как наибольшая из разделяющих функций будет тогда соответствовать наименьшему условному риску. В случае классификации с минимальным уровнем ошибки задачу можно еще упростить, принимая gi(x)=P ((£>і\х), так что наибольшая по величине разделяющая функция будет соответствовать наибольшей апостериорной вероятности.

Ясно, что выбор разделяющих функций не единствен. Всегда можно, не влияя на решение, умножить разделяющие функции на положительную константу или прибавить к ним какую-либо константу. Более того, если заменить каждую из gi (х) на /(g; (х)),

где f — монотонно возрастающая функция, то результирующая классификация не изменится. Это обстоятельство может привести к существенным аналитическим и расчетным упрощениям. В частности, при классификации с минимальным уровнем ошибки любой из следующих вариантов приводит к одинаковым результатам,

хотя некоторые и могут оказаться намного проще других с точки зрения понятности или удобства вычислений:

Решающие правила остаются эквивалентными независимо от разнообразия этих форм записи разделяющих функций. Действие любого из решающих правил состоит в том, чтобы разбить пространство признаков на с областей решений 31х, cRc. Если оказывается, что gi(x)>gj(x) для всех }фі, то считаем, что х находится в области сЯг и, согласно решающему правилу, со значением х следует сопоставить состояние сог. Области разделяются границами областей решений — такими поверхностями в пространстве признаков, вдоль которых совпадают наибольшие (для каждой точки х.— Ред.) из разделяющих функций (рис. 2.4). Для соприкасающихся областей сіц и еК.} уравнение разделяющей их границы имеет вид

Хотя данное уравнение в зависимости от выбранного вида разделяющих функций может принимать различную форму, границы областей решений остаются, конечно, одними и теми же. Для точек, лежащих на границе, задача классификации определяется не единственным образом. В случае байесовского классификатора для каждого из решений получаем одно и то же значение условного риска, так что не важно, как будет разрешена эта неопределенность. Вообще говоря, данная проблема разрешения неопределенности при непрерывных функциях плотности условного распределения является чисто теоретической задачей.