1.2.  ПРИМЕР

Чтобы пояснить характер задач, с которыми в дальнейшем придется иметь дело, рассмотрим следующий, несколько надуманный пример.

Допустим, что на некоторой деревообделочной фабрике, выпускающей изделия из древесины различных сортов, требуется автоматизировать процесс сортировки обрабатываемой древесины по пород? дерева. Первоначально решено попытаться разделять древесину пород березы и ясеня по ее внешнему виду. Система, предназначенная для выполнения этой задачи, может быть построена по схеме, изображенной на рис. 1.1. Полученное в камере изображение древесины передается на выделитель признаков, назначение которого с остоит в уменьшении объема данных измерением конкретных «признаков» или «свойств», отличающих вид древесины березы и ясеня, Далее эти признаки (точнее, измеренные значения этих

признаков) подаются на классификатор, предназначенный для оценки представленных данных и принятия окончательного решения относительно типа древесины.

Рассмотрим, по какому принципу могут быть построены выделитель признаков и классификатор. Допустим, что на фабрике нам сообщили, что окраска березы обычно светлее, нежели ясеня. Таким образом, яркость оттенка древесины становится очевидным признаком, и можно попытаться распознавать древесину, наблюдая попросту, превышает или нет ее средняя яркость х некоторое критическое значение х0. Для выбора величины х0 можно взять несколько кусков древесины той и другой породы, измерить их яркость и

оценить результаты измерений. Допустим, что все это проделано и построены гистограммы, приведенные на рис. 1.2. Рассматривая гистограммы, можно установить, что береза обычно светлее ясеня, но вместе с тем очевидно, что один этот критерий не достаточно надежен. Вне зависимости от выбора х0 отличить березу от ясеня только по яркости невозможно.

При поиске других признаков можно попытаться воспользоваться тем соображением, что волокна ясеня обычно более заметны. Хотя измерить этот признак значительно труднее, чем среднюю яркость, однако можно предположить, что заметность волокон можно оценивать по амплитуде и частоте появлений на изображении переходов от темного к светлому. Таким образом, теперь мы имеем два признака для распознавания древесины — яркость хх и заметность волокон х2. Выделитель признаков сводит, таким образом, каждую из картинок к точке или вектору признаков х двумерного простран-

ства, где

Наша задача заключается теперь в разделении пространства признаков на две области, все точки одной из которых соответствуют березе, а другой — ясеню. Предположим, что мы определили значения векторов признаков для наших кусков древесины и получили разброс точек, показанный на рис. 1.3. Анализ графика

приводит к следующему правилу распознавания полученных данных: считать, что данная древесина есть ясень, если вектор признаков попадает выше прямой АВ; в противном случае считать, что это береза.

Несмотря на то что разделение взятых кусков посредством данного правила достаточно хорошее, нет никакой гарантии, что так же хорошо оно будет и по отношению к новым кускам. Безусловно, разумнее было бы взять еще несколько кусков и посмотреть, какая часть из них будет определена правильно. Таким образом, мы приходим к заключению, что поставленная задача включает в себя и элементы статистики, в связи с чем может потребоваться поиск такой процедуры классификации, которая сделает вероятность ошибки минимальной.

Говоря об этом, следует помнить, что в качестве примера была выбрана простая задача. Значительно реальнее задача сортировки древесины на много различных классов. В частности, чтобы отличить дуб от березы и ясеня, вполне могут потребоваться и такие менее очевидные признаки, как «ровность волокон». При большем числе классов и признаков, возможно, придется отказываться от графического способа представления классификатора. Поэтому для дальнейшего изложения вопроса потребуется развить теоретические основы метода.