2.11. СОСТАВНАЯ БАЙЕСОВСКАЯ ЗАДАЧА ПРИНЯТИЯ РЕШЕНИЙ И КОНТЕКСТ

Вернемся к ранее рассмотренному примеру разработки классификатора для сортировки двух видов древесины — ясеня и березы. Первоначально было принято, что последовательность видов древесины настолько непредсказуема, что состояние природы представляется чисто случайной переменной. Не отказываясь от этого, предположим, что последовательные состояния природы могут и

не быть статистически независимыми. Например, если даже априорные вероятности для ясеня и березы оказываются равными, то может оказаться, что при появлении некоторого куска древесины более вероятно, что несколько последующих кусков будут того же самого вида. В этом случае последовательные состояния природы находятся в некоторой зависимости, которую можно использовать для улучшения образа действия. Это один из примеров ориентации на контекст при выборе решения.

Способ использования такой информации будет несколько варьироваться в зависимости от того, есть ли возможность дожидаться выхода п кусков древесины, после чего принимать все п решений сразу, или же принимать решение надо при появлении каждого куска древесины. Первая задача называется составной задачей принятия решений, а вторая — последовательной составной задачей принятия решений. Рассмотрим первый случай как более наглядный.

Для формулировки задачи в общем виде обозначим п состояний природы вектором со=(со(1), ..., со (п)У, где co(t') относится к одному из с значений соь ..., сос. Пусть Р(в>) есть априорная вероятность п состояний природы. Пусть Х=(хі, ..., хп) есть матрица, определяющая п наблюдаемых векторов признаков, где хг есть вектор признаков, получаемый при состоянии природы со (г). И наконец, пусть р (X |ш) — функция плотности условного распределения величины X при условии, что множество состояний природы есть со. В этом случае апостериорная вероятность состояния со определяется выражением

где

Для составной задачи принятия решений в общем случае можно определить матрицу потерь и отыскивать решающее правило, минимизирующее составной риск. Данная теория строится п® аналогии с ранее рассмотренной простой задачей принятия решения, приводя в итоге к тому, что оптимальная процедура состоит в минимизации составного условного риска. В частном случае, если при правильном решении потери отсутствуют и если все ошибки имеют одинаковую цену, то процедура сводится к вычислению і3 (to [J5^) для всех и и выбору такого <о, апостериорная вероятность которого наибольшая.

Так как при этом требуется проделать все необходимые вычисления для определения Р(а>\Х), задача на практике часто оказывается чересчур громоздкой. Если каждая из компонент со (г) может принимать одно из с значений, то необходимо рассмотреть сп воз-

можных значений со. Задача несколько упрощается в случае, когда распределение вектора признаков xt зависит от соответствующего состояния природы со (і) и не зависит от других векторов признаков и состояний природы. Общая плотность р(Х|ю) определяется при этом просто произведением плотностей компонент р(х;|<о(і)):

Таким образом, вычисление р(X|м) при этом упрощается, однако все еще сохраняются трудности определения априорной вероятности Р (<о). Эта вероятность, отражающая взаимосвязь состояний природы, лежит в основе составной байесовской задачи принятия решения. Поэтому задачу вычисления Р(а>) нельзя упрощать, вводя предположение о независимости состояний природы. Кроме того, на практике обычно стараются каким-нибудь способом избавиться от вычисления Р (<о|Х) для всех сп возможных значений О).

Оставим эти задачи предметом для дополнительных раздумий, а читателей, интересующихся дальнейшими подробностями, отошлем к соответствующей литературе.