6.2. Прийняття рішень в умовах ризику та невизначеності

 

У більшості теоретичних завдань мова йде про постановку і методи вирішення завдань, що не містять невизначеностей. Проте, як правило, більшість реальних практичних завдань містять у тому або іншому вигляді невизначеність. Можна навіть стверджувати, що вирішення завдань з урахуванням різного виду невизначеностей є загальним випадком.

Накопичено достатньо велике число методів формалізації постановки і ухвалення рішень з урахуванням невизначеностей. При використанні цих методів необхідно мати на увазі, що всі вони носять рекомендаційний характер і вибір остаточного рішення завжди залишається за людиною, що відповідає за прийняття рішення (ЛПР).

При вирішенні конкретних завдань з урахуванням невизначеностей ЛПР стикається з різними їх типами. У загальній практиці прийнято розрізняти три типи невизначеностей:

невизначеність цілей;

невизначеність природи (невизначеність наших знань про навколишнє середовище і чинники, що діють в досліджуваному явищі);

невизначеність дій активного або пасивного партнера чи супротивника.

У наведеній вище класифікації тип невизначеностей розглядається з позицій того або іншого елемента математичної моделі. Так, наприклад, невизначеність цілей відбивається при постановці завдання на виборі або окремих критеріїв, або всього вектора корисного ефекту. З іншого боку, два інші типи невизначеностей впливають в основному на складання цільової функції рівнянь обмежень і методу ухвалення рішення. Звичайно, наведене вище твердження є достатньо умовним, як, утім, і будь-яка класифікація. Ми подаємо його лише з метою виділити ще деякі особливості невизначеностей, які треба мати на увазі в процесі ухвалення рішень.

Річ у тому, що, крім розглянутої вище класифікації невизначеностей, потрібно враховувати їх типологію з погляду відношення до випадковості. За цією ознакою можна розрізняти стохастичну (ймовірнісну) невизначеність, коли невідомі чинники статистично стійкі й тому є звичайними об’єктами теорії ймовірності – випадковими величинами (або випадкові функції, події і так далі). При цьому повинні бути відомі або визначені при постановці завдання всі необхідні статистичні характеристики (закони розподілу і їх параметри). Прикладом таких завдань можуть бути, зокрема, система технічного обслуговування і ремонту будь-якого виду техніки, система організації рубок відходу і так далі.

Іншим крайнім випадком може бути невизначеність нестохастичного вигляду, при якій ніяких припущень про стохастичну стійкість не існує.

Нарешті, можна говорити про проміжний тип невизначеності, коли рішення ухвалюється на підставі яких-небудь гіпотез про закони розподілу випадкових величин. При цьому ЛПР повинна мати на увазі небезпеку незбігання його результатів з реальними умовами. Ця небезпека незбігання формалізується за допомогою коефіцієнтів ризиків. Таким чином, невизначеність цілей вимагає залучення яких-небудь гіпотез, що допомагають отриманню однозначних рішень. У даному разі облік чинника невизначеності мети приводить до необхідності розгляду іншої проблеми, яка формулюється у вигляді проблеми ухвалення оптимальних багатоцільових рішень.

Як зазначалося вище, з погляду знань про початкові дані в процесі ухвалення рішень можна представити два крайні випадки: визначеність і невизначеність. У деяких випадках невизначеність знань є ніби «неповною» і доповнюється деякими відомостями про чинники, що діють, зокрема, знанням законів розподілу тих, що описують їх випадкові величини. Цей проміжний випадок відповідає ситуації ризиків.

Ухвалення рішень в умовах ризику може ґрунтуватися на одному з таких критеріїв:

критерії очікуваного значення;

комбінації очікуваного значення і дисперсії;

критерії граничного рівня;

критерії найбільш імовірної події в майбутньому.

Розглянемо детальніше застосування цих критеріїв.

1. Критерій очікуваного значення (КОЗ)

Використання цього критерію припускає ухвалення рішення, що обумовлює максимальний прибуток за наявних початкових даних про ймовірність отриманого результату при тому або іншому рішенні. По суті, КОЗ – вибіркові середні значення випадкової величини.

Природно, що достовірність отриманого рішення при цьому залежатиме від обсягу вибірки. Так, якщо позначити

,                                              (6.1)

де  – відповідно ймовірність і значення і-го результату;n – кількість можливих результатів.

Таким чином, КОЗ може застосовуватися, коли однотипні рішення в схожих ситуаціях доводиться приймати багато разів.

2. Критерій «очікуваного значення – дисперсія»

Як вказувалося вище, КОЗ має сферу застосування, обмежену значним числом однотипних рішень, що приймаються в аналогічних ситуаціях. Цей недолік можна усунути, якщо застосовувати комбінацію КОЗ і дисперсії σ2:

,                                          (6.2)

.                                              (6.3)

3. Критерій граничного рівня

Цей критерій не має чітко вираженого математичного формулювання і базується значною мірою на інтуїції і досвіді ЛПР. При цьому ЛПР на підставі суб’єктивних міркувань визначає найбільш прийнятний спосіб дій. Критерій граничного рівня зазвичай не використовується, коли немає повного уявлення про безліч можливих альтернатив. Урахування ситуації ризиків при цьому може здійснюватися за рахунок введення законів розподілів випадкових чинників для відомих альтернатив.

Незважаючи на відсутність формалізації критерієм граничного рівня користуються досить часто, задаючи їх значення на основі експертних або експериментальних даних.

4. Критерій найбільш імовірного результату

Цей критерій припускає заміну детермінованої випадкової ситуації шляхом заміни випадкової величини прибутку (або витрат) єдиним значенням, що має найбільшу ймовірність реалізації. Використання цього критерію, також, як і у попередньому випадку, значною мірою спирається на досвід та інтуїцію. При цьому необхідно враховувати дві обставини, що роблять більш важким застосування цього критерію:

критерій не можна використовувати, якщо найбільша ймовірність події неприпустимо мала;

застосування критерію неможливе, якщо декілька значень імовірності можливого результату рівні між собою.

Метод статистичного моделювання. Наведені вище формули можуть бути використані для систем незалежних випадкових величин. Проте для технічних систем, як правило, випадкові параметри є залежними. Причому ця залежність не функціональна, а кореляційна. Тому для аналізу випадкових чинників, заданих розподілом, широке застосування знайшли теорія марківських процесів і метод статистичного моделювання (метод Монте-Карло). У завданнях ухвалення оптимальних рішень широке застосування отримав метод Монте-Карло. Основними особливостями цього методу, що базується на багаторазовому повторенні одного і того самого алгоритму для кожної випадкової реалізації, є:

універсальність (метод не накладає практично ніяких обмежень на досліджувані параметри, на вигляд законів розподілу);

простота розрахункового алгоритму;

необхідність великого числа реалізацій для досягнення хорошої точності;

можливість реалізації на його основі процедури пошуку оптимальних параметрів проектування.

Відзначимо основні чинники, що визначили можливість застосування методу статистичного моделювання в завданнях проектування та дослідження якості:

метод застосовний для завдань, формалізація яких іншими методами складна або навіть неможлива;

можливе застосування цього методу для машинного експерименту для не існуючої в дійсності системи, коли експеримент складний і вимагає великих витрат часу і засобів або взагалі не допустимий.

Облік невизначених пасивних умов. Невизначені чинники, закон розподілу яких невідомий, є найбільш характерними під час дослідження якості адаптивних систем. Саме на цей випадок потрібно орієнтуватися при виборі гнучких конструкторських рішень. Методичний облік таких чинників базується на формуванні спеціальних критеріїв, на основі яких ухвалюються рішення. Критерії Вальда, Севіджа, Гурвіца і Лапласа вже давно і міцно увійшли до теорії ухвалення рішень.

Відповідно до критерію Вальда як оптимальна обирається стратегія, що гарантує виграш не менший, ніж «нижня ціна гри з природою».

Правило вибору рішення відповідно до критерію Вальда можна інтерпретувати таким чином: матриця рішень [Wij] доповнюється ще одним стовпцем з найменших результатів Wij кожного рядка. Вибрати слід той варіант, у рядку якого найбільше значення Wij цього стовпця.

Обране таким чином рішення повністю виключає ризик. Це означає, що прийняте рішення не може зіткнутися з гіршим результатом, ніж той, на який він орієнтується. Які б умови Vj не трапилися, відповідний результат не може опинитися нижче W. Застосування цього критерію може бути виправдане, якщо ситуація, в якій ухвалюється рішення, характеризується такими обставинами:

про ймовірність появи стану Vj нічого не відомо;

необхідно враховувати можливість появи стану Vj;

реалізується лише мала кількість рішень;

не допускається ніякий ризик.

Критерій Байєса-Лапласа на відміну від критерію Вальда, враховує кожне з можливих наслідків усіх варіантів рішень.

Відповідне правило вибору можна інтерпретувати таким чином: матриця рішень [Wij] доповнюється ще одним стовпцем, що містить математичне очікування значень кожного з рядків. Обирається той варіант, у рядках якого найбільше значення Wij цього стовпця. Критерій Байєса-Лапласа відповідає ситуації, в якій для ухвалення рішення ставляться такі вимоги:

імовірність появи стану Vj відома і не залежить від часу;

ухвалене рішення теоретично допускає нескінченно велику кількість реалізацій;

допускається деякий ризик при малих числах реалізацій.

Відповідно до критерію Севіджа як оптимальна обирається така стратегія, при якій величина ризиків приймає найменше значення в найкращій ситуації.

Тут величину W можна трактувати як максимальний додатковий виграш, який досягається, якщо в стані Vj замість варіанта Ui вибрати інший, оптимальний для цього зовнішній стан, варіант. Відповідно до критерію Севіджа правило вибору таке: кожен елемент матриці рішень [Wij] віднімається з найбільшого результату max Wij відповідного стовпця. Різниці утворюють матрицю залишків. Ця матриця поповнюється стовпцем найбільших різниць Wir. Обирається той варіант, у рядку якого найменше значення.

Згідно з критерієм Гурвіца обирається така стратегія, яка займає деяке проміжне положення між крайнім песимізмом і оптимізмом: де К - коефіцієнт песимізму, вибраний в інтервалі [0,1].

Правило вибору згідно з цим критерієм таке: матриця рішень [Wij] доповнюється стовпцем, що містить середні зважені найменшого і найбільшого результатів для кожного рядка. Обирається той варіант, в рядках якого розміщені найбільші елементи Wij цього стовпця. При К = 1 критерій Гурвіца перетворюється на критерій Вальда (песиміста), а при К = 0 – у критерій азартного гравця. Звідси видно, яке значення має ваговий показник К. У практичному використанні правильно вибрати цей показник буває так само важко, як правильно вибрати критерій. Тому найчастіше ваговий показник К = 0.5 приймається як середнє значення.

Критерій Гурвіца відповідає ситуації, в якій для ухвалення рішення ставляться такі вимоги:

про імовірність появи стану Vj нічого не відомо;

необхідно враховувати можливість появи стану Vj;

реалізується лише мала кількість рішень;

допускається деякий ризик.

Критерій Ходжа-Лемана базується одночасно на критеріях Вальда і Байєса-Лапласа.

Правило вибору, що відповідає цьому критерію, формулюється таким чином: матриця рішень [Wij] доповнюється стовпцем, складеним із середніх зважених математичного очікування і найменшого результату кожного рядка. Обирається той варіант рішення, в рядку якого найбільше значення цього стовпця.

При z=1 критерій перетвориться в критерій Байєса-Лапласа, а при z=0 перетворюється на критерій Вальда. Таким чином, вибір параметра z схильний до впливу суб'єктивізму. Крім того, без уваги залишається і число реалізацій. Тому цей критерій рідко застосовується при ухваленні рішень. Критерій Ходжа-Лемана відповідає ситуації, в якій для ухвалення рішення ставляться такі вимоги:

про ймовірність появи стану Vj нічого не відомо, але деякі припущення про розподіл імовірності можливі;

ухвалене рішення теоретично допускає нескінченно велику кількість реалізацій;

допускається деякий ризик при малих числах реалізацій.

Загальні рекомендацій з вибору того або іншого критерію дати важко. Проте відзначимо таке:

якщо в окремих ситуаціях не допустимий навіть мінімальний ризик, то потрібно застосовувати критерій Вальда;

якщо певний ризик цілком прийнятний, то можна скористатися критерієм Севіджа.

Можна рекомендувати одночасно застосовувати по черзі різні критерії. Після цього серед декількох варіантів, відібраних таким чином як оптимальні, доводиться вольовим рішенням виділяти деяке остаточне рішення.

Такий підхід дозволяє, по-перше, краще зрозуміти всі внутрішні зв’язки проблеми ухвалення рішень і, по-друге, ослабляє вплив суб’єктивного чинника. Крім того, у сфері інноваційних завдань різні критерії часто приводять до одного результату.

Облік активних умов. Як правило, вирішення практичних завдань, пов’язаних з оцінкою якості і надійності виробів машинобудування, залежить не тільки від операційної сторони, але і від дій інших суб'єктів системи. Кожна зі сторін переслідує власні цілі, що не завжди збігаються одна з одною. Невизначеність такого роду при ухваленні рішень відносять до класу поведінкових невизначеностей. Теоретичною основою знаходження оптимального рішення в умовах невизначеності й конфліктних ситуацій є теорія ігор.

Гра – це математична модель процесу функціонування конфліктуючих елементів систем, у якій дії гравців відбуваються за певними правилами, що мають назву «стратегії». Її поширенню останнім часом сприяв як розвиток ЕОМ, так і створення аналітичного апарату, що дозволяє знаходити аналітичні рішення для широкого класу завдань. Основний постулат теорії ігор – будь-який суб’єкт системи щонайменше так само розумний, як і оперуюча сторона, і робить усе можливе, щоб досягти своїх цілей. Від реального конфлікту гра (математична модель конфлікту) відрізняється тим, що вона проводиться за певними правилами, які встановлюють порядок і черговість дій суб'єктів системи, їх інформованість, порядок обміну інформацією, формування результату гри.

Існує багато класів ігор, що різняться за кількістю гравців, числом ходів, характером функцій виграшу і так далі. Виділимо такі основні класи ігор:

антагоністичні (ігри із жорстким суперництвом) і неантагоністичні. У першому випадку цілі гравців протилежні, в другому – можуть збігатися;

стратегічні й нестратегічні (по-перше суб’єкт системи діє незалежно від останніх, переслідуючи свої цілі, по-друге суб’єкти обирають єдину для всіх стратегію);

парні ігри та ігри для N-осіб;

коаліційні й безкоаліційні;

кооперативні й некооперативні (в першому – можливий обмін інформацією про можливі стратегії гравців);

скінченні й нескінченні (в першому – кінцеве число стратегій).

Системи переваги гравців, у свою чергу, ґрунтуються на двох провідних принципах раціональної поведінки: принципі найбільшого гарантованого результату і принципі рівноваги.

Перший базується на тому, що раціональним вибором одного з гравців повинен вважатися такий, при якому він розраховує на найсприятливішу для нього реакцію з боку іншого гравця. Другий принцип свідчить, що раціональним вибором будь-якого гравця вважається така стратегія ux (або vx), для якої ситуація (ux, vx) взаємовигідна: будь-яке відхилення від даної ситуації гри не є вигідним ні для одного з гравців.

Вирішується парна матрична гра з нульовою сумою (виграш однієї сторони дорівнює програшу іншої) на основі розгляду платіжної матриці, яка є сукупністю значень U і V (пара стратегій (u,v) U x V називається ситуацією гри), а також виграшів Wij при парному поєднанні різних стратегій сторін.

Вирішення парної матричної гри може бути в чистих стратегіях, коли для кожної зі сторін може бути визначена єдина оптимальна стратегія, відхилення від якої невигідно обом гравцям. Якщо вигідно використовувати декілька стратегій з певною частотою їх чергування, то рішення знаходиться у змішаних стратегіях.

Основні особливості використання методів теорії полягають у такому:

як можливі стратегії з боку проектованої системи розглядаються можливі варіанти її будови, з яких потрібно вибрати найбільш раціональний

як стратегії супротивника розглядаються можливі варіанти його протидії, стратегії їх застосування.

Необхідно відзначити, що, розглядаючи ігри з використанням адаптивної системи, число її стратегій може бути істотно розширене завдяки реалізації «гнучких» конструкторських рішень. Аналіз ігрових ситуацій у цьому випадку може бути спрямований не тільки на вибір раціонального варіанта проектованого вибору, але і на визначення алгоритмів раціонального застосування системи в конфліктній ситуації.

Інша особливість застосування методів теорії ігор полягає у виборі рішень, що отримуються на основі аналізу конфліктної ситуації. У теорії ігор доводиться теорема про те, що оптимальна стратегія для кожного з гравців є оптимальною і для іншого. Так, якщо вирішення гри отримане в чистих стратегіях (є «сідлова» точка), то вибір рішення однозначний. Наприклад, якщо для парної антагоністичної гри 3x4 скласти матрицю, де елементами uij будуть у виграші (програші) гравців, то ця точка знаходиться на перетині максиміну рядків і мінімакса стовпців.

Послідовність вирішення гри така:

1. Аналізується платіжна матриця на предмет виключення свідомо невигідних і дублюючих стратегій.

2. Перевіряється наявність «сідлової» точки за умовою цієї точки.

3. Якщо рішення в чистих стратегіях відсутнє, то шукається рішення в змішаних стратегіях за допомогою методів лінійного програмування або методом Монте-Карло.