2.12 Оптимізація словника ознак розпізнавання

 

Одним із ефективних шляхів стиснення інформації є оптимізація словника ознак, спрямована на зменшення його інформаційної надлишковості.   

У загальному випадку проблема формування оптимального в інформаційному розумінні словника ознак розпізнавання може розглядатися у трьох аспектах:

1) попередній відбір ознак для формування початкового словника ознак розпізнавання;

2) пошук у надлишковому словнику інформативних ознак, виявлення латентних  і виключення неінформативних і “заважаючих” ознак розпізнавання;

3) доповнення словника інформативними первинними та вторинними ознаками розпізнавання. 

Початковий відбір ознак все ще залишається в основному функцією людини – розробника інформаційного забезпечення ІС. Доступність ознак розпізнавання для вимірювання, наявність необхідних датчиків інформації (сенсорів) і приладів вимірювання значною мірою впливають на формування словника ознак. При цьому не виключається можливість ігнорування ознак, важливих для процесу прийняття рішень. Тому важливого значення набуває необхідність найкращого використання наявних ознак розпізнавання. Саме на це спрямовано другий аспект вирішення проблеми шляхом оптимізації вхідного математичного опису в процесі навчання ІС. При цьому під латентними розуміються інформативні ознаки, які є ‘‘схованими’’, наприклад, через їх малу частоту спостережень.

Третій аспект проблеми формування інформативного словника так само доцільно вирішувати у рамках оптимізації параметрів процесу навчання ІС, наприклад, за методами ІЕІ-технології.

Згідно із принципом відкладених рішень введемо, наприклад, у діаграму оптимізації СКД (2.9.1) додатковий контур, який замикається операторами :Е, де множина  словник ознак розпізнавання, що містить первинні та вторинні у загальному випадку надлишкові в інформаційному розумінні ознаки, і  , який безпосередньо змінює розмірність простору ознак.  Крім того, розширення словника може здійснюватися, наприклад, за рахунок вимірювання параметрів впливу зовнішнього середовища та інших параметрів функціонування ІС, які впливають на потужність простору станів  Z, за допомогою оператора  Z.

З урахуванням (2.9.1) діаграма відображення множин у процесі навчання ІС за ІЕІ-технологією із оптимізацією словника ознак розпізнавання має вигляд

                                                                                         (2.12.1)

 

У діаграмі (2.12.1) оператор    змінює крок дискретизації реалізацій образу так само, як і оператор  2  у діаграмі (2.11.1), що призводить до зміни потужності словника  .  Після формування оператором  у загальному випадку апріорно надлишкового варіанта словника  його оптимізація здійснюється у процесі навчання ІС шляхом реалізації ітераційної процедури пошуку максимуму цільової функції

 

                   ,                      (2.12.2)

 

де ЕК(Ω) – деяка узагальнена  цільова функція, що включає як інформаційний КФЕ, обчислення якого є особливістю ІЕІ-технології, так і додаткові умови (наприклад, мінімальна розмірність простору ознак та інше), які є характерними для відповідного алгоритму селекції ознак розпізнавання. Наявність таких додаткових умов свідчить про існування допоміжних контурів оптимізації словника ознак розпізнавання, які пов’язані з іншими параметрами функціонування ІС, що оптимізуються.

З урахування вище наведенного діаграма відображень множин, що застосовуються у процесі навчання ІС при оптимізації словника ознак,  набирає вигляду

 

 

                                                                                      (2.12.3)

 

У діаграмі (2.12.3) штрихпунктирними стрілками позначені можливі додаткові оператори оптимізації словника, що використовують особливості оптимізації інших параметрів функціонування ІС, що навчається. Так, оператор  виділяє групу ознак розпізнавання, що не змінюють КФЕ у процесі оптимізації СКД за умови, що така оптимізація проводилася для кожної ознаки розпізнавання послідовно. Оператор  здатний перевірити, які з ознак було задіяно при реалізації максимально-дистанційного або мінімально-дистанційного принципів оптимізації геометричних параметрів розбиття простору ознак розпізнавання. Слід зазначити, що ці контури впливають лише на стратегію оптимізації словника, оскільки здатні об’єднувати окремі ознаки розпізнавання в групи відповідно до їх впливу на функціональну ефективність системи, що навчається.