2.3 Формування вхідного математичного опису

 

Основною задачею формування вхідного математичного опису ІС є створення багатовимірної навчальної матриці . При цьому необхідно розв’язувати такі задачі:

формування словника ознак та алфавіту класів розпізнавання;

визначення мінімального обсягу репрезентативної навчальної матриці;

визначення нормованих допусків на ознаки розпізнавання.

Таким чином, формування вхідного математичного опису ІС потребує детального вивчення та аналізу особливостей функціонування джерела інформації, яким, наприклад, у задачах керування може бути розподілений у просторі і часі технологічний процес, космічний корабель та інше.

Вхідний математичний опис подамо у вигляді теоретико-множинної структури                            

 

                         В=<G, T, , Z, Y; П, Ф>,                     (2.3.1)

 

де  G  простір вхідних сигналів (факторів), які діють на ІС; T  множина моментів часу зняття інформації;   простір ознак розпізнавання; Z – простір можливих станів ІС; Y  множина сигналів, які знімаються з виходу БПОІ; 

П: GTZ  оператор переходів, що відбиває механізм зміни  станів ІС під впливом внутрішніх і зовнішніх факторів; Ф: GTZY  оператор формування вибіркової множини  Y  на вході ІС.

     Таким чином, як універсум випробувань  W  розглядається декартовий добуток наведених в (2.3.1) множин:

                                    W = GTZ.

 

Словник ознак розпізнавання  , де  , складається з первинних ознак, які є безпосередньо характеристиками процесу, що досліджується, і з вторинних ознак, які є похідними від первинних. Обов’язковою вимогою до словника ознак є його структурованість. На практиці первинними ознаками можуть бути значення параметрів, що зчитуються з датчиків інформації, або експериментальні дані, одержані безпосередньо при дослідженні процесу, включаючи умови його реалізації. Найбільш поширеними вторинними ознаками є різні статистичні характеристики векторів-реалізацій класів  , навчальних вибірок   або всієї навчальної матриці.

Формування алфавіту класів розпізнавання   може здійснюватися як розробником інформаційного забезпечення, так і безпосередньо ІС, що здатна функціонувати в режимі кластер-аналізу. При цьому варто враховувати, що збільшення потужності алфавіту при незмінному словнику ознак розпізнавання суттєво впливає на асимптотичні точнісні характеристики, що характеризують функціональну ефективність навчання системи, через збільшення ступеня перетину класів розпізнавання. Це питання для ІЕІ-технології докладно досліджено в праці [23]. Один із найпростіших імовірнісних критеріїв перетину класів для заданого алфавіту може бути подано як відношення помилки другого роду до першої достовірності, яке обчислюється на -му кроці ітераційного навчання:

.

 

Одним з ефективних шляхів корекції точнісних характеристик при збільшенні потужності алфавіту класів є формування ієрархічних алгоритмів навчання ІС, що дозволяє кількість класів розбити на групи меншої потужності і здійснювати навчання для кожної із них, та створення штучної надлишковості словника ознак, наприклад, із застосуванням методів завадозахищеного кодування [43].