2.10 Оптимізація рівнів селекції координат двійкових еталонних векторів

 

У загальному випадку адаптація математичного опису на вході класифікатора за ІЕІ-технологією з метою побудови безпомилкових за навчальною матрицею вирішальних правил полягає в реалізації багатоциклічної ітераційної процедури оптимізації за інформаційним КФЕ просторово-часових параметрів функціонування, які впливають на функціональну ефективність ІС, що навчається. Серед таких параметрів важливу роль відіграє рівень селекції (квантування за рівнем) координат двійкових еталонних векторів-реалізацій, образів, які визначають геометричні центри контейнерів класів розпізнавання.

Визначення 2.10.1. Рівнем селекції координат еталонного двійкового вектора називається рівень квантування дискрет полігона емпіричних частот потрапляння значень ознак розпізнавання у свої поля контрольних допусків.

Полігон будується для кожного класу так: по осі абсцис відкладаються ранги ознак розпізнавання, які відповідають номерам ознак у векторі-кортежі  , а по осі ординат – відносні частоти  m,i =ni /n, де  ni – кількість випробувань, при яких значення  і-ї ознаки знаходиться в своєму полі контрольних допусків. За замовчуванням на практиці приймається рівень селекції  m= 0,5. Якщо у процесі навчання знайдено оптимальне значення  <0,5, то це свідчить про виявлення принаймні однієї інформативної ознаки, латентність якої полягала саме в її малій частоті появи. Якщо знайдено  >0,5, то це свідчить про негативний вплив на прийняття рішень принаймні однієї “заважаючої” ознаки.

Оптимізація рівнів селекції у рамках ІЕІ-технології дозволяє розв’язувати такі важливі для підвищення асимптотичної достовірності класифікатора задачі:

центрування контейнерів класів розпізнавання, тобто наближення геометричних центрів контейнерів класів розпізнавання до їх емпіричних центрів розсіювання реалізацій образу;

 максимізація середньої міжкласової кодової відстані для заданого алфавіту у відповідності до максимально-дистанційного  принципу теорії розпізнавання образів.

Параметр  пов’язаний з інформативністю ознак розпізнавання. Наприклад, якщо у процесі навчання знайдено оптимальне значення  <0,5, то це свідчить про виявлення принаймні однієї інформативної ознаки, латентність якої полягала саме в її малій частоті появи. Якщо знайдено >0,5, то це свідчить про негативний вплив на прийняття рішень принаймні однієї “заважаючої” ознаки.

Оптимізацію рівнів селекції координат еталонних векторів доцільно здійснювати за паралельно-послідовним алгоритмом, що дозволяє за алгоритмом паралельної оптимізації визначити стартову квазіоптимальну систему рівнів селекції, а за послідовним – оптимальні рівні селекції для всіх координат еталонних векторів-реалізацій образу. При цьому за умови обґрунтування у загальному випадку нечіткої гіпотези компактності реалізацій образу оптимізацію рівнів селекції  будемо здійснювати на базі інформаційно-екстремального алгоритму навчання.     

Спочатку розглянемо алгоритм оптимізації рівнів селекції координат двійкової реалізації найбільш бажаного для ОПР першого класу , оскільки для інших класів система контрольних допусків на ознаки розпізнавання  залишається незмінною.

Нехай дано  алфавіт класів розпізнавання , навчальна матриця типу “об’єкт-властивість”  , де N, n – кількість ознак розпізнавання та реалізацій образу відповідно. Задано  структурований вектор параметрів функціонування системи, що навчається розпізнавати реалізації класу : ,  який складається з еталонної реалізації   класу ,  геометричного параметра  – кодової відстані гіперповерхні контейнера  класу  від  вершини еталонної реалізації . Задано допустимі області значень відповідних параметрів: , де  – бінарний простір ознак потужності N; , де  – еталонна реалізація сусіднього (найближчого до ) класу ,  параметра контрольного поля допусків , де   – нормоване (експлуатаційне) поле допусків на ознаки розпізнавання і рівень селекції  координат еталонної реалізації , .

Треба на етапі навчання за апріорно класифікованими реалізаціями нечітких образів побудувати оптимальне в інформаційному розумінні чітке розбиття  дискретного простору ознак  на  М класів розпізнавання  шляхом ітераційної оптимізації координат вектора параметрів функціонування  за умови, що значення усередненого за алфавітом   інформаційного КФЕ навчання ІС набуває глобального максимуму в робочій (допустимій) області визначення його функції.

Діаграма відображень множин, що застосовуються при оптимізації рівнів селекції координат еталонних векторів у процесі навчання ІС, має вигляд

                                                                                               (2.10.1)

У діаграмі (2.10.1) оператори контура

              

  (2.10.2)

    

оптимізують рівні селекції координат двійкових еталонних векторів-реалізацій образів.

Оптимальний  рівень селекції   координат еталонного вектора  визначається у результаті реалізації багатоциклічної ітераційної процедури

 

                       ,                        (2.10.3)

де   – область допустимих значень параметра ;           – область допустимих значень параметра поля допусків ; – область допустимих значень ознак розпізнавання;  – область допустимих значень параметра .

Оптимальні рівні селекції координат еталонних векторів інших класів визначаються за процедурою максимізації інформаційного КФЕ навчання ІС розпізнавати реалізації класу :

 

                           .                  (2.10.4)            (3.3.3)

 

Таким чином, процедура (2.10.4) на відміну від процедури (2.10.3) не реалізує алгоритм оптимізації контрольних допусків на ознаки розпізнавання, оскільки вони визначаються тільки для пріоритетного для ОПР класу  . При цьому внутрішні цикли алгоритмів (2.10.3) і (2.10.4) реалізуються послідовно операторами, які утворюють базовий контур (2.8.2). Для алгоритму (3.3.2) наступний цикл реалізується послідовністю операторів контуру (2.9.4) і зовнішній цикл  послідовністю операторів контуру оптимізації рівнів селекції (2.10.5).

Розглянемо детальніше схему алгоритму послідовної оптимізації рівнів селекції:

1. Обнуляється лічильник ознак розпізнавання: і:=0.

2. і:=і+1.

3. Встановлюємо значення для верхнього ρv та нижнього ρn  рівнів селекції відповідно.

4. Встановлюємо крок зміни рівня селекції  ρс.

5. Обнуляється лічильник кроків оптимізації рівня селекції: z:=0.

6.

7. Встановлюємо значення поточного рівня селекції:  ρz:= ρn + ρc.

8. Визначається, наприклад, за ентропійною мірою Шеннона (2.7.4) або критерієм Кульбака (2.7.6).                                                            глобальний максимум КФЕ . Якщо маємо декілька однакових значень , то вибираємо значення з найменшим усередненим коефіцієнтом нечіткої компактності реалізацій образу:

 

                      ,                    (2.10.5)

 

де  – найближчий еталонний вектор до класу .

Параметри функціонування, які відповідають глобальному максимуму критерію   при  мінімальному  ,  вважаються оптимальними.

9. Якщо ρz < ρv, то виконується крок 6, інакше –10.

10. Якщо , де  N – кількості ознак розпізнавання, то виконується крок 2, інакше – «Зупин».

Як приклад застосування вищенаведеного алгоритму розглянемо оптимізацію кроку квантування за часом вхідних реалізацій у задачі компараторного розпізнавання образів, яка полягає у визначенні належності образу, що розпізнається, до деякого базового (еталонного) образу. Для побудови в процесі навчання системи оптимального контейнера базового класу   у цьому випадку необхідно використовувати реалізації найближчого до нього класу , який має  мінімальну міжцентрову відстань   серед інших класів. Як такі класи розглянемо два зображення, одержані у процесі автофокусування растрового електронного мікроскопа виробництва ВАТ “Selmi” (м. Суми, Україна) за зображенням зразка, що досліджувався. На рис. 2.16а наведено початкове розфокусоване зображення  об’єкта "Ґратка", яке прийнято за базове, а на рис. 2.16б – зображення  того самого об’єкта на наступному кроці самонастроювання мікроскопа після збільшення значення струму фокусуючої лінзи на  10 mA.

Для формування навчальної матриці було вибрано рецепторне поле розміром 310х100 пікселів, тобто , а . За реалізацію  зображення  використовувалася крива розподілу яскравості при скануванні j-го рядка рецепторного поля.

Оптимізація рівнів селекції координат еталонного вектора  здійснювалася одночасно для всіх ознак розпізнавання за структурованим ітераційним алгоритмом (2.10.3) . Як  КФЕ навчання системи використовувався ентропійний критерій (2.7.4).

 

 

                   а) 

                  б)

 

У табл. 2.3 наведено одержані при оптимізації контейнера класу  значення нормованого ентропійного критерію  ,  першої достовірності  , помилки другого роду  , параметрів навчання  1,    і міжцентрової кодової відстані  .  Аналіз табл. 2.3 показує, що оптимальний рівень селекції координат еталонного  вектора класу   дорівнює  при максимальному значенні нормованого ентропійного критерію . Зрозуміло, що для класу   цей рівень селекції так само є оптимальним.

 

Таблиця 2.3–Результати оптимізації контейнера  класу

 

 

E1          D1    β          d1                 dc

0,40     0,67     0,80     0,00     39        12        55

0,42     0,71     0,84     0,00     33        14        4

0,44     0,71     0,84     0,00     33        14        38

0,46     0,71     0,84     0,00     31        14        38

0,48     0,70     0,83     0,00     30        14        43

0,50     0,75     1,00     0,12     38        12        45

0,52     0,79     1,00     0,09     37        12        48

0,54     0,81     1,00     0,08     35        12        48

0,56     0,81     1,00     0,08     35        12        51

0,58     0,76     0,99     0,08     33        12        53

0,60     0,79     1,00     0,09     33        12        51

 

Як видно з табл. 2.3, КФЕ  має  два максимальні значення (при  і  ). Тому за оптимальний рівень селекції згідно з максимально-дистанційним принципом прийнято  , оскільки при цьому рівні міжкласова  відсань  є більшою, а відповідно відносний коефіцієнт нечіткої компактності (2.10.5) є  меншим. Крім того, варто зазначити, що у даному прикладі значення рівня селекції , яке на практиці використовується за замовчуванням в процесі бінеаризації даних, не є оптимальним в інформаційному розумінні.

Таким чином, алгоритм оптимізації рівнів селекції координат двійкових еталонних векторів-реалізацій образу, як і інших параметрів навчання інтелектуальної ІС, у рамках ІЕІ-технології полягає у наближенні глобального максимуму інформаційного критерію оптимізації, обчисленого в робочій області визначення його функції, до найбільшого граничного значення.