2.5. Визначення нормованих допусків на ознаки розпізнавання

 

При оптимізації процесу навчання ІС за                      ІЕІ-технологією важливим питанням є визначення системи нормованих допусків (СНД), яка задає області значень відповідних контрольних допусків на ознаки розпізнавання.

Визначення 2.5.1. Нормованим називається поле допусків  , в якому значення  і–ї ознаки знаходиться з імовірністю      рі =1  або  pi=0 за умови, що функціональний стан ІС належить до базового (найбільш бажаного для ОПР) класу  . 

Визначення 2.5.2. Контрольним називається поле допусків  , в якому значення  і-ї  ознаки знаходиться з імовірністю  0<рі <1  за умови, що функціональний стан ІС належить до базового класу  .

У методах ІЕІ-технології контрольні допуски на ознаки розпізнавання вводяться з метою:

рандомізації процесу прийняття рішень, оскільки для повного дослідження процесу необхідно використовувати як детерміновані, так і статистичні характеристики;

трансформації у процесі навчання ІС параметрів розподілу реалізацій образу шляхом допустимих перетворень в дискретному просторі ознак розпізнавання.

Зрозуміло, що    і базова СКД є сталою для всього алфавіту класів розпізнавання. При цьому основні обмеження зверху (справа) на значення полів контрольних допусків    повинні забезпечувати:

збереження випадковості координат векторів-реалізацій образу;

недопущення збігу еталонних векторів, які є центрами відповідних контейнерів класів розпізнавання, що може призвести до невиконання умов (2.2.2) або (2.2.4) розбиття простору ознак.

Відомі методи оцінки випадковості реалізацій образу обумовлюють наявність навчальної вибірки великого обсягу, що не завжди є здійсненним на практиці. Один із шляхів вирішення цієї проблеми ґрунтується на такій гіпотезі: чим більша середня кодова відстань між реалізаціями одного образу, тим більше вони будуть мати відмінних ознак розпізнавання, що свідчить про їх випадковість. Розглянемо постановку задачі оптимізації СНД за дистанційно-максимальним критерієм. Нехай  – множина реалізацій базового, тобто найбільш бажаного для ОПР  класу  {}, яку розіб’ємо на пари сусідніх векторів і визначимо кодові відстані між ними за правилом

                                (2.5.1)

де – і-та координата реалізації  , яка є найближчою сусідньою до реалізації  .

Необхідно вибрати таку систему допусків  , щоб середнє вибіркове

                                                          (2.5.2)

 

сусідніх реалізацій класу    було максимальним, тобто  ,  якщо  .

Таким чином, параметром, що оптимізується, є величина симетричного поля допусків  , центром якого є значення дискрети еталонного вектора  . Алгоритм складається із послідовного проведення етапів оптимізації, на кожному з яких формується при поточній СКД множина двійкових векторів , здійснюється її розбиття на пари сусідніх реалізацій за умови мінімальної кодової відстані між ними, обчислюється за формулою (2.5.2) середня кодова відстань для сусідніх реалізацій і здійснюється наступний крок ітераційної процедури пошуку максимуму  . Вхідні дані: |– масив дискрет реалізацій, що аналізуються, де  nmin – мінімальний обсяг репрезентативної навчальної вибірки;   змінна поля допусків; h – крок зміни поля допусків;  l – змінна кроків ітерації. Результатом алгоритму оптимізації є поля нормованих допусків , які задають допустиму область значень контрольних допусків і цим забезпечують випадковість ознак розпізнавання.

Розглянемо схему реалізації паралельного алгоритму оптимізації нормованих допусків за критерієм (2.5.2).

Обчислюється еталонна реалізація дискрет   шляхом статистичного усереднення значень дискрет реалізацій  {}  класу    і задається стартове значення параметра  .

 Формується масив    двійкових векторів-реалізацій класу    за правилом

              (2.5.3)

 

 Будується для векторів   матриця  кодових відстаней  , елементи якої визначаються за правилом

                          (2.5.4)

 

Таким чином, нульовим діагональним елементам матриці    штучно присвоюється значення   – максимальна кодова відстань у матриці.

Формуються пари найближчих сусідніх реалізацій   за умови, що

                       

                     ,

 

де  – найближча до вектора   реалізація, отримана на  l-му кроці оптимізації.

5. Обчислюється за формулою (2.5.2) вибіркова середня відстань    для розбиття  .

6. Порівнюється поточне середнє значення  (l)  з попереднім  (l-1). Якщо  , то  ,  і виконується крок 1, інакше    і 

7 Формується оптимальна СНД  , де нижні допуски дорівнюють   і верхні допуски  .

Як приклад розглянемо визначення оптимальної за критерієм (2.5.2) системи нормованих допусків на ознаки в задачі розпізнавання спектрограм, отриманих на мас-спектрометрі МІ-12-01 АТ виробництва ВАТ “Selmi” (Суми, Україна).

На рис. 2.4 наведено дві реалізації спектрограми класу  . Тут на осі абсцис відкладено довжину хвилі в нанометрах, а на осі ординат – значення струму електронного підсилювача в мікроамперах.

 

Якщо поява дискрет, значення яких перевищують шумовий поріг, відбувається детерміновано для даного хімічного елемента, то їх амплітуди, як видно з рис. 2.4, мають випадкові значення.

У табл. 2.1 наведено для прикладу сім двійкових реалізацій класу  , сформованих за правилом (2.5.3) при  . Кожна з цих реалізацій містить 12 ознак, які набувають одиничне значення, якщо значення їх дискрет перебільшують шумовий поріг.

Таблиця 2.1–Двійкові реалізації спектрограм класу 

 

реалі-

зації    Координати  векторів

            1          2          3          4          5          6          7          8          9          10        11        12

1          1          1          1          1          0          1          0          1          0          1          0          0

2          1          1          1          1          1          1          0          0          0          1          0          0

3          1          1          1          0          1          1          0          1          1          1          0          0

4          0          1          1          1          1          1          0          0          1          1          0          1

5          1          1          1          1          1          1          1          1          0          1          0          0

6          1          1          0          0          1          1          0          1          0          1          1          0

7          1          1          0          1          1          1          0          1          0          1          0          0

 

За двійковими векторами, наведеними в табл. 2.1, сформуємо за правилом (2.5.4) матрицю кодових відстаней (табл. 2.2), звідки визначимо для заданого алфавіту класів розпізнавання пари сусідніх двійкових еталонних векторів:

=<,>, =<,>, =<,>,  

=<,>, =<,>,  =<,>, =<,>. 

Відповідно кодові відстані між сусідніми векторами дорівнюють: d()=2; d()=2; d()=3; d()=3; d()=2; d()=2;  d()=2.

 

Таблиця 2.2–Матриця кодових відстаней

 

k         

 

 

 

 

 

 

 

 

13        2          3          5          2          4          2

 

2          13        3          3          2          4          2

 

3          3          13        4          3          3          3

 

5          3          4          13        5          6          5

 

2          2          3          5          13        4          2

 

 4         4          3          6          4          13        2

 

 2         2          3          5          2          2          13

 

На рис. 2.5 наведено залежність середньої кодової відстані    від параметра    поля допусків.

 

            Аналіз рис. 2.5 показує, що область значення контрольних допусків на ознаки розпізнавання задається оптимальним значенням відповідних полів нормованих допусків  , де  , які гарантують випадковість реалізацій образу згідно із принципом рандомізації вхідних даних для ІЕІ-технології. При цьому система нормованих допусків знизу обмежується вимогою виключення переходу реалізацій образу в нульові. Так, вже при    перша, друга і шоста реалізації стають нульовими. З іншого боку, при збільшенні параметра  до 70 збігаються друга та четверта реалізації, що робить подальше збільшення нормованого поля недоцільним. Крім того, вибір занижених нормованих полів допусків призводить до погіршення точнісних характеристик класифікатора, а вибір завищених – до зменшення оперативності навчання. Таким чином, розроблення ефективних критеріїв оцінки випадковості навчальної вибірки у рамках ІЕІ-технології набуває важливого значення.