2.9 Оптимізація контрольних допусків на ознаки розпізнавання

 

     Оскільки контрольні допуски на значення ознак розпізнавання прямо впливають на геометричні параметри контейнерів класів розпізнавання, а таким чином і на асимптотичні точнісні характеристики рішень, то питання оптимізації системи контрольних допусків (СКД) у методах              ІЕІ-технології набуває важливого значення при розробленні інформаційного забезпечення ІС, що навчається.

     Розглянемо підхід до оптимізації СКД на ознаки розпізнавання в рамках ІЕІ-технології. На рис. 2.8 показано симетричне (двобічне) поле допусків на значення  і-ї ознаки  .

 

На рис. 2.8 прийнято такі позначення: А0  номінальне значення ознаки  yi; АН,  АВ  нижній і верхній нормовані допуски відповідно;  АНК , АВК  нижній і верхній контрольні допуски відповідно; Н,і  нормоване поле допусків; К,і– контрольне поле допусків.

     Діаграма відображень множин у процесі оптимізації СКД з урахуванням базової діаграми (2.8.1) має вигляд

(2.9.1)

У діаграмі (2.9,1)  терм-множина  складається із допустимих значень СКД, а  контур операторів

 

(2.9.2)

 

безпосередньо оптимізує контрольні допуски на ознаки розпізнавання. 

Існує декілька можливих стратегій зміни поля допусків  К,і , серед яких відокремимо дві основні:

симетрична стратегія  S1(), яка є виправданою, наприклад, за умови підтвердження розвідувальним аналізом збіга номінального значення  А0  з теоретичним центром розсіювання значень навчальної вибірки  ;

асиметрична стратегія  S2(), яка має місце при відхиленні значення  А0   від центра розсіювання значень вибірки  .

Задача оптимізації контрольних допусків на ознаки розпізнавання є частковою задачею інформаційного синтезу, в якій необхідно визначити екстремальні значення  

   

                                             (2.9.3)

 

де   – область допустимих значень контрольних допусків.

Розглянемо можливі алгоритми оптимізації контрольних допусків :

паралельний алгоритм, при якому контрольні допуски оптимізуються для всіх ознак одночасно;

послідовний алгоритм, при якому контрольні допуски оптімізуються послідовно для кожної ознаки розпізнавання при фіксованих (стартових) значеннях інших ознак;

алгоритм оптимізації за зведеним полем допусків, який доцільно застосовувати як послідовно-паралельний алгоритм за наявності різних шкал вимірювання для окремих груп ознак розпізнавання.

Перевагою паралельного алгоритму оптимізації СКД є висока оперативність реалізації алгоритму, але він не дозволяє одержати точне значення глобального максимуму КФЕ в робочій області визначення його функції. Тому екстремальні значення параметрів функціонування ІС, одержані в процесі їх оптимізації за паралельним алгоритмом, є квазіоптимальними. Алгоритми послідовної оптимізації СКД дозволяють обчислювати точні значення  глобального максимуму КФЕ в робочій області, але характеризуються низькою оперативністю. З метою поєднання переваг цих алгоритмів оптимізацію СКД на ознаки розпізнавання доцільно здійснювати на практиці за паралельно-послідовним алгоритмом. При цьому реалізація паралельного алгоритму дозволяє визначити стартові контрольні допуски, які є вхідними для алгоритму послідовної оптимізації. Це дозволяє підвищити оперативність послідовного алгоритму, оскільки стартові квазіоптимальні контрольні допуски вже знаходяться в робочій області визначення

функції  КФЕ.

Алгоритм оптимізації контрольних допусків, як і інших параметрів функціонування ІС, у рамках ІЕІ-технології полягає у наближенні глобального максимуму інформаційного критерію оптимізації, що обчислюється в робочій області визначення функції, до граничного найбільшого його значення. Тому важливого значення набуває дослідження збігу такого алгоритму. Розглянемо збіг алгоритму послідовної оптимізації контрольних допусків на ознаки розпізнавання. Введемо такі позначення:

– структурований вектор ознак розпізнавання;

– структурований вектор стартових параметрів контрольних допусків на ознаки розпізнавання;

 – кількість прогонів ітераційної процедури послідовної оптимізації контрольних допусків;

– максимальне значення КФЕ в робочій області його визначення при  l-му прогоні ітераційної процедури;

– найбільший глобальний максимум функції КФЕ в області її значень;

– значення параметра поля контрольних допусків для і-ї ознаки, яке отримано при l-му прогоні ітераційної процедури та дорівнює половині інтервалу  ;

– екстремальне значення параметра поля контрольних допусків для  і-ї ознаки;

– оптимальне значення поля контрольних допусків для   і-ї ознаки.

       З урахуванням виразу (2.9.3) і введених позначень структурований алгоритм послідовної оптимізації поля контрольних допусків на ознаки розпізнавання набирає вигляду                    

                           

         (2.9.4)

 

де  – області допустимих значень поля контрольних допусків для  і-ї ознаки, критерію оптимізації і кодової відстані    відповідно; – символ операції повторення.

Розглянемо послідовність  ,  де    –

.

Т в е р д ж е н н я 2.9.1. Послідовність    монотонно спадає і обмежена знизу.

Д о в е д е н н я. Покажемо, що  . Це легко доводиться за індукцією. Нехай при    для першої ознаки знайдено екстремальне значення    за умови, що значення контрольних допусків для інших ознак залишаються стартовими. Тоді має місце

.

Оскільки за властивістю інформаційного критерію  , то відношення рівності може бути тільки за умови, що стартове значення    дорівнює екстремальному. Так само справедливо і для всіх  N  екстремальних значень  

 

 

 

Таким чином, послідовність   є спадною і обмеженою знизу, оскільки її члени додатні. Але не зрозуміло, чи є послідовність стаціонарною, тобто чи існує таке  , що для будь-якого  l >L  має місце. Відповідь на це запитання дає така теорема.

Т е о р е м а 2.9.1. Ітераційний алгоритм послідовної оптимізації контрольних допусків на ознаки розпізнавання (2.9.4) збігається з імовірністю одиниця.

Д о в е д е н н я. Для доведення теореми необхідно та достатньо показати, що екстремальні поля контрольних допусків    збігаються відповідно до оптимальних   Припустимо, що послідовність , яка за твердженням спадна і обмежена знизу, збігається на  L-му прогоні ітераційної процедури і вона є стаціонарною, тобто  . Тоді маємо

 

                  .

 

Але звідси необов’язково випливає, що , оскільки функція   не є взаємно однозначною. Покажемо у рамках евристичного доведення на основі принципів та категорій ІЕІ-технології, що все-таки існує   для будь-якого  . Через дистанційно-максимальний принцип розпізнавання образів у процесі оптимізації розбиття    для найближчих сусідніх класів  і   повинна виконуватися умова    з обмеженнями (2.2.2) і (2.2.4). Нехай існує для функції структурована  множина екстремальних параметрів

 

             .

 

Оскільки збільшення параметра   збільшує ймовірність переходу  і-ї координати еталонного вектора-реалізації    в одиницю, то за умови, що еталонний вектор  є одиничним, має місце

 

.

 

Таким чином, можна стверджувати, що припущення про стаціонарність послідовності   є справедливим, оскільки через максимально-дистанційний принцип розпізнавання образів за умови  існує оптимальне значення параметра поля контрольних допусків  .

Відповідно, виходячи із концептуальних положень   ІЕІ-технології, доводиться збіг паралельного алгоритму оптимізації контрольних допусків на ознаки розпізнавання. Для цього введемо такі позначення:

l – змінна кроків збільшення параметра поля допусків ;

– змінна поля допусків на ознаки розпізнавання, область визначення якого  , де  {Gi}– допустимі області значень контрольних допусків для ознак розпізнавання;

– значення КФЕ в робочій області його визначення після  l-го кроку зміни параметра  ;

– точне значення глобального максимуму КФЕ навчання системи розпізнавати реалізації класу   в робочій області визначення  його функції;

– поле контрольних допусків, яке отримано після   l-го кроку зміни параметра    і дорівнює для і-ї ознаки інтервалу  ;

– екстремальне значення параметра поля контрольних допусків, де  L– крок зміни поля допусків, при якому КФЕ навчання досягає глобального значення   ;

Розглянемо послідовність  , де L –крок зміни параметра  , на якому  КФЕ навчання досягає значення   і –. Тут   – будь-яке мале додатне число.

Тоді має місце таке твердження:

Т в е р д ж е н н я  2.9.2. Послідовність    при збільшенні параметра    до величини    монотонно спадає і обмежена знизу.

Оскільки інформаційний КФЕ, який є функціоналом від точнісних характеристик, має в робочій області його визначення глобальний максимум (за припущенням при  ), тому при    твердження 2.9.2 має місце.

Т е о р е м а 2.9.2. Алгоритм паралельної оптимізації контрольних допусків на ознаки розпізнавання збігається за ймовірністю, тобто  , де   – будь-яке мале додатне число.

Для доведення цієї теореми достатньо показати, що послідовність  не є стаціонарною, тобто , оскільки екстремальний параметр   принаймні для однієї ознаки розпізнавання не є оптимальним.

Розглянемо алгоритм послідовної оптимізації контрольних допусків на ознаки розпізнавання за процедурою (2.9.4). Вхідні дані: масив реалізацій образу  ; стартова СКД   і система нормованих допусків (СНД)  , яка визначає область значень відповідних контрольних допусків. Стартовий параметр    поля контрольних допусків може дорівнювати половині відповідного симетричного поля нормованих допусків для і-ї ознаки за умови випадковості її значень. Попередньо для кожної ознаки визначається ціна градації  , на яку змінюється  і-та ознака. Реалізація алгоритму здійснюється за такою схемою:

Обнулення лічильника прогонів процедури оптимізації параметрів навчання  l:=0.

Для стартової системи допусків обчислюється за базовим алгоритмом навчання, наведеним у підрозділі 2.8,  значення функції .

Формування лічильника прогонів  l: l+1.

Обнулення лічильника ознак розпізнавання  і:=0.

Формування лічильника ознак розпізнавання  і: і+1.

Визначення екстремального значення параметра    за процедурою (2.9.4), в якій внутрішній цикл оптимізації реалізує базовий алгоритм навчання.

.

Якщо  , то виконується пункт  5, інакше – 9.

Якщо  , де – будь-яке мале додатне число, то виконується пункт 10, інакше – пункт 3.

 і “Зупин”.

Паралельний алгоритм  оптимізує параметри контейнерів класів розпізнавання за умови ітераційної процедури визначення для базового класу    оптимальних контрольних допусків на всі ознаки одночасно. Вхідні дані такі самі, як і для послідовного алгоритму, але за область значень параметра    береться інтервал  , де   ширина нормованого поля допусків.   

Розглянемо кроки реалізації цього алгоритму:

Обнулюється лічильник кроків зміни параметра  : l:=0.

 Запускається лічильник: l:=l+1  і обчислюються нижні та верхні контрольні допуски для всіх ознак:  і    відповідно, де  – вибіркове середнє значення -ї ознаки для векторів-реалізацій класу , який є найбільш бажаним для ОПР .

Реалізується базовий алгоритм навчання.

Якщо , то виконується пункт 5, інакше – пункт 6.

Якщо  , то виконується пункт 2, інакше– пункт 6.

  і “ЗУПИН”.

Розглянемо результати реалізації алгоритму оптимізації СКД у рамках ІЕІ-технології на прикладі навчання СППР, яка є складовою частиною АСКТП виробництва складного мінерального добрива NKP (азот – калій – фосфор) у ВАТ «Сумихімпром». Для наочності розглянемо оптимізацію апріорного нечіткого розбиття для трьох класів:   і  , які відрізнялися один від одного вмістом хімічних компонентів. Тут клас  характеризує найкращий технологічний режим, що забезпечує відповідність кінцевого продукту заданому стандарту, а інші класи характеризують порушення техпроцесу (відхилення вмісту хімічних компонентів від норми). Навчальна матриця складалась із 40 векторів-реалізацій для кожного класу, які мали 41ознаку (із них 28 – технологічні параметри, значення яких періодично знімалися з датчиків інформації та візуально відображалися на моніторі, і 13 – результати поточного хімічного аналізу, які за графіком вводилися у систему оператором. 

З метою аналізу впливу СКД на ознаки розпізнавання на функціональну ефективність навчання ІС спочатку розглянемо результати реалізації базового алгоритму навчання без оптимізації контрольних допусків. На рис. 2.9–2.11 показано графіки залежності функції КФЕ (2.7.6) від радіусів контейнерів відповідних класів, одержані у процесі реалізації базового алгоритму навчання, тобто при неоптимальній системі контрольних допусків.

 

На рис. 2.9 – 2.11 і далі світла область  графіка означає робочу область визначення функції КФЕ. Аналіз  показує, що оптимальні радіуси контейнерів у кодових одиницях дорівнюють відповідно ,  і  .

На рис. 2.12 наведено динаміку зміни КФЕ навчання системи в процесі оптимізації параметра поля допусків   за паралельним алгоритмом.

Аналіз рис. 2.12 показує, що  оптимальне значення параметра поля допусків дорівнює    відносних одиниць для всіх ознак розпізнавання. Крім того, усереднене значення КФЕ навчання для трьох класів є значно більшим () у порівнянні з базовим алгоритмом навчання (рис.2.9–2.11).

Одержані за результатами паралельної оптимізації квазіоптимальні контрольні допуски на ознаки розпізнавання визначалися як стартові, і запускався алгоритм послідовної оптимізації (2.9.4) за тим самим критерієм (2.7.6).

На рис. 2.13–2.15 наведено графіки залежності КФЕ від радіусів контейнерів відповідних класів в процесі послідовної оптимізації контрольних допусків. Аналіз цих рисунків показує, що оптимальні радіуси відповідних контейнерів класів розпізнавання дорівнюють  7, 9, 8. При цьому середнє значення радіусів контейнерів дорівнює 5,33, що значно менше відповідного середнього значення для базового алгоритму навчання.

 

 

 

Цей факт свідчить про зменшення ступеня перетину класів у процесі оптимізації контрольних допусків на ознаки розпізнавання. Аналіз зміни величини середніх значень КФЕ у процесі оптимізації СКД показав, що при реалізації базового алгоритму навчання вона дорівнювала 2,90, при оптимізації за паралельним алгоритмом –11,32, а при оптимізації за послідовним алгоритмом –13,07. Тобто застосування алгоритму послідовної оптимізації СКД забезпечує наближення значення КФЕ до граничного (13,96), яке обчислено згідно з формулою (2.7.9) при   і .

Таким чином, можна зробити висновки, що причина низької ефективності навчання за базовим алгоритмом полягала в тому, що система контрольних допусків на ознаки розпізнавання не була оптимальною. З іншого боку, наведений приклад оптимізації контрольних допусків за паралельним алгоритмом свідчить, що він суттєво підвищує КФЕ навчання ІС, але у відповідності до теореми 2.9.2 не забезпечує побудову безпомилкового вирішального правила. Послідовний алгоритм оптимізації контрольних допусків у порівнянні з паралельним збільшує функціональну ефективність навчання системи. У загальному випадку згідно з принципом відкладених рішень для побудови безпомилкових за навчальною матрицею вирішальних правил методи ІЕІ-технології потребують оптимізації інших просторово-часових параметрів функціонування ІС, що входять у структуру (2.2.6).