3.9 Оптимізація ієрархічної структури алгоритму розпізнавання магнітокардіограм

 

 

Основною задачею інформаційного синтезу системи розпізнавання, що навчається, є одержання безпомилкових за навчальною матрицею вирішальних правил. Ця задача суттєво ускладнюється у разі збільшення потужності алфавіту класів розпізнавання. Одним із ефективних шляхів її вирішення є побудова ієрархічної структури даних, яка дозволяє розбити класи розпізнавання на страти, які є підмножинами одного рівня [84]. Відомі ієрархічні алгоритми розпізнавання образів орієнтовані на апріорно чіткі розбиття класів, що потребує на підготовчому етапі проведення нормалізації зображень за довільних початкових умов їх формування. Одним із перспективних шляхів підвищення достовірності розпізнавання образів, що входять в алфавіт великої потужності, є побудова ієрархічної структури класів у рамках ІЕІ-технології синтезу систем розпізнавання, що навчаються [1,67].

Розглянемо алгоритми навчання і екзамену системи розпізнавання магнітокардіограм у рамках ІЕІ-технології з оптимізацією (тут і далі в інформаційному розумінні) ієрархічної структури алфавіту класів розпізнавання.

Нехай дано алфавіт класів розпізнавання , що характеризує  функціональних станів серцево-судинної системи людини. У результаті обробки магнітокардіограм сформована багатовимірна навчальна матриця , де  кількість ознак розпізнавання і векторів-реалізацій образів відповідно. Відомий структурований вектор параметрів функціонування системи розпізнавання , де   – еталонний вектор-реалізація класу ;  – радіус відновлюваного в радіальному базисі простору ознак розпізнавання контейнера класу ;  – параметр поля контрольних допусків на ознаки розпізнавання. При цьому задані такі обмеження: вершина вектор  визначає геометричний центр контейнера класу , , де  – кодова відстань центра класу     від центра найближчого (сусіднього) класу , і  , де  – нормоване (експлуатаційне) поле допусків, що є областю значень параметру .

Необхідно в процесі навчання знайти оптимальні значення координат вектора параметрів функціонування , що забезпечують максимальне значення критерію функціональної ефективності (КФЕ) навчання системи розпізнавання

                                                     ,                                        (3.9.1)

 

де       – інформаційний КФЕ навчання системи розпізнавати реалізації класу ;

 – упорядкована множина кроків навчання (відновлення контейнерів класів розпізнавання).

На етапі екзамену необхідно прийняти рішення про належність реалізації, що розпізнається, одному із класів заданого алфавіту.

Математичну (категоріальну) модель ієрархічного навчання системи розпізнавання представимо у вигляді діаграми відображення множин        (рис. 3.22), у якій обов'язковим є оператор, що відображає універсум випробувань на вибіркову множину  (вхідну багатовимірну навчальну матрицю), , де  – множина вхідних факторів;  – множина моментів зняття інформації;  – простір ознак розпізнавання;  – простір функціональних станів об'єкта, що діагностується. Оскільки в рамках ІЕІ- технології побудова оптимального в загальному випадку нечіткого розбиття  здійснюється шляхом припустимих перетворень вхідного математичного опису в дискретному субпарацептуальному просторі ознак, то категоріальна модель повинна містити оператор , що відображає вхідну в загальному випадку навчальну матрицю  в бінарну матрицю , і оператор побудови розбиття   .

Показаний на рис. 3.22 оператор класифікації , де  – множина гіпотез,  перевіряє основну статистичну гіпотезу про належність навчальної реалізації  класу . Тут l – кількість статистичних гіпотез. Оператор g: I|l| ®Á |q| у процесі оцінки статистичних гіпотез формує множину точнісних характеристик Á |q|, де q=l2 – кількість точностних характеристик. Оператор  формує терм-множину , що складається із значень КФЕ, що є функціоналом від точнісних характеристик. Зворотний ланцюг діаграми відображень містить ряд контурів оптимізації параметра функціонування системи розпізнавання. Контур оптимізації геометричних параметрів розбиття  шляхом ітераційного пошуку глобального максимуму КФЕ навчання системи розпізнавати реалізації класу  замикається оператором r: E®. Контур оптимізації контрольних допусків на ознаки розпізнавання .замикається через терм-множину , що містить значення системи контрольних допусків на ознаки розпізнавання, а контур оптимізації ієрархічної структури класів розпізнавання замикається через множину , що містить варіанти ієрархічних структур для заданого алфавіту класів розпізнавання. Оператор  регламентує процес навчання системи розпізнавання.

Ієрархічний алгоритм навчання системи розпізнавання в рамках ІЕІ- технології представимо у вигляді багатоциклічної ітераційної процедури пошуку глобального максимуму інформаційного КФЕ (3.8.1), що обчислюється в робочій (допустимій) області визначення його функції

 

                                       ,                               (3.9.2)

 

де       – множина варіантів ієрархічних структур для заданого алфавіту класів розпізнавання;

                               – допустима область значень параметра поля допусків ;

                               – робоча область визначення функції критерію .

Вхідними даними ієрархічного алгоритму навчання є: зображення магнітокардіограм для  класів; система нормованих полів допусків  на ознаки розпізнавання, що визначає область значень відповідних контрольних допусків, і множина  - попередньо сформовані варіанти ієрархічних структур алфавіту класів розпізнавання. При цьому в кожній страті за базовий приймається клас, для якого формується система контрольних допусків на ознаки розпізнавання.

Розглянемо основні етапи реалізації ієрархічного алгоритму навчання системи розпізнавання в рамках ІЕІ-технології. При цьому обмежимося оптимізацією параметрів функціонування системи розпізнавання тільки для однієї страти ієрархічної структури алфавіту класів.

1.         Обробка зображень у полярній системі координат і формування навчальної матриці , у якій -а ознака розпізнавання у -й реалізації образу обчислюється шляхом усереднення значень яскравості відповідних -складових зображення за формулою

 

                                             ,                                          

 

де       – значення ознаки розпізнавання у -й реалізації образа;

          – значення -складової в -ому пикселі -го кола зчитування 

         яскравості зображення;

          – кількість пикселів у -ому колі зчитування;

          – радіус -го кола зчитування.

2.         Обнуління лічильника варіантів ієрархічних структур (кроків навчання): .

3.        

4.         Обнуління лічильника кроків зміни параметра поля допусків : l:=0;

5.         l:=l+1;

6.         На кожному кроці зміни параметра поля допусків обчислюються нижні  і верхні  контрольні допуски для всіх ознак розпізнавання за формулами

 

                             ;  ,                           (3.9.3)

            де     – вибіркове середнє значення -ої ознаки у навчальній матриці класу .

7. Формується бінарна навчальна матриця   за правилом

 

8.         Для класу  обчислюється двійковий еталонний вектор-реалізація за правилом

 

де  – рівень селекції координат вектора , що за замовчуванням приймається рівним  .

9. Формується структурована множина елементів попарного розбиття , що задає план навчання. Тут  – еталонний вектор найближчого класу  .

10. Обчислюється значення інформаційного КФЕ навчання системи розпізнавати реалізації класу . Наприклад, для двохальтернативної системи оцінок і рівноймовірних гіпотез можна використовувати ентропійний КФЕ (за Шенноном) [1,77]

 

                                                              (3.9.4)

 

де  – помилка першого роду прийняття рішень на k-ому кроці навчання;  – помилка другого роду;  - перша достовірність;  – друга достовірність;  – дистанційна міра, що визначає радіуси гіперсферичних контейнерів, відновлюваних у радіальному базисі простору ознак.

11. Обчислюється за формулою (3.8.4) значення критерію .

12. Якщо у робочій області визначення функції інформаційного КФЕ має місце , то виконується пункт 13, інакше - пункт 14 ().

13.       Якщо , то виконується пункт 5, інакше – пункт 14.

14.       .

15.       .

16.       Для парметру  обчислюються за формулами (3.8.3) оптимальні нижні  і верхні  контрольні допуски на ознаки розпізнавання.

17.       Визначаються оптимальні радіуси контейнерів класів розпізнавання

,

 

де   – максимальне значення КФЕ навчання системи розпізнавати реалізації класу , обчислене при оптимальному параметрі поля допусків .

18.       Обчислюється усереднене значення КФЕ  для всіх страт структури .

19.       Якщо , то виконується пункт 20, інакше – пункт 21.

20.       Якщо  , то виконується пункт 3, інакше – пункт 21.

21.       .

22.       .

23.       Для кожної страти виводяться такі дані: масив  оптимальних двійкових еталонних векторів-реалізацій класів розпізнавання; масиви ,  – нижні і верхні контрольні допуски на ознаки розпізнавання відповідно і масив  оптимальних радіусів контейнерів класів розпізнавання.

24.       ЗУПИН.

Таким чином, у рамках ІЕІ-технології процес навчання системи розпізнавання магнітокардіограм за ієрархічним алгоритмом в загальному випадку зводиться до ітераційної процедури пошуку глобального максимуму інформаційного критерію (3.8.1) у робочій області визначення його функції для різних варіантів ієрархічних структур алфавіту класів розпізнавання й вибору з них оптимальної.

Як приклад розглянемо алфавіт із чотирьох класів магнітокардіограм, окремі реалізації яких показані на рис. 3.23. При цьому клас  характеризує нормальний функціональний стан серцево-судинної системи людини, клас  – ішемічну хворобу серця, клас  – шуми в серце і клас;  – некаронарогенна хвороба серця.

Оскільки магнітокардіограми відносяться до класу нестаціонарних за яскравістю зображень, то для формування навчальної матриці було оброблено за формулою (3.8.2) 40 зображень для кожного класу, що в рамках ІЕІ-технології забезпечило репрезентативність навчальних вибірок.

 

На рис.3.24 показані три можливих варіанти структур даного алфавіту класів розпізнавання.

На рис.3.24 верхній індекс у позначенні класу показує відповідно номера ярусу і страти у ієрархічній структурі. Реалізація вище наведеного ієрархічного алгоритму з оптимізацією структури алфавіту класів показала, що для структури 1 значення усередненого по всіх ярусах і стратам КФЕ дорівнювало , для структури 2 –  і для структури 3 - . У такий спосіб оптимальною в інформаційному розумінні є структура 2. На рис. 3.25 представлено графіки зміни КФЕ (3.8.4), одержані у процесі оптимізації параметрів навчання системи розпізнавати магнітокардіограми першого ярусу ієрархічної структури 2.

Аналіз рис. 3.25 показує, що для розпізнавання класів першого ярусу були одержані безпомилкові за навчальною вибіркою вирішальні правила ().

На рис. 3.26 і рис. 3.27 показано графіки залежності КФЕ (3.9.4) від радіусів контейнерів класів розпізнавання відповідно першої й другої страт другого ярусу структури 2.

Аналіз рис. 3.26 і рис. 3.27 показує, що при побудові вирішальних правил для відповідних класів значення КФЕ навчання системи розпізнавання не досягають своїх граничних значень. Це свідчить, що побудовані вирішальні правила не є безпомилковими за навчальною матрицею. Однак порівняння одержаних результатів з наведеними в роботі [3] показує їхню перевагу, оскільки для однорівневого класифікатора таких же класів значення усередненого критерію дорівнювало  .

У режимі безпосереднього розпізнавання, використовувалася бінарна ієрархічна структура алгоритму іспиту, показана на рис. 3.28.

 

Оцінка достовірності результатів розпізнавання 100 магнітокардіограм для кожного з наведених вище класів у режимі екзамену показала, що повна імовірність правильного розпізнавання реалізацій класів  і  дорівнювала , а для класів  і  – . Таким чином, середнє значення дорівнює , що перевищує опубліковані у роботі  [82]  результати алгоритму екзамену ( для двох класів).