3.2. Прогностична класифікація у рамках ІЕІ-технології

 

При прогнозуванні зміни функціонального стану системи розпізнавання, що навчається, доцільне використання непараметричних методів, інваріантних у широкому значенні до законів розподілу ймовірностей. При цьому одержання незміщених оцінок імовірностей можливо безпосередньо у процесі навчання ІС, умови проведення якого можна забезпечити на практиці незмінними.

Перевагою застосування ІЕІ-технології для розв'язання задач прогнозування є оптимізація процесу навчання за інформаційним критерієм, який виступає як загальний КФЕ системи, забезпечуючи цим підвищену достовірність оцінки її функціонального стану на етапі екзамену у вихідний момент прогнозування. Крім того, у процесі реалізації багатоциклічного ітераційного алгоритму оптимізації параметрів навчання за ІЕІ-технологією надається можливість формування екстремальної порядкової статистики (ЕПС)  , яка є одновимірною статистичною прогностичною функцією відповідного стану ІС і обчислюється при екстремальному випробуванні   у момент досягнення КФЕ свого глобального максимуму  в робочій області визначення функції критерію.

Ідея прогнозування функціонального стану ІС, що навчається в рамках ІЕІ-технології, така. У процесі зміни стану системи відбувається переміщення в просторі ознак розпізнавання вершин еталонних векторів . Оскільки геометричні параметри контейнерів класів розпізнавання, які сформовано на попередньому етапі навчання, зберігаються в пам'яті ІС незмінними, то це призводить до зниження достовірності розпізнавання функціональних станів системи. Крім того, змінюються статистичні властивості реалізацій образу, що враховується ЕПС. Таким чином, у процесі прогнозування відстежується зміна як детермінованої складової  тренда вершин еталонних векторів-реалізацій образу, так і статистичної складової, що обумовлює зміну значень ЕПС.

Підтримка необхідної ефективності функціонування системи розпізнавання, що навчається, у процесі її експлуатації або збереження відбувається шляхом перенавчання системи з метою статистичної корекції детермінованих вирішальних правил [57]. Прогнозування моменту перенавчання є важливим так само з погляду оптимізації термінів профілактичних робіт та їх суміщення з етапом перенавчання. У рамках ІЕІ-технології можливі два підходи до змісту етапу перенавчання. Перший підхід передбачає корекцію геометричних параметрів контейнерів класів розпізнавання з урахуванням тренда еталонних векторів і зміни значень ЕПС. Інший підхід базується на тому, що координати двійкових еталонних векторів-реалізацій і реалізацій функціонального стану є наслідком порівняння значень ознак розпізнавання з відповідними полями контрольних допусків. У цьому випадку задачу прогнозування функціонального стану системи, що навчається, може бути зведено до прогнозування зміни в часі нормованих і контрольних полів допусків. Такий підхід є виправданим, наприклад, у задачах прогнозування якості продукції, науково-технічного прогресу в науці та техніці, при економічному прогнозуванні, тобто там, де здійснюється нормативне прогнозування параметрів системи.

Загальним для даних підходів є те, що інтегральна оцінка точності прогнозу    здійснюється шляхом порівняння інформаційних критеріїв, що обчислюються в моменти    і  :

 

                 =Е( t )  E( t-1 ) доп ,                  (3.2.1)

 

де    – допустима похибка прогнозу.

Невиконання відношення (3.2.1) у момент часу  t  обумовлює необхідність перенавчання системи. При цьому накопичення статистичних даних про функціональний стан ІС може відбуватися тільки в період її експлуатації або збереження, при якому відновлення працездатності системи не проводиться.

Таким чином, обов'язковим етапом процесу навчання є відображення вибіркової множини  X  на множину вільних статистик  S, яка обчислюється, на кожному кроці навчання:

                                         Х  S.                                 (3.2.2)

 

Статистика  SS  повинна задовольняти такі вимоги:

бути одновимірною статистичною характеристикою вибіркової множини;

  бути інваріантною до широкого сімейства ймовірнісних мір;

бути чутливою до зміни функціональого стану ІС, що навчається.

Для такої статистики будемо вважати “успіхом” знаходження при випробуванні значення ознаки в своєму полі контрольних допусків. Нехай у процесі проведення випробувань виконується умова рівності ймовірностей знаходження  N  ознак у межах своїх контрольних допусків, тобто  . Тоді ймовірність одержання  k  успіхів – числа ознак, що знаходяться в допуску, визначається за біноміальним розподілом:

           

              ,                          (3.2.3)

 

де  q=1 p  ймовірність виходу значення ознаки за межі поля допусків;   біноміальні коефіцієнти.

Введемо вільну статистику, інваріантну щодо групи всіх  N! перестановок координат  N-вимірного вектора  , j=, яка залежить тільки від обсягу навчальної вибірки. Такою статистикою є нормована статистика числа успіхів за  п  випробувань:

 

             m=,         (3.2.4)

 

де    число успіхів при  j-му випробуванні;            – вибіркове середнє числа успіхів після n  випробувань;   вибіркове середнє числа успіхів після  n  випробувань відповідно.

Відомо, що статистика (3.2.4) має розподіл  2   із степенем свободи k=n1  і не залежить ні від математичного сподівання, ні від дисперсії, а залежить тільки від обсягу випробувань  n. Аналіз виразу (3.2.4) показує, що при збільшенні  n  вибіркова дисперсія збігається до нуля, а функція  , маючи тенденцію до збільшення, набуде якого завгодно великого значення. Таким чином, вільна статистика  Sm,n   є членом варіаційного ряду, тобто порядковою статистикою, ранг якої визначається номером випробування. Наступна теорема встановлює тенденцію зміни асимптотичних меж статистики (3.2.4) при зміні числа успіхів при випробуваннях.

Т е о р е м а 3.2.1 Нехай дано послідовність незалежних випадкових величин   і , таких, що    і  , де  , при цьому  . Тоді для будь-якого    при    має місце:

 

;  ,

 

де   – статистики (3.2.4) з числом успіхів    відповідно.

Д о в е д е н н я. Оскільки  ,   і  , то  . Подамо статистику    у вигляді:

 

.

 

Як відомо, статистика    має властивість [47]:

 

,

 

тобто математичне сподівання статистики    залежить тільки від обсягу вибірки.

Для першої послідовності маємо:

 

             (3.2.5)

де  .

Для іншої послідовності такого самого обсягу, як і перша, аналогічно:

 

                                                          (3.2.6)

 

де  .

Обчислення ймовірностей (3.2.5) і (3.2.6) здійснимо за формулою [48]

 

                   ,                       (3.2.7)

 

де    функція щільності розподілу  .

Якщо виявиться, що  , то теорему доведено. Функція щільності розподілу    дорівнює [48]

 

          (3.2.8)

        

де    гамма-функція;  t  значення випадкової величини  .

Після підстановки (3.2.8) у формулу (3.2.7) маємо:

 

           ,  (3.2.9)

 

де   неповна гамма-функція.

     При цьому

 

                .                (3.2.10)

 

Оскільки    і підінтегральний вираз у (3.2.9) не містить періодичної функції, то

 

,

 

або  , а з урахуванням (3.2.10)  ,  що і вимагало доведення.

Мають місце такі наслідки з теореми 3.2.1.

Н а с л і д о к 1. Якщо послідовності незалежних випадкових величин  , які відповідають умовам теореми 3.2.1, розподілено нормально з вибірковими дисперсіям    відповідно і  , то має місце  .

Н а с л і д о к 2. Якщо послідовності незалежних випадкових величин  , які відповідають умовам теореми 3.2.1, розподілені нормально з вибірковими дисперсіями    відповідно і   , то з імовірністю одиниця має місце  , що випливає із наслідку 1.