2.6.4 Ієрархічний метод класифікації інформації

 

Система класифікації визначається і характеризується використаним методом класифікації, ознаками, їх послі­довністю і кількістю ступенів класифікації, а також кількістю угруповань (ємністю). Метод класифікації - це сукупність правил створення системи класифікаційних угруповань і їх зв'язки між собою. Ознака класифікації - це властивість об'єкта класифікованої множини, які можуть мати кількісне або якісне значення. Кількість значень ознаки класифікації визначає кількість класифікаційних угруповань, які можуть бути створені при розподілі множини об'єктів за цією ознакою.

Розрізняють два основні методи класифікації:

1) ієрархічний;

2) фасетний.

Ієрархічний метод класифікації характеризується тим, що початкова множина об'єктів техніко-економічної інформації послідовно поділяється на угруповання (класи) першого рівня поділу, далі - на угруповання наступного рівня і т.ін. Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, яку часто зображують у вигляді гіллястого графа, вузлами якого є угруповання (рисунок 2.2).

 

 

 

Кількість рівнів класифікації визначає глибину класифікації. Кожне угруповання може поділяти на угруповання нижчого рівня з використанням своєї ознаки, і глибина класифікації у кожній гілці ієрархічної структури може бути різною.

В ієрархічній класифікації в окремому випадку на кожному рівні поділу може бути використана одна ознака. Це означає, що об'єкти початкової множини характеризуються однаковим набором ознак.

При використанні ієрархічного методу класифікації для віднесення конкретного об'єкта класифікації на кожному ступені лише до одного класифікаційного угруповання необхідно додержуватися таких основних правил:

поділ кожного угруповання виконується лише за однією основою поділу;

одержані на кожному рівні класифікації угруповання не повинні повторюватися;

класифікації мають виконуватися так, аби сума частин становила первинну множину.

Найбільш суттєвими і складними питаннями, що постають при використанні ієрархічного методу класифікації, є вибір системи ознак, що стануть основою поділу, а також їх послідовність. Вибрані ознаки мають бути визначальними в розв'язуванні конкретних техніко-економічних задач, для яких створюється ця система класифікації. При цьому формовані в угрупованні об'єкти повинні мати найбільшу кількість однакових ознак. Вибір послідовності ознак залежить передусім від характеру техніко-економічної інформації

При застосуванні ієрархічного методу класифікації для об'єктів із незалежними ознаками (наприклад, кадрів, продукції тощо) вибір послідовності ознак залежить від статистичних характеристик - частоти та ймовірності звертання до тієї чи іншої ознаки (найчастішим звертанням мають відповідати вищі рівні класифікації).

Ієрархічний метод класифікації характеризується кількістю рівнів класифікації, глибиною, ємністю і гнучкістю. Кількість рівнів визначає глибину класифікації, яка встановлюється залежно від міри необхідної конкретизації угруповань і кількості ознак, які беруть участь у розв'язуванні відповідних задач. Від глибини класифікації та кількості створених на кожному рівні угруповань залежить ємність. Як правило, найбільшу кількість послідовних угруповань, на які може поділяти попереднє угруповання на кожному рівні класифікації, беруть сталою або для всієї класифікації, або для даного рівня. Розділи ідентифікуються однозначним цифровим кодом. Код підрозділу складається з коду розділу та однозначного коду підрозділу.

Переваги цього методу: логічність побудови, чіткість виділення ознак, великий інформаційний обсяг, традиційність і звичність використання, повна пристосованість до ручної обробки інформації, велика інформативність кодів, які мають змістове навантаження.

Недоліки: жорсткість структури, яка зумовлена фіксованістю ознак і заздалегідь встановленим порядком їх проходження, які не допускають включення за відсутності резервного обсягу нових об’єктів класифікаційних угруповань та ознак; неможливість групувати за будь-якою наперед незаданою ознакою; відсутність для стабільності класифікаторів потрібних великих резервних обсягів.