4.4.2.       Специальные методы структурирования

Используя представленный на рис. 4.10 алгоритм, инженер по знаниям может испытывать необходимость в применении специальных методов структурирования на разных шагах алгоритма. При этом, естественно, для таких простых и очевидных шагов, как определение входных и выходных понятий или составление словаря, никаких искусственных методов предлагаться не будет.

Методы выявления объектов, понятий и их атрибутов

Понятие или концепт — это обобщение предметов некоторого класса по их специфическим признакам. Обобщенность является сквозной характеристикой всех когнитивных психических структур, начиная с простейших сенсорных образов. Так, понятие «автомобиль» объединяет множество различных предметов, но все они имеют четыре колеса, двигатель и массу других деталей, позволяющих перевозить на них грузы и людей. Существует ряд методов выявления понятий предметной области в общем словаре терминов, который составлен на основании сеансов извлечения знаний. При этом важно выявление не только самих понятий, но и их признаков.

Возвращаясь к терминологии, введенной в параграфе 1.3, на этом этапе определяются также интенсионалы и экстенсионалы понятий предметной области. Интенсионал очерчивает пбнятие через взаимосвязь значимых признаков, а экстенсионал — через перечисление конкретных экземпляров объекта.

Если задача выделения реальных объектов А связана только с наблюдательностью и лингвистическими способностями эксперта и инженера по знаниям, то определение метапонятий В требует от них умения проводить операции обобщения и классификации, которые никогда не считались тривиальными.

Поспелов Д. А. [Поспелов, 1986] предложил ряд подходов к созданию основ теории обобщения и классификации применительно к ситуационному управлению и искусственному интеллекту в целом, а также выделил ряд особенностей задач формирования понятий. Среди них особое место занимает выявление прагматически значимых признаков для формирования понятий, способствующих решению задачи.

Сложность заключается в том, что для многих понятий практически невозможно однозначно определить их признаки, это связано с различными формами репрезентации понятий в памяти человека.

Все методы выявления понятий мы разделили на:

•    традиционные, основанные на математическом аппарате распознавания образов и классификации;

•    нетрадиционные, основанные на методологии инженерии знаний.

Если первые достаточно хорошо освещены в литературе, то вторые пока менее известны.

Пример 4.8

Интересный эксперимент по выявлению понятий описан в работе [Кук, Макдональд, 1986].

Тридцати студентам, имеющим права на вождение автомобиля, предложили составить словарь терминов предметной области с помощью четырех методов:

1.   Формирование перечня понятий (17 %).

2.   Интервьюирование специалистов (35 %).

3.   Составление списка элементарных действий (18 %).

4.   Составление оглавления учебника (30 %).

Цифры в скобках характеризуют продуктивность соответствующего метода, то есть показывают, какой процент понятий из общего выявленного списка (702 термина) был получен соответствующим методом. Для классификации понятий были привлечены еще два участника эксперимента, которые разделили 702 выявленных понятия на семь категорий (методом сортировки карточек). Таблица 4.5 отражает численные данные концептуализации.

В целом результаты показали, что для выявления непосредственно концептов наиболее результативными оказались методы интервьюирования и составления оглавления учебника. Однако наибольшее число общих правил было порождено в методе списка действий. Таким образом, еще раз подтвердилось утверждение о том, что нет «лучшего» метода, есть методы, подходящие для тех или иных ситуаций и типов знаний.

Интересно, что число правил — продукций «если — то» — составило небольшой процент во всех четырех методах. Это говорит о том, что популярная продукционная модель вряд ли является естественной для человеческих моделей репрезентации знаний.

Методы выявления связей между понятиями

Концепты не существуют независимо, они включены в общую понятийную структуру с помощью отношений. Выявление связей между понятиями при разработке баз знаний доставляет инженеру по знаниям немало проблем. То, что знания в памяти — это некоторые связные структуры, а не отдельные фрагменты, общеизвестно и очевидно. Тем не менее основной упор в существующих моделях представления знаний делается на понятия, а связи вводят весьма примитивные (в основном причинно-следственные).

В последних работах по теории ИИ все больше внимания уделяется взаимосвязанности структур знаний. Так, в работе [Шенк, Бирнбаум, Мей, 1989] введено понятие сценария (script) как некоторой структуры представления знаний. Основу сценария составляет КОП (концептуальная организация памяти) и мета- КОПы — некоторые обобщающие структуры.

Сценарии, в свою очередь, делятся на фрагменты — или сцены (chunks). Связи между фрагментами — временные или пространственные, внутри фрагмента — самые различные: ситуативные, ассоциативные, функциональные и т. д.

Все методы выявления таких связей можно разделить на две группы:

•    Формальные.

•    Неформальные (основаны на дополнительной работе с экспертом). Неформальные методы выявления связей придумывает инженер по знаниям для того, чтобы вынудить эксперта указать явные и неявные связи между понятиями. Наиболее распространенным является метод «сортировка карточек» в группы [Волков, Ломнев, 1989; Rabbits, Wright, 1987], широко применяемый и для формирования понятий. Другим неформальным методом является построение замкнутых кривых. В этом случае эксперта просят обвести замкнутой кривой связанные друг с другом понятия [Olson, Reuter, 1987]. Этот метод может быть реализован как на бумаге, так и на экране дисплея. В этом случае можно говорить

о    привлечении элементов когнитивной графики [Зенкин, 1991].

После того как определены связи между понятиями, все понятия как бы распадаются на группы. Такого рода группы представляют собой метапонятия, присвоение имен которым происходит на следующей стадии процесса структурирования.

Методы выделения метапонятий и детализация понятий (пирамида знаний)

Процесс образования метапонятий, то есть интерпретации групп понятий, полученных на предыдущей стадии, как и обратная процедура — детализация (разукрупнение) понятий, — видимо, принципиально не поддающиеся формализации операции. Они требуют высокой квалификации экспертов, а также наличия способностей к «наклеиванию» лингвистических ярлыков. Если на рис. 4.11 показа-

ны схемы обобщения и детализации на тривиальных примерах, то в реальных предметных областях эта задача оказывается весьма трудоемкой. При этом независимо от того, формальными или неформальными методами были выявлены понятия или детали понятий, присвоение имен которым или интерпретация их — всегда неформальный процесс, в котором инженер по знаниям просит эксперта дать название некоторой группе понятий или отдельных признаков.

Это не всегда удается. Так, в системе АВТАНТЕСТ [Гаврилова, Червинская, 1992] при образовании метапонятий, полученных методами кластерного анализа, интерпретация заняла несколько месяцев и не может считаться удовлетворительной. Это связано с тем, что формальные методы иногда выделяют «искусственные» концепты, в то время как неформальные обычно — практически используемые и потому легко узнаваемые понятия.

Методы построения пирамиды знаний обязательно включают использование наглядного материала — рисунков, схем, кубиков. Уровни пирамиды чаще возникают в сознании инженера по знаниям именно как некоторые образы.

Построение пирамиды знаний может быть основано и на естественной иерархии предметной области, например связанной с организационной структурой предприятия или с уровнем компетентности специалистов (рис. 4.12).

Методы определения отношений

Если на стадии 4 (см. рис. 4.10) мы выявили связи между понятиями и использовали их на стадиях 5 И 6 для получения пирамиды знаний, то на стадии 7 мы даем имена связям, то есть превращаем их в отношения.

В работе [Поспелов, 1986] указывается на наличие более 200 базовых видов различных отношений, существующих между понятиями. Предложены различные классификации отношений [Келасьев, 1984; Поспелов, 1986]. Следует только подчеркнуть, что помимо универсальных отношений (пространственных, временных, причинно-следственных) существуют еще и специфические отношения, присущие той или иной предметной области [Гаврилова, Червинская, Яшин, 1988].

Интересные возможности к структурированию знаний добавляют системы когнитивной графики. Так, в системе OPAL [Olton., Muser, Combs et al., 1987] эксперт может манипулировать на экране дисплея изображениями простейших понятий и строить схемы лечения заболеваний, обозначая отношения явными линиями, которые затем именуются.

Предлагаемая в данном учебнике методология структурирования опирается на современные представления о структуре человеческой памяти и формах репрезентации информации в ней [Величковский, 1982].

Скудность методов структурирования объясняется тем, что методологическая база инженерии знаний только закладывается, а большинство инженеров по знаниям проводит концептуализацию, руководствуясь наиболее дорогими и неэффективными способами — «проб и ошибок» и «по наитию», то есть исходя из соображений здравого смысла.