§ 7.1. Нечеткий язык и его свойства

Формальным языком S обычно называют множество символьных конструкций (например, слов, цепочек символов, включая нулевую Хо в некотором алфавите Ѵт). Однако непосредственное перечисление элементов языка который может быть и бесконечным, в большем числе случаев невозможно и поэтому язык определяют при помощи конечных описаний. Выделяют три основных способа описания [1].

Порождающие правила. В этом случае имеется множество правил, называемых грамматикой, которые порождают в точности те последовательности (слова) из множества всех конечных последовательностей в алфавите Ѵт, которые принадлежат языку S’.

Применение распознающего автомата. Рассматривается конечный автомат, в котором выделено начальное состояние и множество заключительных состояний. Автомат, начав работать, из начального состояния попадает в заключительное только в том случае, когда поступающая на вход конструкция (цепочка) принадлежит S, т. е. автомат распознает (или допускает) только слова из S.

Алгебраическое описание. Язык строится в результате применения к базисным множествам операций из заданного списка.

Нечеткое подмножество конечных последовательностей в некотором алфавите естественно называть нечетким языком (НЯ). Тогда по аналогии с обычным формальным языком возможны, по крайней мере, три способа описания НЯ: нечеткие грамматики, нечеткие автоматы, нечеткие алгебраические выражения.

В этой главе основные определения и результаты теории формальных языков обобщаются на случай НЯ.

Определение 7.1. Нечетким языком S в конечном алфавите Ѵт называется нечеткое подмножество множества всех конечных цепочек = {х}, полученных с помощью конкатенации элементов Ѵт:

где ц^{х) является степенью принадлежности х языку S’и может

быть интерпретирована как степень правильности цепочки х или степень возможности ее использования.

Пусть {S (Ft)} = l(F*) множество всех НЯ в алфавите Ѵт; X, и, ysF*. Определим операции в ^l(Ft). Операции объединения (2^,11 З’г) пересечения (2^,0 З’г) и дополнения (S’) над НЯ определяются аналогично соответствующим операциям над НМ типа 1, приведенным в первой главе.

Конкатенация  (если 2^1 = 2^2, то обозначаем

= sS)-.

Замыкание Клини:  где Л — пустой язык с функцией принадлежности

% — пустое слово длины 0. Для любого х е V*, х = аіЯг... Яа, ^ е Ft; і = 1, ..., к; к — длина слова, принадлежность замыканию Клини вычисляется следующим образом:

Говорят, что S’ замкнут, если S = S. В [19] доказано, что S замкнут тогда и только тогда, когда для любых и, ѵе.Ѵт

Нусть {2^1 (Ft)} с: {S’(Ft)} — некоторый класс языков. Говорят, что {S’,(Ft)} замкнут относительно операции *, если применение операции * не выводит из {Si{Vt)).

Нечеткий язык с набором семантических правил. Большую часть теории формальных языков легко обобщить на нечеткое множество цепочек. Однако, как показано в [35—37], полученные теории еще далеки от создания адекватной модели естественного языка. Это связано с тем, что возникают существенные трудности в установлении соответствия между множеством объектов или конструкций и пх описываемыми цепочками слов. Чтобы явно рассмотреть эти соответствия, в [36] дается следующее более широкое определение НЯ.

НЯ — это четверка S = <U, Т, Е, ІѴ>, в которой С/— область рассуждений (например, множество объектов, действий, отношений, понятий); Т — терм-множество (нечеткое множество термов:

T=>{(t, Цт{і)): t^T, Г —множество термов, ц,і. (О ~ степень правильности t), Е — множество символов (и их комбинаций), из которых строятся наименования термов; N — отношение соответствия множества термов и значений из области рассуждений (отношение наименования, n,w(f, и) — степень, с которой терм t соответствует элементу U).

Когда Т и и — множества с небольшим числом элементов, (ijf и легко явно определить, например с помощью таблицы.

Однако в общем случае Т ж U являются бесконечными множествами, и при определении Т VI и требуется, чтобы они были наделены структурой, позволяющей вычисление ц,т и ц,;?. Следовательно, необходимо понятие структурного нечеткого языка:

где St — множество синтаксических правил S’, задающих алгоритм вычисления Цт; — множество семантических правил, задающих алгоритм вычисления ІІжЕ определены выше. Соотношение U, St, Е, Sm изображено на рис. 7.1.

Очевидно, что формальный НЯ (на рис. 7.1 обведен пунктирной линией) является частным случаем НЯ, определенного выше, в котором рассматриваются только Т ж Е: = Ѵт = Е. Далее будем рассматривать НЯ из определения 7.1.

В последующих параграфах рассматриваются различные способы описания и получаемые на их основе свойства НЯ.