1.2.3.       Разработка естественно-языковых интерфейсов и машинный перевод (natural language processing)

Начиная с 50-х годов одной из популярных тем исследований в области ИИ является компьютерная лингвистика, и, в частности, машинный перевод (МП). Идея машинного перевода оказалась совсем не так проста, как казалось первым исследователям и разработчикам.

Уже первая программа в области естественно-языковых (ЕЯ) интерфейсов — переводчик с английского на русский язык — продемонстрировала неэффективность первоначального подхода, основанного на пословном переводе. Однако еще долго разработчики пытались создать программы на основе морфологического анализа. Неплодотворность такого подхода связана с очевидным фактом: человек может перевести текст только на основе понимания его смысла и в контексте предшествующей информации, или контекста. Иначе появляются переводы в стиле «Моя дорогая Маша — my expensive Masha». В дальнейшем системы МП усложнялись и в настоящее время используется несколько более сложных моделей:

•    применение так называемых «языков-посредников» или языков смысла, в результате происходит дополнительная трансляция «исходный язык оригинала — язык смысла — язык перевода»;

•    ассоциативный поиск аналогичных фрагментов текста и их переводов в специальных текстовых репозиториях или базах данных;

•    структурный подход, включающий последовательный анализ и синтез естественно-языковых сообщений. Традиционно такой подход предполагает наличие нескольких фаз анализа:

1.   Морфологический анализ — анализ слов в тексте.

2.   Синтаксический анализ — разбор состава предложений и грамматических связей между словами.

3.   Семантический анализ — анализ смысла составных частей каждого предложения на основе некоторой предметно-ориентированной базы знаний.

4.   Прагматический анализ — анализ смысла предложений в реальном контексте на основе собственной базы знаний.

Синтез ЕЯ-сообщений включает аналогичные этапы, но несколько в другом порядке. Подробнее см. работы [Попов, 1982; Мальковский, 1985].