7.1.  ВВЕДЕНИЕ

Цель, которую мы преследуем во второй части этой книги, заключается в том, чтобы изложить основы автоматического анализа сцен. Нас будут интересовать методы упрощения и описания изображений при помощи ЭВМ, позволяющие давать ответ на вопросы или выполнять команды такого рода: «Изображен ли на картинке стул?», «Назови все объекты на картинке», «Изображают ли две картинки один и тот же объект?» или в более общем случае: «Опиши сцену». Чтобы читатель почувствовал всю широту данной проблемы, перечислим некоторые из многих применений анализа сцен.

В первых работах р центре внимания было опознавание знаков, имеющее важное практическое значение и по сей день. Опознавание знаков представляет собой скорее задачу классификации, чем составления описания, поэтрму здесь вполне применим математический аппарат, который обсуждался в ч. I. В этом случае, как и вообще в задачах классификации, назначение методов анализа сцен, которые мы будем рассматривать ниже, заключается в выделении множества признаков для классификатора изображений. Интерес к совсем иной области проблем, связан с теми исследованиями специалистов по физике элементарных частиц, в ходе которых получают большое число снимков взаимодействия частиц в пузырьковых и искровых камерах. Задача этих исследований обычно заключается в том, чтобы обнаруживать определенные события путем анализа треков на фотографиях. Третий важный круг задач связан с биомедицинскими исследованиями. Большое число препаратов, изучаемых визуально под микроскопом, которые просматриваются в ходе как клинических, так и чисто научных исследований, послужило естественной причиной разработки методов автоматического анализа. И наконец, как последний пример: существуют роботы-манипуля

торы и роботы-тележки, возможности и гибкость которых значительно возрастают, если они снабжены сенсорными системами, и особенно зрением.

Следует отметить, что само по себе название проблемной области еще ничего не говорит о трудностях, с которыми приходится сталкиваться при решении связанных с этой областью задач анализа сцен. Возьмем в качестве примера опознавание знаков, которое в некоторых отношениях является сравнительно простой областью задач. Трудность задачи опознавания знаков зависит от многих причин: выполнены ли знаки рукой человека или машиной; если машиной, то сколько образцов типографского шрифта использовалось — один иди несколько; если рукой человека, то одним человеком или несколькими и т. д. и т. п. Следовательно, в анализе сцен речь идет не только о большом разнообразии проблемных областей, но и о значительном многообразии задач в пределах одной области. Конечно, было бы наивно предполагать, что единая методика или небольшой набор технических приемов были бы применимы ко всем задачам из такого широкого спектра проблем. На самом деле из-за такого многообразия трудно охарактеризовать анализ сцен в целом: можно лишь отметить, что, по существу, этот процесс является процессом упрощения. Главная проблема заключается в том, чтобы преобразовать изображение, представленное, возможно, десятками тысяч битов информации, в «описание» или «классификацию», представленную лишь несколькими десятками битов. Поэтому нас будут интересовать методы упрощения изображений — подавления несущественных деталей, описания форм и размеров объектов на изображении, объединения отдельных частей изображения в осмысленные образования — и вообще методы уменьшения сложности данных.