Научная электронная библиотека
Монографии, изданные в издательстве Российской Академии Естествознания

5.1. Направления развития экспертных систем

В настоящее время разработка и реализация экспертных систем выделилась в самостоятельную инженерную область. Научные исследования сосредоточены в ряде направлений, некоторые из которых перечислены ниже.

5.1.1. Представление знаний и моделирование рассуждений. Это одно из наиболее сформировавшихся направлений искусственного интеллекта. Традиционно к нему относилась разработка формальных языков и программного обеспечения для отображения и описания когнитивных структур. К нему также причисляют исследования по дескриптивной логике, логикам пространства и времени, онтологиям. Пространственная логика позволяет описывать конфигурацию пространственных областей, объектов в пространстве; изучаются также семейства пространственных отношений. В последнее время эта область, из-за тесной связи с прикладными задачами, становится доминирующей. Например, для задач робототехники важно уметь по изображению некоторой сцены восстановить ее словесное описание, чтобы использовать его далее для планирования действий робота. Объектами дескриптивной логики являются концепты (в экспертных системах – базовые структуры для описания объектов) и связанные в единое целое множества концептов (агрегированные объекты). Дескриптивная логика вырабатывает методы работы с такими сложными концептами. Она может быть использована, кроме того, для построения компонентов базы знаний. Онтологические исследования посвящены способам концептуализации знаний и методологическим соображениям о разработке инструментальных средств анализа знаний. Различные способы представления знаний лежат в основе моделирования рассуждений, куда входят: моделирование рассуждений на основе прецедентов, аргументации или ограничений; и моделирование рассуждений с неопределенностью, действиями и изменениями, и др.

Рассмотрим некоторые из них.

CBR (case–based reasoning,моделирование рассуждений на основе прецедентов). Здесь главные проблемы – поиск алгоритмов адаптации, «фокусировка поиска» на использовании прошлого опыта, вывод, основанный на оценке сходства и технологии визуализации. Пусть заданы прецеденты как множество пар <СЛУЧАЙ, РЕШЕНИЕ>, множество зависимостей между различными атрибутами СЛУЧАЕВ и РЕШЕНИЙ, а также целевая проблема, которую нужно решить – ЦЕЛЬ. Для возникающей новой ситуации («нового случая») требуется найти пару <НОВЫЙ СЛУЧАЙ, ИСКОМОЕ РЕШЕНИЕ>, которая и решает целевую проблему.

Алгоритмы для таких задач основаны обычно на сравнении прецедентов с новым случаем, с использованием зависимостей между атрибутами случаев и атрибутами решения. Такие зависимости могут задаваться человеком при построении базы случаев, или обнаруживаться в базе случаев автоматически. При поиске решения для целевой проблемы выполняется адаптация уже имеющегося в базе прецедентов решения. Для этой адаптации и используются означенные зависимости.

Важной проблемой CBR является проблема выбора подходящего прецедента. Естественно искать подходящий прецедент в той области пространства поиска, где находятся решения сходных проблем. Но как
определить, какие именно решения надо считать сходными? Существует гипотеза, что сходство проблем налагает ограничения на сходство соответствующих гипотез, в форме слабой связи между ними. Это обстоятельство и используется для ограничения области поиска решений. Пусть, например, речь идет о некотором клиенте, который (с супругой) желает две недели провести на Канарах и заплатить за это не более полутора тысяч долларов.

Первый вариант диалога с системой, не обладающей способностями к рассуждениям:

Клиент: здравствуйте, я хочу слетать в отпуск на две недели в июле на Канарские острова, со своей женой, но не могу заплатить более полутора тысяч долларов.

Система: извините, но такой возможности у нас нет.

Клиент: хорошо, но может быть, у вас найдется что-нибудь в близком регионе.

Система: не могли бы Вы уточнить, что Вы имеете в виду, говоря о близком регионе.

Клиент: я имею в виду побережье Испании.

Система: но это не близкий регион. Это более 1000 км от Канарских островов!

Клиент: но климат там похожий…

Система: извините, что Вы имеете в виду, говоря о климате...

Скорее всего, клиент обратится в другое турагентство.

Второй вариант диалога с системой, способной рассуждать:

Клиент: я хочу слетать в отпуск на две недели в июле на Канарские острова. Я бы хотел поехать со своей женой, но не могу заплатить более полутора тысяч долларов.

Система: такой возможности сейчас нет. Может, Вас устроит побережье Испании?

Клиент: а как насчет климата, он похож на Канарский климат?

Система: да, и, кроме того, билеты намного дешевле!

Клиент: отлично, забронируйте, пожалуйста.

Из этого, не очень серьезного, примера видно, что:

а) во втором случае клиент имеет дело с системой, которая понимает, что хоть регион и не близок Канарам, но близок клиенту по одному из параметров, во всяком случае, билет дешевле;

б) так как клиент хочет поехать в июле, видимо, его интересуют морские купания и пляжи, а это есть как на Канарах, так и на побережье Испании.

Из этого система делает вывод о сходстве ситуаций (описанной клиентом и имеющейся вакансии в ее базе) и на основании этого полагает, что решение «отдых в Испании» является близким решению «отдых на Канарах».

Методы CBR применяются при решении многих прикладных задач – в медицине, в юриспруденции, в образовании, в управлении проектами, при анализе и реорганизации среды, при разработке товаров массового спроса с учетом предпочтений разных групп потребителей, и т.д.

Следует ожидать приложений методов CBR для задач интеллектуального поиска информации, электронной коммерции (предложение товаров, создание виртуальных торговых агентств), планирования поведения в динамических средах, компоновки, конструирования, синтеза программ.

Моделирование рассуждений на основе ограничений. Наиболее интересны задачи моделирования рассуждений, основанных на процедурных динамических ограничениях. Они мотивированы сложными актуальными задачами – например, планированием в реальной обстановке.
Под задачей удовлетворения ограничений понимается четверка множеств: множество переменных, множество соответствующих областей переменных, множество ограничений на переменные и множество отношений над областями. Решением проблемы удовлетворения ограничений называется набор значений переменных, удовлетворяющих ограничениям на переменные, такой, что при этом области, которым принадлежат эти значения, удовлетворяют отношениям над областями. Задача удовлетворения динамических ограничений – это последовательность задач удовлетворения ограничений, причём каждая последующая задача является ограничением предыдущей задачи. Эти задачи по смыслу близки задачам динамического программирования, так как они также связаны с интервальной алгеброй.

Немонотонные модели рассуждений. Сюда относятся исследования по логике умолчаний, по логике «отменяемых рассуждений», логике программ, теоретико-аргументационой характеризации логик с отменами, характеризации логик с отношениями предпочтения, построению эквивалентных множеств формул для логик с очерчиванием и др. Такие модели возникают при реализации индуктивных рассуждений, по примерам; связаны они также с задачами машинного обучения и некоторыми иными задачами. В задачах моделирования рассуждений на основе индукции источником первоначальных гипотез служат примеры. Если некоторая гипотеза Н возникла на основе N положительных примеров (экспериментального характера), то никто не может дать гарантии, что в базе данных или в поле зрения алгоритма не окажется N + 1-й пример, опровергающий гипотезу (или меняющий степень ее истинности). Это означает, что ревизии должны быть подвержены и все следствия гипотезы H.

Рассуждения о действиях и изменениях. Большая часть работ в этой области посвящена применениям ситуационного исчисления – формализма, предложенного Джоном Маккарти в 1968 году для описания действий, рассуждений о них и эффектов действий. Для преобразования плана поведения робота в исполняемую программу, достигающую с некоторой вероятностью фиксированной цели, вводится специальное логическое исчисление, основанное на ситуационной логике. Для этой логики предложены варианты реализации на языке pGOLOG – версии языка GOLOG, содержащей средства для введения вероятностей. Активно исследуются логики действий, применение модальных логик для рассуждений о знаниях и действиях.

Рассуждения с неопределенностью. Сюда относится использование байесовского вероятностного формализма в системах правил и сетевых моделях. Байесовские сети – это вероятностный статистический метод обнаружения закономерностей в данных. Для этого используется первичная информация, содержащаяся либо в сетевых структурах, либо в базах данных. Под сетевыми структурами понимается в этом случае множество вершин и отношений на них, задаваемое с помощью ребер. Содержательно, ребра интерпретируются как причинные связи. Всякое множество вершин Z, представляющее все пути между некоторыми двумя иными вершинами X и Y, соответствует условной зависимости между этими двумя последними вершинами.

Далее задается некоторое распределение вероятностей на множестве переменных, соответствующих вершинам этого графа, и полученная, но минимизированная сеть, называемая байсовской сетью. На такой сети можно использовать байесовский вывод, т.е. для вычисления вероятностей следствий событий можно использовать формулы теории вероятностей. Иногда рассматриваются гибридные байесовские сети, с вершинами
которых связаны как дискретные, так и непрерывные переменные. Байесовские сети часто применяются для моделирования технических систем.

5.1.2. Приобретение знаний, машинное обучение
и автоматическое порождение гипотез

Работы в области приобретения знаний интеллектуальными системами остаются важнейшим направлением теории и практики искусственного интеллекта. Целью этих работ является создание методологий, технологий и программных средств переноса знаний (компетентности), в базу знаний системы. При этом в качестве источников знаний выступают эксперты (высококвалифицированные специалисты предметных областей), тексты и данные, например, хранимые в базах данных.

Развиваются различные методы приобретения знаний. Машинному обучению в мире уделяется большое внимание. Существует множество алгоритмов машинного обучения. Один из алгоритмов этого класса С4.5 является алгоритмом декомпозиции и строит дерево решений. Исходной информацией для построения этого дерева является множество примеров. С каждой вершиной дерева ассоциируется наиболее часто встречающийся класс примеров. На следующем шаге этот принцип рекурсивно применяется к текущей вершине, т.е. множество примеров, связанных с текущей вершиной также разбивается на подклассы. Алгоритм завершает свою работу либо при удовлетворении некоторого критерия либо при исчерпании подклассов.

Активно исследуются методы обучения причинам действий. Иногда говорят о так называемой теории действий, имея в виду ситуационное исчисление в духе Джона МакКарти. В этой теории причины действий и сами действия описываются в виде клаузальных структур. Один из видов таких структур представляет собой импликацию, левая часть которой есть конъюнкция атомарных формул, а правая состоит из одной атомарной формулы. Методы индуктивного логического программирования модифицируются таким образом, чтобы быть применимыми к поиску таких структур. Когда такие структуры найдены, их можно использовать в языках логического программирования для рассуждений о действиях и их причинах. Многие работы этого направления посвящены «нейронной парадигме». Нейро-сетевой подход используется в огромном количестве задач – для кластеризации информации из Интернета, автоматической генерации локальных каталогов, представления образов в рекурсивных нейронных сетях. Среди активно изучаемых в последнее время тем – неоднородные нейронные модели с отношениями сходства. Это отношение сходства определяется на множестве входов и множестве состояний сети, а мерой сходства является скалярное произведение векторов либо эвклидово расстояние, где один вектор – это вектор входов, а другой распределение весов нейронов, описывающих текущую ситуацию. Работы по автоматическому порождению гипотез связаны с формализацией правдоподобных рассуждений, поиском зависимостей причинно-следственного типа между некоторыми сущностями. В качестве примеров можно привести порождение гипотез о свойствах химических соединений (прогноз биологических активностей), о возможных причинах дефектов (диагностика) и т.п.

5.1.3. Интеллектуальный анализ данных
и обработка образной информации

Это новое направление, основу которого составляют две процедуры: обнаружение закономерностей в исходной информации и использование обнаруженных закономерностей для предсказания – прогнозирования. Сюда относятся задачи выбора информативных данных из большой их совокупности, выбора информативных характеристик некоторого объекта из более широкого множества его характеристик, задачи построения модели, позволяющие вычислять значения выбранных информативных характеристик по значениям других характеристик, и т.п. Значительную часть этого направления составляют исследования по распознаванию изображений с помощью нейронных сетей (включая псевдооптические нейросети). Изучаются методы распознавания последовательностей видеообразов на основе декларативного подхода и извлечения семантически значимой информации. К этому же направлению принадлежат исследования по графической технологии программирования в Интернете.

Динамические интеллектуальные системы и планирование. Это новое направление ИИ, изучающее интеллектуальные программные агенты.

Интеллектуальный агент – это программная система, обладающая:

– автономностью: агенты действуют без непосредственного участия человека и могут в некоторых пределах сами управлять своими действиями;

– социальными чертами: агенты взаимодействуют с другими агентами (и, возможно, человеком) посредством некоторого языка коммуникации;

– реактивностью: агенты воспринимают окружающую среду, которая может быть физическим миром, множеством других агентов, сетью Интернет или комбинацией всего этого, и реагируют на все ее изменения;

– активностью: агенты могут демонстрировать целенаправленное поведение, проявляя при этом собственную инициативу.

Основные задачи в этой области таковы: реализация переговоров интеллектуальных агентов и разработка языков для этой цели, координация поведения агентов, разработка архитектуры языка программирования агентов. Агентские технологии появились примерно 6–7 лет назад. За это время интерес к этим технологиям переместился из сферы академических исследований в сферу коммерческих и промышленных приложений, а идеи и методы агентских технологий весьма быстро мигрировали из искусственного интеллекта в практику разработки программного обеспечения и другие вычислительные дисциплины.

Планирование поведения искусственного интеллекта (ИИ – планирование) – это способность интеллектуальной системы синтезировать последовательность действий для достижения желаемого целевого состояния. Работы по созданию эффективных методов такого синтеза активно ведутся уже около 30 лет. Планирование является основой интеллектуального управления, т.е. автоматического управления автономным целенаправленным поведением программно-технических систем. Среди методов ИИ–планирования сегодня выделяется: классическое планирование, т.е. планирование в условиях статической среды; динамическое планирование, т.е. планирование в условиях изменения среды и учета такого изменения; иерархическое планирование, т.е. когда действия абстрактного плана высокого уровня конкретизируются более детальными планами нижнего уровня, и частично-упорядоченное (монотонное) планирование, когда план строится на основе частично упорядоченного множества подпланов. При этом общий план (элементами которого являются подпланы) обязан быть монотонным, а каждый из подпланов может быть немонотонным.

Монотонность – это такое свойство плана, когда каждое его действие уменьшает различия между текущим состоянием и целью поведения. Например, если план движения робота к цели таков, что каждый его шаг приближает к цели, то план монотонен, но если он наткнулся при этом на препятствие и требуется его обойти, то монотонность плана нарушится. Однако если план обхода препятствия выделить в отдельный подплан и рассматривать его как элемент исходного плана, то монотонность последнего восстановится. Активно ведутся работы и в области распознавания планов, построения планировщиков и расширения их возможностей, эвристического планирования с ресурсными ограничениями, управления планированием посредством временной логики, планирования с использованием графов. Рассматриваются подходы к планированию, при которых построение текущих планов выполняется непрерывно для каждого состояния системы в реальном времени. Для этого предусмотрен непрерывный мониторинг объекта управления. Задачи планирования относятся в наше время к наиболее важным и перспективным направлениям в ИИ.

Динамические интеллектуальные системы – результат интеграции экспертных систем с системами имитационного моделирования. Это двухкомпонентные динамические модели, где один из компонентов – это база знаний, а другой – имеет континуальный характер. Разрабатываются методы выбора логики для описания временных зависимостей при построении динамических интеллектуальных систем.

Работы в области систем поддержки принятия решений посвящены моделированию сложных технических систем, поиску решений в условиях чрезвычайных ситуаций, задачам проектирования систем управления техническими объектами, использованию вероятностных подходов и сценариев при принятии решений.

5.1.4. Обработка естественного языка и пользовательский интерфейс

Это направление связано с разработкой систем поддержки речевого общения, c решением проблем уточнения запроса, с задачами сегментации текстов по темам, с управлением диалогами, с анализом естественного языка и с использованием различных эвристик. Сюда же относится проблема дискурса (речевых процессов вместе с их результатами). Актуальны вопросы контекстного анализа текста, задачи приобретения интеллектуальными системами знаний и извлечения полезной информации из текстов.

Важнейшей задачей в процессе извлечения информации, как и в процессе приобретения знаний, является уменьшение роли эксперта как участника процесса. Причина этому – возрастание потоков текстовой информации, существующий социальный заказ на поиск информации по запросам, анализ и извлечение данных из текстов. Значение методов автоматического анализа текстов будет в дальнейшем возрастать. Предметом исследований является динамическое моделирование пользователя в системах электронной коммерции: представление запросов пользователя, создание адаптивного интерфейса, мониторинг и анализ поведения покупателя.

Нечеткие модели и мягкие вычисления. Это направление представлено нечеткими схемами логических выводов по методу аналогий и подходом к теории нечетких мер с вероятностных позиций. Сюда же входят: нечеткое представление геометрических объектов с помощью аналитических моделей; разработка алгоритмов эволюционного моделирования с динамическими параметрами – например, временем жизни и размером популяции; методы решения оптимизационных задач с использованием технологий генетического поиска, гомеостатических и синергетических принципов, а также элементов самоорганизации.

5.1.5. Разработка инструментальных средств

Это обширная сфера деятельности направления искусственного интеллекта, ставящая перед собой задачи:

а) создания программного обеспечения для приобретения знаний с целью автоматизированного переноса компетентности в базы знаний. В качестве источников компетентности могут выступать не только её носители – эксперты различных областей знаний, но и текстовые материалы – от учебников и энциклопедий до протоколов и архивов, а также базы данных (имплицитные источники знаний). 

Вербализация (перевод таких источников в доступную для понимания форму) составляет содержание методов обнаружения знаний в массивах данных, и методов обучения на примерах (включая предварительную обработку данных для дальнейшего анализа);

б) реализации программных средств поддержки баз знаний;

в) реализации программных средств поддержки проектирования интеллектуальных систем. Набор таких средств содержит редактор текстов, редактор понятий, редактор концептуальных моделей, библиотеку моделей, систему приобретения знаний от экспертов, средства обучения на примерах и ряд других модулей.


Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674