Программа дисциплины «Базы данных и экспертные системы» учебно-методические материалы Редакция №1 от 01. 09. 2013 учебно-методический комплекс дисциплины «Базы данных и экспертные системы»


НазваниеПрограмма дисциплины «Базы данных и экспертные системы» учебно-методические материалы Редакция №1 от 01. 09. 2013 учебно-методический комплекс дисциплины «Базы данных и экспертные системы»
страница4/10
Дата публикации25.12.2013
Размер1.56 Mb.
ТипПрограмма дисциплины
referatdb.ru > Информатика > Программа дисциплины
1   2   3   4   5   6   7   8   9   10
характеризует сложность решаемых задач и связан с типом используемой ЭВМ.

По этому признаку различают:

  • малые ЭС - предназначены для первичного обучения и исследования возможности применения технологии ЭС для рассматриваемого класса задач. Системы такого типа могут быть реализованы на персональных компьютерах;

  • средние ЭС - охватывают весь спектр необходимых приложений и обычно интегрированы сбазами данных, электронными таблицами и т.д. Системы такого масштаба чаще всего реализуются на рабочих станциях;

  • большие ЭС - имеют доступ к мощным базам данных и реализуются на рабочих станциях или на специализированных компьютерах;

  • символьные ЭС - создаются с исследовательскими целями и реализуются на специализированных компьютерах, ориентированных на обработку символьных данных.

Понятие проблемной среды включает описание предметной области (множество сущностей, описывающих множество объектов, их характеристик и отношений между объектами) и решаемых в ней задач. Другими словами, проблемная среда включает структуры данных и решаемые с ними задачи, представленные в виде исполняемых утверждений (правил, процедур, формул и др.). В связи с этим проблемная среда определяется характеристиками соответствующей предметной области и характеристиками типов решаемых в ней задач.

Характеристики предметной области.

1. Тип предметной области:

  • статический - входные данные не изменяются за время сеанса работы приложения, значения других (не входных) данных изменяются только самой экспертной системой;

  • динамический - входные данные, поступающие из внешних источников, изменяются во времени, значения других данных изменяются ЭС или подсистемой моделирования внешнего окружения.

2. Способ описания сущностей предметной области:

  • совокупность атрибутов и их значений (фиксированный состав сущностей);

  • совокупность классов (объектов) и их экземпляров (изменяемый состав сущностей).

3. Способ организации сущностей в БЗ:

  • неструктурированная БЗ;

  • структурирование сущностей в БЗ по различным иерархиям, («частное - общее», «часть - целое», «род - вид»), что обеспечивает наследование свойств сущностей.

Структурирование БЗ способствует:

  • ограничению круга сущностей, которые должны рассматриваться механизмом вывода, и сокращению количества перебираемых вариантов в процессе выбора решения;

  • обеспечению наследования свойств сущностей, т.е. передачи свойств вышерасположенных в иерархии сущностей нижерасположенным сущностям, что значительно упрощает процесс приобретения и использо-вания знаний.

Характеристики типов решаемых в проблемной области задач.

    1. Тип решаемых задач:

      • задачи анализа или синтеза. В задаче анализа задана модель сущности и требуется определить неизвестные характеристики модели. В задаче синтеза задаются условия, которым должны удовлетворять характеристики «неизвестной» модели сущности, и требуется построить модель этой сущности. Решение задачи синтеза обычно включает задачу анализа как составную часть;

      • статические или динамические задачи. Если задачи, решаемые ЭС, явно не учитывают фактор времени и/или не изменяют в процессе своего решения знания об окружающем мире, то ЭС решает статические задачи, в противном случае речь идет о решении динамических задач. Учитывая значимость времени в динамических проблемных средах, многие специалисты называют их приложениями, работающими в реальном времени. Обычно выделяют следующие системы реального времени: псевдореального времени, «мягкого» реального времени и «жесткого» реального времени. Системы псевдореального времени, как следует из названия, не являются системами реального времени, однако они, в отличие от статических систем, получают и обрабатывают данные, поступающие из внешних источников. Системы псевдореального времени решают задачу быстрее, чем происходят значимые изменения информации об окружающем мире.

    2. Общность исполняемых утверждений:

  • частные исполняемые утверждения, содержащие ссылки на конкретные сущности (объекты);

  • общие исполняемые утверждения, относящиеся к любым сущностям заданного типа (вне зависимости от их числа и имени). Использование общих утверждений позволяет значительно лаконичнее представлять знания. Однако поскольку общие утверждения не содержат явных ссылок на конкретные сущности, для их использования каждый раз требуется определять те сущности, к которым они должны применяться.

Не все сочетания перечисленных выше параметров, характеризующих проблемную среду, встречаются на практике. Наиболее распространены следующие типы проблемных сред:

  • статическая предметная область:

представление сущностей в виде совокупности атрибутов и их значений, неизменяемый состав сущностей, БЗ не структурирована, решаются статические задачи анализа, используются только частные исполняемые утверждения;

представление сущностей объектами, изменяемый состав сущностей, БЗ структурирована, решаются статические задачи анализа и синтеза, используются общие и частные исполняемые утверждения;

  • динамическая предметная область:

представление сущностей совокупностью атрибутов и их значений, неизменяемый состав сущностей, БЗ не структурирована, решаются динамические задачи анализа, используются частные исполняемые утверждения;

представление сущностей в виде объектов, изменяемый состав сущностей, БЗ структурирована, решаются динамические задачи анализа и синтеза, используются общие и частные исполняемые утверждения.

В ЭС различают следующие типы решения задач:

  • интерпретация данных - процесс определения смысла данных, результаты которого должны быть согласованными и корректными. Экспертные системы, как правило, проводят многовариантный анализ данных;

  • диагностика - процесс соотнесения объекта с некоторым классом объектов и/или обнаружение неисправностей в системе (отклонений параметров системы от нормативных значений);

  • мониторинг - непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы;

  • проектирование - создание ранее не существовавшего объекта и подготовка спецификаций на создание объектов с заранее определенными свойствами. Степень новизны может быть разной и определяется видом знаний, заложенных в ЭС, и методами их обработки. Для организации эффективного проектирования требуется формировать не только сами проектные решения, но и мотивы их принятия. ЭС, решающие задачи проектирования, реализуют процедуры вывода решения и объяснения полученных результатов;

  • прогнозирование - предсказание последствий некоторых событий или явлений на основе анализа имеющихся данных. Прогнозирующие ЭС логически выводят вероятные следствия из заданных ситуаций. В прогнозирующих ЭС в большинстве случаев используются динамические модели, в которых значения параметров «подгоняются» под заданную ситуацию. Выводимые из этих моделей следствия составляют основу для прогнозов с вероятностными оценками;

  • планирование - построение планов действий объектов, способных выполнять некоторые функции. Работа ЭС по планированию основана на моделях поведения реальных объектов, которые позволяют проводить логический вывод последствий планируемой деятельности;

  • обучение - использование компьютера для обучения каким-либо дисциплине или предмету. Экспертные системы обучения выполняют такие функции, как диагностика ошибок, подсказывание правильных решений; аккумулирование знаний о гипотетическом «ученике» и его характерных ошибках; диагностирование слабости в познаниях обучаемых и нахождение соответствующих средств для их ликвидации. Системы обучения способны планировать акт общения с учеником в зависимости от успехов ученика для передачи необходимых знаний;

  • управление - функция организованной системы, поддерживающая определен-ный режим ее деятельности. Экспертные системы данного типа предназна-чены для управления поведением сложных систем в соответствии с заданными спецификациями;

  • поддержка принятия решений - совокупность процедур, обеспечивающая лицо, принимающее решения, необходимой информацией и рекомендациями, облегчающими процесс принятия решения. Такого рода ЭС оказывают помощь специалистам в выборе и/или генерации наиболее рациональной альтернативы из множества возможных при принятии ответственных решений.

Задачи интерпретации данных, диагностики, поддержки принятия решений относятся к задачам анализа, задачи проектирования, планирования и управления - к задачам синтеза. К комбинированному типу задач относятся обучение, мониторинг и прогнозирование.

Характеристика инструментальных средств разработки ИИС.

Трудоемкость разработки ИИС в значительной степени зависит от используемых инструментальных средств (ИС). Инструментальные средства для разработки интеллектуальных приложений можно классифицировать по следующим основным параметрам:

- уровень используемого языка;

- парадигмы программирования и механизмы реализации;

- способ представления знаний;

- механизмы вывода и моделирования;

- средства приобретения знаний;

- технологии разработки приложений.

Мощность и универсальность языка программирования определяет трудоемкость разработки ЭС:

  1. традиционные (в том числе объектно-ориентированные) языки програм-мирования типа С, C++ (как правило, они используются не для создания ЭС, а для создания инструментальных средств);

  2. специальные языки программирования (например, язык LISP, ориенти-рованный на обработку списков; язык логического программирования PROLOG; язык рекурсивных функций РЕФАЛ и др.). Их недостатком является слабая приспособленность к объединению с программами, написанными на языках традиционного программирования;

  3. инструментальные средства, содержащие многие, но не все компоненты ЭС. Такое программное обеспечение предназначено для разработчиков, владеющих технологиями программирования умеющих интегрировать разнородные компоненты в программный комплекс.

  4. оболочки ЭС общего назначения, содержащие все программные компоненты, но не имеющие знаний о конкретных предметных средах. Средства этого типа и последующего не требуют от разработчика приложения знания программирования. Примерами являются ЭКО, Leonardo, Nexpert Object, Kappa, EXSYS, GURU, ART, KEE и др. В последнее время все реже употребляется термин «оболочка», его заменяют более широким термином «среда разработки». Если хотят подчеркнуть, что средство используется не только на стадии разработки приложения, но и на стадиях использования и сопровождения, то употребляют термин «полная среда» (complete environment). Для поддержания всего цикла создания и сопровождения программ используются интегрированные инструментальные системы типа Work Bench, например KEATS, VITAL. Основными компонентами системы KEATS являются: ACQUIST - средства фрагментирования текстовых источников знаний, позволяющие разбивать текст или протокол беседы с экспертом на множество взаимосвязанных, аннотированных фрагментов и создавать понятия (концепты); FLIK - язык представления знаний средствами фреймовой модели; GIS - графический интерфейс, используемый для создания гипертекстов и концептуальных моделей, а также для проектирования фреймовых систем; ERI - интерпретатор правил, реализующий процедуры прямого и обратного вывода; TRI — инструмент визуализации логического вывода, демонстрирующий последовательность выполнения правил; Tables - интерфейс манипулирования таблицами, используемыми для хранения знаний в БЗ; CS — язык описания и распространения ограничений; TMS -немонотонная система поддержания истинности. При использовании инструментария данного типа могут возникнуть следующие трудности:

  • управляющие стратегии, заложенные в механизм вывода, могут не соответствовать методам решения, которые использует эксперт, взаимо-действующий с данной системой, что может привести к неэффективным, а возможно, и неправильным решениям;

  • способ представления знаний, используемый в инструментарии, мало подходит для описания знаний конкретной предметной области.

  1. Проблемно/предметно-ориентированные оболочки и среды (не требуют знания программирования):

  • проблемно-ориентированные средства, предназначеные для решения задач определенного класса (задачи поиска, управления, планирования, прогно-зирования и др.) и содержат соответствующие этому классу функциональ-ные модули;

  • предметно-ориентированные средства, использующие знания о типах предметных областей, что сокращает время разработки БЗ.

При использовании оболочек и сред разработчик приложения полностью освобождается от программирования, его основные трудозатраты связаны с формированием базы знаний.

Способы реализации механизма исполняемых утверждений часто называют парадигмами программирования. К основным парадигмам относят следующие:

  • процедурное программирование;

  • программирование, ориентированное на данные;

  • программирование, ориентированное на правила;

  • объектно-ориентированное программирование.

Парадигма процедурного программирования является самой распростра-ненной среди существующих языков программирования (например, С и Паскаль). В процедурной парадигме активная роль отводится процедурам, а не данным; причем любая процедура активизируется вызовом. Подобные способы задания поведения удобны для описаний детерминированной последовательности действий одного процесса или нескольких взаимосвязанных процессов.

При использовании программирования, ориентированного на данные, активная роль принадлежит данным, а не процедурам. Здесь со структурами активных данных связывают некоторые действия (процедуры), которые активизируются тогда, когда осуществляется обращение к этим данным.

В парадигме, ориентированной на правила, поведение определяется множеством правил вида «условие-действие». Условие задает образ данных, при возникновении которого действие правила может быть выполнено. Правила в данной парадигме играют такую же роль, как и операторы в процедурной парадигме. Однако если в процедурной парадигме поведение задается детерминированной последовательностью операторов, не зависящей от значений обрабатываемых данных, то в парадигме, ориентированной на правила, поведение не задается заранее предписанной последовательностью правил, а формируется на основе значений Данных, которые в текущий момент обрабатываются программой. Подход, ориентированный на правила, удобен для описания поведения, гибко и разнообразно реагирующего на большое многообразие состояний данных.

Парадигма объектного программирования в отличие от процедурной парадигмы не разделяет программу на процедуры и данные. Здесь программа организуется вокруг сущностей, называемых объектами, которые включают локальные процедуры (методы) и локальные данные (переменные). Поведение (функционирование) в этой парадигме организуется путем пересылки сообщений между объектами. Объект, получив сообщение, осуществляет его локальную интерпретацию, основываясь на локальных процедурах и данных. Такой подход позволяет описывать сложные системы наиболее естественным образом, что особенно удобно для интегрированных ЭС.

Наличие многих способов представления знаний вызвано стремлением представить различные типы проблемных сред с наибольшей эффективностью. Обычно способ представления знаний в ЭС характеризуют моделью представления знаний. Типичными моделями представления знаний являются правила (продукции), фреймы (или объекты), семантические сети, логические формулы. Инструментальные средства, имеющие в своем составе более одной модели представления знаний, называют гибридными. Большинство современных средств, как правило, использует объектно-ориентированную парадигму, объединенную с парадигмой, ориентированной на правила.

В статических ЭС единственным агентом, изменяющим информацию, является механизм вывода экспертной системы. В динамических ЭС изменение данных происходит не только вследствие функционирования механизма исполняемых утверждений, но также в связи с изменениями окружения задачи, которые моделируются специальной подсистемой или поступают извне.

Механизмы вывода в различных средах могут отличаться способами реализации следующих процедур.

  1. Структура процесса получения решения:

    • построение дерева вывода на основе обучающей выборки (индуктивные методы приобретения знаний) и выбор маршрута на дереве вывода в режиме решения задачи;

    • компиляция сети вывода из специфических правил в режиме приобретения знаний и поиск решения на сети вывода в режиме решения задачи;

    • генерация сети вывода и поиск решения в режиме решения задачи, при этом генерация сети вывода осуществляется в ходе выполнения операции сопоставления, определяющей пары «правило — совокупность данных», на которых условия этого правила удовлетворяются;

    • в режиме решения задач ЭС осуществляет выработку правдоподобных предположений (при отсутствии достаточной информации для решения); выполнение рассуждений по обоснованию (опровержению) предполо-жений; генерацию альтернативных сетей вывода; поиск решения в сетях вывода.

2. Поиск (выбор) решения:

  • направление поиска - от данных к цели, от целей к данным, двунаправ-ленный поиск;

  • порядок перебора вершин в сети вывода

а) «поиск в ширину», при котором сначала обрабатываются все вершины, непосредственно связанные с текущей обрабатываемой вершиной G;

б) «поиск в глубину», когда сначала раскрывается одна наиболее значимая вершина – G1, связанная с текущей G, затем вершина G1 делается текущей, и для нее раскрывается одна наиболее значимая вершина G2 и т. д.

3. Процесс генерации предположений и сети вывода:

  • режим - генерация в режиме приобретения знаний, генерация в режиме решения задачи;

  • полнота генерируемой сети вывода - операция сопоставления, применяемая ко всем правилам и ко всем типам указанных в правилах сущностей в каждом цикле работы механизма вывода; используются различные средства для сокращения количества правил и (или) сущностей, участвующих в операции сопоставления; например, применяется алгоритм сопоставления или используются знания более общего характера (метазнания).

Механизм вывода для динамических проблемных сред дополнительно содержит: планировщик, управляющий деятельностью ЭС в соответствии с приоритетами; средства, гарантирующие получение лучшего решения в условиях ограниченности ресурсов; систему поддержания истинности значений переменных, изменяющихся во времени. В динамических инструментальных средствах могут быть реализованы следующие варианты подсистемы моделирования:

  • система моделирования отсутствует;

  • существует система моделирования общего назначения, являющаяся частью инструментальной среды; |

  • существует специализированная система моделирования, являющаяся внешней по отношению к программному обеспечению, на котором реализуется ЭС.

В инструментальных системах средства приобретения знаний характеризуются следующими признаками:

    1. Уровень языка приобретения знаний: формальный язык; ограниченный естественный язык; язык пиктограмм и изображений; ЕЯ и язык изображений.

    2. Тип приобретаемых знаний: данные в виде таблиц, содержащих значения входных и выходных атрибутов, по которым индуктивными методами строится дерево вывода; специализированные правила; общие и специализированные правила.

    3. Тип приобретаемых данных: атрибуты и значения; объекты; классы структурированных объектов и их экземпляры, получающие значения атрибутов путем наследования.


ЛЕКЦИЯ 4. Состав и организация данных и знаний в ЭС.
В лекции рассмотрены вопросы отличия знаний от данных, характеристика основных признаков по которым классифицируются знания, а также модели представления знаний в виде продукций, фреймов, семантических сетей.
Отличия знаний от данных.

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, обрабатываемых ЭВМ. Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

  • исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графики и т.д.);

  • представление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;

  • базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания могут быть получены на основе обработки эмпирических данных. Они представ-ляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два способа наделения знаниями программных систем:

  • первый способ предусматривает поместить знания в программу, написанную на обычном языке программирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. В этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Трудным делом является модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой;

  • второй способ базируется на концепции баз данных и заключается в вынесении знаний в отдельную категорию, то есть знания представляются в определенном формате и помещаются в БЗ. База знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограничения на структуру БЗ и операции с нею. В современных ИИС принят этот способ.

При разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ. Знания в ИИС существуют в следующих формах:

  • исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы);

  • описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть, иерархии фреймов);

  • представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ;

  • базы знаний на машинных носителях информации.

В области ИИ даются конкретные определения знаний. «Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области». «Знания - это хорошо структурированные данные или данные о данных, или метаданные». «Знания - формализованная информация, на которую ссылаются или используют в процессе логического вывода».

Существует множество классификаций знаний. Как правило, с помощью классификаций систематизируют знания конкретных предметных областей. По своей природе знания можно разделить на декларативные и процедурные знания. Декларативные знания - это описания фактов и явлений. Процедурные знания - это описания действий, которые возможны при манипулировании фактами и явлениями для достижения намеченных целей.

Для описания знаний на абстрактном уровне разработаны специальные языки описания знаний. Эти языки также делятся на языки процедурного типа и декларативного. Все языки описания знаний, ориентированные на использование традиционных компьютеров фон-неймановской архитектуры, являются языками процедурного типа. Разработка языков декларативного типа, удобных для представления знаний, является актуальной проблемой.

По способу приобретения знания можно разделить на факты и эвристику (правила, которые позволяют сделать выбор при отсутствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной предметной области обстоятельства. Вторая категория знаний основана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила. Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции, - это знания типа «если А, то В».

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффективной организации процедур логического вывода.

Форма представления знаний оказывает существенное влияние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать невозможно. Поэтому в интеллектуальных системах требуется четко разделить знания на те, которые предназначены для обработки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, иначе неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представления знаний следует учитывать такие факторы, как однородность представления и простота понимания. Однородность представления приводит к упрощению механизма управления знаниями. Простота понимания важна для пользователей интеллектуальных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации знаний.

Организация данных в рабочей памяти ЭС.

Рабочая память (РП) экспертных систем предназначена для хранения данных. Данные в рабочей памяти делятся на уровни по типам данных. Выделение уровней усложняет структуру экспертной системы, однако делает ее более эффективной. Например, можно выделить уровень планов, уровень агенды (упорядоченного списка правил, готовых к выполнению), уровень данных предметной области, уровень решений. В рабочей памяти современных экспертных систем рассматри-ваются как изолированные, так и связанные данные. В первом случае рабочая память состоит из множества простых элементов, а втором - из одного или нескольких (при нескольких уровнях в РП) сложных элементов (например, объектов). При этом сложный элемент соответствует множеству простых элементов, объединенных в единую сущ­ность. Теоретически оба подхода обеспечивают полноту, но использование изолированных элементов в сложных предметных областях приводит к потере эффективности. Данные в РП в простейшем случае являются константами и (или) переменными. При этом переменные могут рассматриваться как характеристики некоторого объекта, а константы - как значения соответствующих характеристик. Если в РП требуется анализировать одновременно несколько различных объектов, описывающих текущую проблемную ситуацию, то необходимо указывать, к каким объектам относятся рассматриваемые характеристики. Одним из способов решения этой задачи является явное указание того, к какому объекту относится характеристика. Если РП состоит из сложных элементов, то связь между отдель­ными объектами указывается явно, например заданием семантиче­ских отношений. При этом каждый объект может иметь свою внутреннюю структуру. Для ускорения поиска и сопоставления данных в РП используются не только логические, но и ассоциативные связи.

Показателем интеллектуальности системы с точки зрения пред­ставления знаний считается способность системы использовать в нужный момент необходимые (релевантные) знания. Системы, не имеющие средств для определения релевантных знаний, неизбежно сталкиваются с проблемой «комбинаторного взрыва». Можно утверждать, что эта проблема является одной из основных причин, ограничивающих сферу применения экспертных систем. В проблеме доступа к знаниям можно выделить три аспекта: связность знаний и данных, механизм доступа к знаниям и способ сопоставления.

Организация знаний в БЗ.

Связность знаний является основным способом, обес­печивающим ускорение поиска релевантных знаний. Для этого знания следует организовы­вать вокруг наиболее важных объектов (сущностей) предметной об­ласти. Все знания, характеризующие некоторую сущность, связывают­ся и представляются в виде отдельного объекта. При подобной орга­низации знаний, если системе потребовалась информация о некоторой сущности, то она ищет объект, описывающий эту сущность, а затем уже внутри объекта отыскивает информацию о данной сущности.

В объектах целесообразно выделять два типа связок между элемента­ми: внешние и внутренние. Внутренние связки объединяют элементы в единый объект и предназначены для выражения структуры объекта. Внешние связки отражают взаимозависимости, существующие между объектами в области экспертизы.

Внешние связки бывают логические и ассоциативные. Логические связки выражают семантические отношения между элементами зна­ний. Ассоциативные связки предназначены для обеспечения взаимо­связей, способствующих ускорению процесса поиска релевантных знаний. Основной проблемой при работе с большой базой знаний яв­ляется проблема поиска знаний, релевантных решаемой задаче. Очевидно, что упорядочение и структурирование знаний могут значительно ускорить процесс поиска. Нахождение желаемых объектов в общем случае уместно рассматривать как двухэтапный процесс. На первом этапе, соответствующем процессу выбора по ассоциативным связкам, совершается предварительный выбор в базе знаний потенциальных кандидатов в качестве желаемых объектов. На втором этапе путем выполнения операции сопоставления потенциальных кандидатов с описаниями кандидатов осуществляется окончательный выбор искомых объектов. При организации подобного механизма доступа возникают определенные трудности с выбором критерия пригодности кандидата, организации работы в конфликтных ситуациях и др. Операция сопоставления может использоваться не только как средство выбора нужного объекта из множества кандидатов, но и для классификации, подтверждения, декомпозиции и коррекции. Для идентификации неизвестного объекта он мо­жет быть сопоставлен с некоторыми известными образцами. Это позволит классифицировать неизвестный объект как такой известный образец, при сопоставлении с которым были получены лучшие результаты. Если осуществлять сопоставление некоторого известного объекта с неизвестным описанием, то в случае успешного сопоставления будет осуществлена частичная декомпозиция описания.

Операции сопоставления весьма разнообразны. Обычно выделяют следующие их формы: синтаксическое, параметрическое, семантическое и принуждаемое сопоставления.

В случае синтаксического сопоставления соотносят формы (образцы), а не содержание объектов, Успешным является сопоставление, в результате которого образцы оказываются идентичными. Обычно считается, что переменная одного образца может быть идентична любой константе (или выражению) другого образца. Иногда на переменные, входящие в образец, накладывают требования, определяющие тип констант, с которыми они могут сопоставляться Результат синтаксического сопоставления является бинарным: образцы сопоставляются или не сопоставляются.

В параметрическом сопоставлении вводится параметр, определяющий степень сопоставления.

В случае семантического сопоставления соотносятся не образцы объектов, а их функции.

В случае принуждаемого сопоставления один сопоставляемый образец рассматривается с точки зрения другого. В отличие от других типов сопоставления здесь всегда может быть получен положительный результат. Вопрос состо­ит в силе принуждения и использовании специальных процедур, связываемых с объектами.

Модели представления знаний в ЭС.

Выбор модели представления знания часто сводят к обсуждению баланса между деклара­тивным (ДП) и процедурным представлением (ПП). Различие между ДП и ПП можно выразить различием между вопросами «знать, что?» и «знать, как?». Процедурное представление основано на предпосылке, что интеллектуальная деятельность есть знание проблемной среды, вложенное в програм­мы, то есть знание о том, как можно использовать те или иные сущности. Декларативное представление основано на предпосылке, что знание неких сущностей «знать, что?» не имеет глубоких связей с процедурами, исполь­зуемыми для обработки этих сущностей. При использовании ДП счи­тается, что интеллектуальность базируется на некотором универсаль­ном множестве процедур, обрабатывающих факты любого типа, и на множестве специфических фактов, описывающих частную область знаний. Основное достоинство ДП по сравнению с ПП заключается в том, что в ДП нет необходимости указывать способ использования конкретных фрагментов знания. Простые утверждения могут ис­пользоваться несколькими способами, и может оказаться неудобным фиксировать эти способы заранее. Указанное свойство обеспечивает гибкость и экономичность ДП, так как позволяет по-разному исполь­зовать одни и те же факты. В ДП знание рассматривается как множество незави-симых или слабо зависимых фактов, что позволяет осуществлять модификацию знаний и обучение простым добавлением или устранением утверж­дений. Для ПП проблема модификации значительно сложнее, так как здесь необходимо учитывать, каким образом используется дан­ное утверждение. Однако известно, что существует значительное ко­личество сущностей, которые удобно представить в виде процедур и весьма трудно - в чисто декларативном представлении. Желание использовать достоинства ДП и ПП привело к разработке форма­лизмов, использующих смешанное представление, то есть декларативное представление с присоединен-ными процедурами (например, фрейм-представление или сети с присоединенными процедурами) или про­цедурное представление в виде модулей с декларативными образца­ми. В наиболее совершенном виде эта проблема реализована в объ­ектно-ориентированном подходе.

Модели представления знаний обычно делят на логические (формальные) и эвристические (формализованные) модели. В ло­гических моделях, как правило, используется исчисление предикатов первого порядка (то, что в суждении высказывается о предмете суждения), дополненное рядом эвристических стратегий. Эти методы являются системами дедуктивного типа, то есть в них использу­ется модель получения вывода из заданной системы посылок с по­мощью фиксированной системы правил вывода. Дальнейшим разви­тием предикатных систем являются системы индуктивного типа, в которых правила вывода порождаются ЭС на основе обработ­ки конечного числа обучающих примеров. В логических моделях представления знаний отношения, су­ществующие между отдельными единицами знаний, выражаются только с помощью синтаксических правил используемой формальной системы. В отличие от формальных моделей эвристические модели имеют разнообразный набор средств, передающих специфические особен­ности той или иной проблемной области. Именно поэтому эвристи­ческие модели превосходят логические как по возможности адекват­но представить проблемную среду, так и по эффективности исполь­зуемых правил вывода. К эвристическим моделям, используемым в экспертных системах, можно отнести сетевые, фреймовые, продукци­онные и объектно-ориентированные модели. Следует отметить, что продукционные модели, используемые для представления знаний в экспертных системах, отличаются от формальных продукционных систем тем, что они используют более сложные конструк­ции правил, а также содержат эвристическую информацию о специ­фике проблемной среды, выражаемую часто в виде семантических структур.

К типичным моделям представления знаний относятся:

  • продукционные модели;

  • семантические сети;

  • фреймы;

  • формальные логические модели (в курсе не рассматриваются).

В свою очередь это множество классов можно разбить на две большие группы:

  • модульные (продукционные модели и формальные логические модели) используются для представления поверхностных знаний. Поверхностные знания - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;

  • сетевые (семантические сети и фреймы) используются для представления глубинных знаний. Глубинные знания - абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов.

Таким образом, модульные языки оперируют отдельными не связанными элементами знаний, к ним относятся правила и аксиомы предметной области. Сетевые языки дают возможность связывать эти элементы или фрагменты знаний через отношения в семантические сети или сети фреймов. Наиболее распространенным языком представления знаний (ЯПЗ) в ИИС являются продукционные модели. Продукционная модель часто применяется в экспертных системах благодаря своей наглядности, высокой модульности, легкостью внесения дополнений и изменений, простотой механизма логического вывода. Имеется большое число программных средств, реализующих продукционный подход, например язык высокого уровня CLIPS.

Продукционная модель.

Продукционная модель, основанная на правилах, позволяет представить знания в виде предложений типа «если (условие), то (действие)». Под «условием» (антецедентом) понимается некоторое предложение - образец, по которому осуществляется поиск в базе знаний. Под «действием» (консеквентом) понимаются действия, выполняемые при успешном исходе поиска. При этом действия могут быть промежуточными, выступающими далее как условия, и целевыми, завершающими работу системы. Из антецедентов и консеквентов формируются пары атрибут – значение, которые хранятся в рабочей памяти продукционной системы.

Пример правила: если «двигатель не заводится» и «стартер двигателя не работает», то «неполадки в системе электропитания стартера» В этом правиле пары атрибут- значение будут:

двигатель – не заводится;

стартер двигателя – не работает.

Истинность пары атрибут-значение установливается в процессе решения конкретной задачи к некоторому текущему моменту времени. В процессе решения задачи содержимое рабочей памяти изменяется. Это происходит по мере срабатывания правил. Правило срабатывает, если при сопоставлении фактов, содержащихся в рабочей памяти, с антецедентом анализируемого правила имеет место совпадение, при этом заключение сработанного правила заносится в рабочую память. В процессе логического вывода объем фактов в рабочей памяти, как правило, увеличивается. Объем фактов в рабочей памяти может уменьшиться в том случае, если действие какого-нибудь правила состоит в удалении фактов из рабочей памяти. В процессе логического вывода каждое правило из базы правил может сработать только один раз. При описании реальных знаний конкретной предметной области может оказаться недостаточным представление фактов с помощью пар атрибут-значение. Более широкие возможности имеет способ описания с помощью триплетов объект-атрибут-значение. В этом случае отдельная сущность предметной области рассматривается как объект, а данные, хранящиеся в рабочей памяти, показывают значения, которые принимают атрибуты этого объекта.

Примеры триплетов:

собака - кличка - Граф;

собака - порода - ризеншнауцер;

собака - окрас - черный.

Одним из преимуществ такого представления знаний является уточнение контекста, в котором применяются правила. Например, правило, относящееся к объекту «собака», должно быть применимо для собак с любыми кличками, всех пород и окрасок. С введением триплетов правила из базы правил могут срабатывать более одного раза в процессе одного логического вывода, поскольку одно правило может применяться к различным экземплярам объекта, но не более одного раза к каждому экземпляру.

Существуют два типа продукционных систем - с прямыми и обратными выводами. Прямые выводы реализуют стратегию «от фактов к заключениям». При обратных выводах выдвигаются гипотезы вероятных заключений, которые могут быть подтверждены или опровергнуты на основании фактов, поступающих в рабочую память. Существуют также системы с двунаправленными выводами.

Основные достоинства продукционных систем связаны с простотой представления знаний и организации логического вывода. К недостаткам систем продукций можно отнести следующие:

  • отличие от структур знаний, свойственных человеку;

  • неясность взаимных отношений правил;

  • сложность оценки целостного образа знаний;

  • низкая эффективность обработки знаний.

При разработке небольших систем, состоящих из нескольких десятков правил, проявляются в основном положительные стороны систем продукций, однако при увеличении объема знаний более заметными становятся слабые стороны.

Фреймовая модель.

Фреймовая модель представления знаний основана на теории фреймов М. Минского, которая представляет собой систематизированную психологическую модель памяти человека и его сознания. Эта теория имеет весьма абстрактный характер, поэтому только на ее основе невозможно создание конкретных языков представления знаний. Фрейм имеет глубокое психологическое обоснование. Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность. Под фреймом понимается абстрактный образ представ-ления объекта или ситуации. Различают фреймы-образцы (прототипы), хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения фактических ситуаций на основе поступающих данных. Структура фрейма может быть представлена как список свойств (табл. 3).

Таблица 3

Структура фрейма.

Имя фрейма


Имя слота


Значение слота

Способ получения значения

Присоединенная

процедура


























Приведенные в таблице слоты - это незаполненные значения некоторых атрибутов объекта или ситуации. Дополнительные столбцы «способ получения значения» и «присоединенная процедура» предназначены для описания слотом его значения, и возможного присоединения к тому или иному слоту специальных процедур.

Фрейм имеет имя, служащее для идентификации описываемого им понятия, и содержит ряд описаний - слотов, с помощью которых определяются основные структурные элементы этого понятия. За слотами следуют шпации, в которые помещают данные, представляющие текущие значения слотов. Слот может содержать не только конкретное значение, но также имя процедуры, позволяющей вычислить это значение по заданному алгоритму. Например, слот с именем возраст
1   2   3   4   5   6   7   8   9   10

Похожие рефераты:

Программа дисциплины «Базы данных и экспертные системы» для преподавателя...
«Базы данных и экспертные системы» для специальности 5В073200-Стандартизация, метрология и сертификация
Методические рекомендации по изучению дисциплины Формат и политика курса
«Базы данных и экспертные системы» для специальности 5В073200-Стандартизация, метрология и сертификация
Учебно-методический комплекс дисциплины «Базы данных в системах управления»
Учебно-методические материалыпо дисциплине “Базы данных в системах управления ”
Рабочая программа дисциплины “ Базы данных в системах управления...
Рабочая программа дисциплины “Базы данных в системах управления” для преподавателя
Программа дисциплины “Информационно-управляющие системы ” для преподавателя...
Одобрено и рекомендовано к изданию на заседании Учебно-методического совета университета
Программа дисциплины “Клиент-серверные приложения с использованием...
Одобрено и рекомендовано к изданию на заседании Учебно-методического совета университета
Программа дисциплины «Операционные системы» для преподавателя Редакция...
«Операционные системы» для специальности 5B070400-Вычислительная техника и программное обеспечение
Учебно-методическое пособие “Методы сортировок и поиска” Редакция...
В этой части книги будут обсуждаться структуры данных в основной памяти и методы их использования, предназначенные для поиска данных...
Учебно-методический комплекс дисциплины «обж» учебно-методические...
Авария разрушение сооружений и (или) технических устройств, применяемых на опасном производственном объекте, неконтролируемые взрыв...
Программа дисциплины «История государства и права» учебно-методические...
Автономия (греч самоуправление) – широкое внутреннее управление в определенном регионе государства

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
referatdb.ru
referatdb.ru
Рефераты ДатаБаза