Скачать 1.56 Mb.
|
характеризует сложность решаемых задач и связан с типом используемой ЭВМ. По этому признаку различают:
Понятие проблемной среды включает описание предметной области (множество сущностей, описывающих множество объектов, их характеристик и отношений между объектами) и решаемых в ней задач. Другими словами, проблемная среда включает структуры данных и решаемые с ними задачи, представленные в виде исполняемых утверждений (правил, процедур, формул и др.). В связи с этим проблемная среда определяется характеристиками соответствующей предметной области и характеристиками типов решаемых в ней задач. Характеристики предметной области. 1. Тип предметной области:
2. Способ описания сущностей предметной области:
3. Способ организации сущностей в БЗ:
Структурирование БЗ способствует:
Характеристики типов решаемых в проблемной области задач.
Не все сочетания перечисленных выше параметров, характеризующих проблемную среду, встречаются на практике. Наиболее распространены следующие типы проблемных сред:
представление сущностей в виде совокупности атрибутов и их значений, неизменяемый состав сущностей, БЗ не структурирована, решаются статические задачи анализа, используются только частные исполняемые утверждения; представление сущностей объектами, изменяемый состав сущностей, БЗ структурирована, решаются статические задачи анализа и синтеза, используются общие и частные исполняемые утверждения;
представление сущностей совокупностью атрибутов и их значений, неизменяемый состав сущностей, БЗ не структурирована, решаются динамические задачи анализа, используются частные исполняемые утверждения; представление сущностей в виде объектов, изменяемый состав сущностей, БЗ структурирована, решаются динамические задачи анализа и синтеза, используются общие и частные исполняемые утверждения. В ЭС различают следующие типы решения задач:
Задачи интерпретации данных, диагностики, поддержки принятия решений относятся к задачам анализа, задачи проектирования, планирования и управления - к задачам синтеза. К комбинированному типу задач относятся обучение, мониторинг и прогнозирование. Характеристика инструментальных средств разработки ИИС. Трудоемкость разработки ИИС в значительной степени зависит от используемых инструментальных средств (ИС). Инструментальные средства для разработки интеллектуальных приложений можно классифицировать по следующим основным параметрам: - уровень используемого языка; - парадигмы программирования и механизмы реализации; - способ представления знаний; - механизмы вывода и моделирования; - средства приобретения знаний; - технологии разработки приложений. Мощность и универсальность языка программирования определяет трудоемкость разработки ЭС:
При использовании оболочек и сред разработчик приложения полностью освобождается от программирования, его основные трудозатраты связаны с формированием базы знаний. Способы реализации механизма исполняемых утверждений часто называют парадигмами программирования. К основным парадигмам относят следующие:
Парадигма процедурного программирования является самой распростра-ненной среди существующих языков программирования (например, С и Паскаль). В процедурной парадигме активная роль отводится процедурам, а не данным; причем любая процедура активизируется вызовом. Подобные способы задания поведения удобны для описаний детерминированной последовательности действий одного процесса или нескольких взаимосвязанных процессов. При использовании программирования, ориентированного на данные, активная роль принадлежит данным, а не процедурам. Здесь со структурами активных данных связывают некоторые действия (процедуры), которые активизируются тогда, когда осуществляется обращение к этим данным. В парадигме, ориентированной на правила, поведение определяется множеством правил вида «условие-действие». Условие задает образ данных, при возникновении которого действие правила может быть выполнено. Правила в данной парадигме играют такую же роль, как и операторы в процедурной парадигме. Однако если в процедурной парадигме поведение задается детерминированной последовательностью операторов, не зависящей от значений обрабатываемых данных, то в парадигме, ориентированной на правила, поведение не задается заранее предписанной последовательностью правил, а формируется на основе значений Данных, которые в текущий момент обрабатываются программой. Подход, ориентированный на правила, удобен для описания поведения, гибко и разнообразно реагирующего на большое многообразие состояний данных. Парадигма объектного программирования в отличие от процедурной парадигмы не разделяет программу на процедуры и данные. Здесь программа организуется вокруг сущностей, называемых объектами, которые включают локальные процедуры (методы) и локальные данные (переменные). Поведение (функционирование) в этой парадигме организуется путем пересылки сообщений между объектами. Объект, получив сообщение, осуществляет его локальную интерпретацию, основываясь на локальных процедурах и данных. Такой подход позволяет описывать сложные системы наиболее естественным образом, что особенно удобно для интегрированных ЭС. Наличие многих способов представления знаний вызвано стремлением представить различные типы проблемных сред с наибольшей эффективностью. Обычно способ представления знаний в ЭС характеризуют моделью представления знаний. Типичными моделями представления знаний являются правила (продукции), фреймы (или объекты), семантические сети, логические формулы. Инструментальные средства, имеющие в своем составе более одной модели представления знаний, называют гибридными. Большинство современных средств, как правило, использует объектно-ориентированную парадигму, объединенную с парадигмой, ориентированной на правила. В статических ЭС единственным агентом, изменяющим информацию, является механизм вывода экспертной системы. В динамических ЭС изменение данных происходит не только вследствие функционирования механизма исполняемых утверждений, но также в связи с изменениями окружения задачи, которые моделируются специальной подсистемой или поступают извне. Механизмы вывода в различных средах могут отличаться способами реализации следующих процедур.
2. Поиск (выбор) решения:
а) «поиск в ширину», при котором сначала обрабатываются все вершины, непосредственно связанные с текущей обрабатываемой вершиной G; б) «поиск в глубину», когда сначала раскрывается одна наиболее значимая вершина – G1, связанная с текущей G, затем вершина G1 делается текущей, и для нее раскрывается одна наиболее значимая вершина G2 и т. д. 3. Процесс генерации предположений и сети вывода:
Механизм вывода для динамических проблемных сред дополнительно содержит: планировщик, управляющий деятельностью ЭС в соответствии с приоритетами; средства, гарантирующие получение лучшего решения в условиях ограниченности ресурсов; систему поддержания истинности значений переменных, изменяющихся во времени. В динамических инструментальных средствах могут быть реализованы следующие варианты подсистемы моделирования:
В инструментальных системах средства приобретения знаний характеризуются следующими признаками:
ЛЕКЦИЯ 4. Состав и организация данных и знаний в ЭС. В лекции рассмотрены вопросы отличия знаний от данных, характеристика основных признаков по которым классифицируются знания, а также модели представления знаний в виде продукций, фреймов, семантических сетей. Отличия знаний от данных. Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области. При этом возникает естественный вопрос, что такое знания и чем они отличаются от обычных данных, обрабатываемых ЭВМ. Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:
Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания могут быть получены на основе обработки эмпирических данных. Они представ-ляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности. Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два способа наделения знаниями программных систем:
При разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ. Знания в ИИС существуют в следующих формах:
В области ИИ даются конкретные определения знаний. «Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области». «Знания - это хорошо структурированные данные или данные о данных, или метаданные». «Знания - формализованная информация, на которую ссылаются или используют в процессе логического вывода». Существует множество классификаций знаний. Как правило, с помощью классификаций систематизируют знания конкретных предметных областей. По своей природе знания можно разделить на декларативные и процедурные знания. Декларативные знания - это описания фактов и явлений. Процедурные знания - это описания действий, которые возможны при манипулировании фактами и явлениями для достижения намеченных целей. Для описания знаний на абстрактном уровне разработаны специальные языки описания знаний. Эти языки также делятся на языки процедурного типа и декларативного. Все языки описания знаний, ориентированные на использование традиционных компьютеров фон-неймановской архитектуры, являются языками процедурного типа. Разработка языков декларативного типа, удобных для представления знаний, является актуальной проблемой. По способу приобретения знания можно разделить на факты и эвристику (правила, которые позволяют сделать выбор при отсутствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной предметной области обстоятельства. Вторая категория знаний основана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики. По типу представления знания делятся на факты и правила. Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции, - это знания типа «если А, то В». Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффективной организации процедур логического вывода. Форма представления знаний оказывает существенное влияние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Однако все знания, которые привлекает человек в процессе решения сложных задач, смоделировать невозможно. Поэтому в интеллектуальных системах требуется четко разделить знания на те, которые предназначены для обработки компьютером, и знания, используемые человеком. Очевидно, что для решения сложных задач БЗ должна иметь достаточно большой объем, иначе неизбежно возникают проблемы управления такой базой. Поэтому при выборе модели представления знаний следует учитывать такие факторы, как однородность представления и простота понимания. Однородность представления приводит к упрощению механизма управления знаниями. Простота понимания важна для пользователей интеллектуальных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации знаний. Организация данных в рабочей памяти ЭС. Рабочая память (РП) экспертных систем предназначена для хранения данных. Данные в рабочей памяти делятся на уровни по типам данных. Выделение уровней усложняет структуру экспертной системы, однако делает ее более эффективной. Например, можно выделить уровень планов, уровень агенды (упорядоченного списка правил, готовых к выполнению), уровень данных предметной области, уровень решений. В рабочей памяти современных экспертных систем рассматри-ваются как изолированные, так и связанные данные. В первом случае рабочая память состоит из множества простых элементов, а втором - из одного или нескольких (при нескольких уровнях в РП) сложных элементов (например, объектов). При этом сложный элемент соответствует множеству простых элементов, объединенных в единую сущность. Теоретически оба подхода обеспечивают полноту, но использование изолированных элементов в сложных предметных областях приводит к потере эффективности. Данные в РП в простейшем случае являются константами и (или) переменными. При этом переменные могут рассматриваться как характеристики некоторого объекта, а константы - как значения соответствующих характеристик. Если в РП требуется анализировать одновременно несколько различных объектов, описывающих текущую проблемную ситуацию, то необходимо указывать, к каким объектам относятся рассматриваемые характеристики. Одним из способов решения этой задачи является явное указание того, к какому объекту относится характеристика. Если РП состоит из сложных элементов, то связь между отдельными объектами указывается явно, например заданием семантических отношений. При этом каждый объект может иметь свою внутреннюю структуру. Для ускорения поиска и сопоставления данных в РП используются не только логические, но и ассоциативные связи. Показателем интеллектуальности системы с точки зрения представления знаний считается способность системы использовать в нужный момент необходимые (релевантные) знания. Системы, не имеющие средств для определения релевантных знаний, неизбежно сталкиваются с проблемой «комбинаторного взрыва». Можно утверждать, что эта проблема является одной из основных причин, ограничивающих сферу применения экспертных систем. В проблеме доступа к знаниям можно выделить три аспекта: связность знаний и данных, механизм доступа к знаниям и способ сопоставления. Организация знаний в БЗ. Связность знаний является основным способом, обеспечивающим ускорение поиска релевантных знаний. Для этого знания следует организовывать вокруг наиболее важных объектов (сущностей) предметной области. Все знания, характеризующие некоторую сущность, связываются и представляются в виде отдельного объекта. При подобной организации знаний, если системе потребовалась информация о некоторой сущности, то она ищет объект, описывающий эту сущность, а затем уже внутри объекта отыскивает информацию о данной сущности. В объектах целесообразно выделять два типа связок между элементами: внешние и внутренние. Внутренние связки объединяют элементы в единый объект и предназначены для выражения структуры объекта. Внешние связки отражают взаимозависимости, существующие между объектами в области экспертизы. Внешние связки бывают логические и ассоциативные. Логические связки выражают семантические отношения между элементами знаний. Ассоциативные связки предназначены для обеспечения взаимосвязей, способствующих ускорению процесса поиска релевантных знаний. Основной проблемой при работе с большой базой знаний является проблема поиска знаний, релевантных решаемой задаче. Очевидно, что упорядочение и структурирование знаний могут значительно ускорить процесс поиска. Нахождение желаемых объектов в общем случае уместно рассматривать как двухэтапный процесс. На первом этапе, соответствующем процессу выбора по ассоциативным связкам, совершается предварительный выбор в базе знаний потенциальных кандидатов в качестве желаемых объектов. На втором этапе путем выполнения операции сопоставления потенциальных кандидатов с описаниями кандидатов осуществляется окончательный выбор искомых объектов. При организации подобного механизма доступа возникают определенные трудности с выбором критерия пригодности кандидата, организации работы в конфликтных ситуациях и др. Операция сопоставления может использоваться не только как средство выбора нужного объекта из множества кандидатов, но и для классификации, подтверждения, декомпозиции и коррекции. Для идентификации неизвестного объекта он может быть сопоставлен с некоторыми известными образцами. Это позволит классифицировать неизвестный объект как такой известный образец, при сопоставлении с которым были получены лучшие результаты. Если осуществлять сопоставление некоторого известного объекта с неизвестным описанием, то в случае успешного сопоставления будет осуществлена частичная декомпозиция описания. Операции сопоставления весьма разнообразны. Обычно выделяют следующие их формы: синтаксическое, параметрическое, семантическое и принуждаемое сопоставления. В случае синтаксического сопоставления соотносят формы (образцы), а не содержание объектов, Успешным является сопоставление, в результате которого образцы оказываются идентичными. Обычно считается, что переменная одного образца может быть идентична любой константе (или выражению) другого образца. Иногда на переменные, входящие в образец, накладывают требования, определяющие тип констант, с которыми они могут сопоставляться Результат синтаксического сопоставления является бинарным: образцы сопоставляются или не сопоставляются. В параметрическом сопоставлении вводится параметр, определяющий степень сопоставления. В случае семантического сопоставления соотносятся не образцы объектов, а их функции. В случае принуждаемого сопоставления один сопоставляемый образец рассматривается с точки зрения другого. В отличие от других типов сопоставления здесь всегда может быть получен положительный результат. Вопрос состоит в силе принуждения и использовании специальных процедур, связываемых с объектами. Модели представления знаний в ЭС. Выбор модели представления знания часто сводят к обсуждению баланса между декларативным (ДП) и процедурным представлением (ПП). Различие между ДП и ПП можно выразить различием между вопросами «знать, что?» и «знать, как?». Процедурное представление основано на предпосылке, что интеллектуальная деятельность есть знание проблемной среды, вложенное в программы, то есть знание о том, как можно использовать те или иные сущности. Декларативное представление основано на предпосылке, что знание неких сущностей «знать, что?» не имеет глубоких связей с процедурами, используемыми для обработки этих сущностей. При использовании ДП считается, что интеллектуальность базируется на некотором универсальном множестве процедур, обрабатывающих факты любого типа, и на множестве специфических фактов, описывающих частную область знаний. Основное достоинство ДП по сравнению с ПП заключается в том, что в ДП нет необходимости указывать способ использования конкретных фрагментов знания. Простые утверждения могут использоваться несколькими способами, и может оказаться неудобным фиксировать эти способы заранее. Указанное свойство обеспечивает гибкость и экономичность ДП, так как позволяет по-разному использовать одни и те же факты. В ДП знание рассматривается как множество незави-симых или слабо зависимых фактов, что позволяет осуществлять модификацию знаний и обучение простым добавлением или устранением утверждений. Для ПП проблема модификации значительно сложнее, так как здесь необходимо учитывать, каким образом используется данное утверждение. Однако известно, что существует значительное количество сущностей, которые удобно представить в виде процедур и весьма трудно - в чисто декларативном представлении. Желание использовать достоинства ДП и ПП привело к разработке формализмов, использующих смешанное представление, то есть декларативное представление с присоединен-ными процедурами (например, фрейм-представление или сети с присоединенными процедурами) или процедурное представление в виде модулей с декларативными образцами. В наиболее совершенном виде эта проблема реализована в объектно-ориентированном подходе. Модели представления знаний обычно делят на логические (формальные) и эвристические (формализованные) модели. В логических моделях, как правило, используется исчисление предикатов первого порядка (то, что в суждении высказывается о предмете суждения), дополненное рядом эвристических стратегий. Эти методы являются системами дедуктивного типа, то есть в них используется модель получения вывода из заданной системы посылок с помощью фиксированной системы правил вывода. Дальнейшим развитием предикатных систем являются системы индуктивного типа, в которых правила вывода порождаются ЭС на основе обработки конечного числа обучающих примеров. В логических моделях представления знаний отношения, существующие между отдельными единицами знаний, выражаются только с помощью синтаксических правил используемой формальной системы. В отличие от формальных моделей эвристические модели имеют разнообразный набор средств, передающих специфические особенности той или иной проблемной области. Именно поэтому эвристические модели превосходят логические как по возможности адекватно представить проблемную среду, так и по эффективности используемых правил вывода. К эвристическим моделям, используемым в экспертных системах, можно отнести сетевые, фреймовые, продукционные и объектно-ориентированные модели. Следует отметить, что продукционные модели, используемые для представления знаний в экспертных системах, отличаются от формальных продукционных систем тем, что они используют более сложные конструкции правил, а также содержат эвристическую информацию о специфике проблемной среды, выражаемую часто в виде семантических структур. К типичным моделям представления знаний относятся:
В свою очередь это множество классов можно разбить на две большие группы:
Таким образом, модульные языки оперируют отдельными не связанными элементами знаний, к ним относятся правила и аксиомы предметной области. Сетевые языки дают возможность связывать эти элементы или фрагменты знаний через отношения в семантические сети или сети фреймов. Наиболее распространенным языком представления знаний (ЯПЗ) в ИИС являются продукционные модели. Продукционная модель часто применяется в экспертных системах благодаря своей наглядности, высокой модульности, легкостью внесения дополнений и изменений, простотой механизма логического вывода. Имеется большое число программных средств, реализующих продукционный подход, например язык высокого уровня CLIPS. Продукционная модель. Продукционная модель, основанная на правилах, позволяет представить знания в виде предложений типа «если (условие), то (действие)». Под «условием» (антецедентом) понимается некоторое предложение - образец, по которому осуществляется поиск в базе знаний. Под «действием» (консеквентом) понимаются действия, выполняемые при успешном исходе поиска. При этом действия могут быть промежуточными, выступающими далее как условия, и целевыми, завершающими работу системы. Из антецедентов и консеквентов формируются пары атрибут – значение, которые хранятся в рабочей памяти продукционной системы. Пример правила: если «двигатель не заводится» и «стартер двигателя не работает», то «неполадки в системе электропитания стартера» В этом правиле пары атрибут- значение будут: двигатель – не заводится; стартер двигателя – не работает. Истинность пары атрибут-значение установливается в процессе решения конкретной задачи к некоторому текущему моменту времени. В процессе решения задачи содержимое рабочей памяти изменяется. Это происходит по мере срабатывания правил. Правило срабатывает, если при сопоставлении фактов, содержащихся в рабочей памяти, с антецедентом анализируемого правила имеет место совпадение, при этом заключение сработанного правила заносится в рабочую память. В процессе логического вывода объем фактов в рабочей памяти, как правило, увеличивается. Объем фактов в рабочей памяти может уменьшиться в том случае, если действие какого-нибудь правила состоит в удалении фактов из рабочей памяти. В процессе логического вывода каждое правило из базы правил может сработать только один раз. При описании реальных знаний конкретной предметной области может оказаться недостаточным представление фактов с помощью пар атрибут-значение. Более широкие возможности имеет способ описания с помощью триплетов объект-атрибут-значение. В этом случае отдельная сущность предметной области рассматривается как объект, а данные, хранящиеся в рабочей памяти, показывают значения, которые принимают атрибуты этого объекта. Примеры триплетов: собака - кличка - Граф; собака - порода - ризеншнауцер; собака - окрас - черный. Одним из преимуществ такого представления знаний является уточнение контекста, в котором применяются правила. Например, правило, относящееся к объекту «собака», должно быть применимо для собак с любыми кличками, всех пород и окрасок. С введением триплетов правила из базы правил могут срабатывать более одного раза в процессе одного логического вывода, поскольку одно правило может применяться к различным экземплярам объекта, но не более одного раза к каждому экземпляру. Существуют два типа продукционных систем - с прямыми и обратными выводами. Прямые выводы реализуют стратегию «от фактов к заключениям». При обратных выводах выдвигаются гипотезы вероятных заключений, которые могут быть подтверждены или опровергнуты на основании фактов, поступающих в рабочую память. Существуют также системы с двунаправленными выводами. Основные достоинства продукционных систем связаны с простотой представления знаний и организации логического вывода. К недостаткам систем продукций можно отнести следующие:
При разработке небольших систем, состоящих из нескольких десятков правил, проявляются в основном положительные стороны систем продукций, однако при увеличении объема знаний более заметными становятся слабые стороны. Фреймовая модель. Фреймовая модель представления знаний основана на теории фреймов М. Минского, которая представляет собой систематизированную психологическую модель памяти человека и его сознания. Эта теория имеет весьма абстрактный характер, поэтому только на ее основе невозможно создание конкретных языков представления знаний. Фрейм имеет глубокое психологическое обоснование. Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность. Под фреймом понимается абстрактный образ представ-ления объекта или ситуации. Различают фреймы-образцы (прототипы), хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения фактических ситуаций на основе поступающих данных. Структура фрейма может быть представлена как список свойств (табл. 3). Таблица 3 Структура фрейма.
Приведенные в таблице слоты - это незаполненные значения некоторых атрибутов объекта или ситуации. Дополнительные столбцы «способ получения значения» и «присоединенная процедура» предназначены для описания слотом его значения, и возможного присоединения к тому или иному слоту специальных процедур. Фрейм имеет имя, служащее для идентификации описываемого им понятия, и содержит ряд описаний - слотов, с помощью которых определяются основные структурные элементы этого понятия. За слотами следуют шпации, в которые помещают данные, представляющие текущие значения слотов. Слот может содержать не только конкретное значение, но также имя процедуры, позволяющей вычислить это значение по заданному алгоритму. Например, слот с именем возраст |
Программа дисциплины «Базы данных и экспертные системы» для преподавателя... «Базы данных и экспертные системы» для специальности 5В073200-Стандартизация, метрология и сертификация | Методические рекомендации по изучению дисциплины Формат и политика курса «Базы данных и экспертные системы» для специальности 5В073200-Стандартизация, метрология и сертификация |
Учебно-методический комплекс дисциплины «Базы данных в системах управления» Учебно-методические материалыпо дисциплине “Базы данных в системах управления ” | Рабочая программа дисциплины “ Базы данных в системах управления... Рабочая программа дисциплины “Базы данных в системах управления” для преподавателя |
Программа дисциплины “Информационно-управляющие системы ” для преподавателя... Одобрено и рекомендовано к изданию на заседании Учебно-методического совета университета | Программа дисциплины “Клиент-серверные приложения с использованием... Одобрено и рекомендовано к изданию на заседании Учебно-методического совета университета |
Программа дисциплины «Операционные системы» для преподавателя Редакция... «Операционные системы» для специальности 5B070400-Вычислительная техника и программное обеспечение | Учебно-методическое пособие “Методы сортировок и поиска” Редакция... В этой части книги будут обсуждаться структуры данных в основной памяти и методы их использования, предназначенные для поиска данных... |
Учебно-методический комплекс дисциплины «обж» учебно-методические... Авария разрушение сооружений и (или) технических устройств, применяемых на опасном производственном объекте, неконтролируемые взрыв... | Программа дисциплины «История государства и права» учебно-методические... Автономия (греч самоуправление) – широкое внутреннее управление в определенном регионе государства |