Введение Представление знаний. Теоретическая часть Данные, информация и знания Классификация знаний Особенности представления знаний внутри ИС Модели представления знаний Продукционная модель Логическая модель Сетевая модель Формальные грамматики Фреймовые модели Комбинаторные модели Ленемы Алгебраические модели Нейронные сети, генетические алгоритмы Заключение Московский авиационный институт (государственный технический университет)
Факультет прикладной физики и математикиКафедра вычислительной математики и программирования
Реферат на тему «Представление знаний»
Преподаватель: Д. В. Сошников Студент: Ю. М. Сергукова Группа: 08-406
Москва, 2010
Содержание1 Введение 22 Представление знаний. Теоретическая часть 3Данные, информацияизнания… 3Классификациязнаний … 4ОсобенностипредставлениязнанийвнутриИС … 4Моделипредставлениязнаний… 6Продукционнаямодель … 7Логическаямодель … 7Сетеваямодель… 8Формальныеграмматики… 8Фреймовыемодели … 8Комбинаторныемодели… 9Ленемы … 9Алгебраическиемодели… 10Нейронныесети, генетическиеалгоритмы … 103 Заключение 121. Введение
В повседневной жизни, порой не замечая этого, человек постоянно обрабатывает ин-формацию: получает ее, запоминает, вспоминает, делает выводы, анализирует, вно-сит поправки в свои суждения, строит на основе полученных знаний и предположе-ний свое поведение. Поэтому логично предположить, что, задавшись целью создать искусственный интеллект равный по мощности (или даже превосходящий) челове-ческому, захочется наделить этот новый разум аналогичными способностями (как минимум) к восприятию окружающей среды, речи, анализу ситуации, построению выводов, предположений, обладанию «характером», памятью. Некоторые из этих пунктов весьма и весьма спорны, однако, все во многом зависит от того, какими именно чертами мы хотим наделить искусственный интеллект. Так, например, ими-тация характера и настроения совсем не обязательна и может даже мешать дости-жению поставленных целей и объективной оценке, в то время как для прохождения теста Тьюринга она может быть необходима.
Но среди перечисленных «способностей» есть несколько, которые качественно от-личали бы искусственный разум от простого суперкомпьютера. Они касаются по-лучения и обработки информации, умения пользоваться полученными знаниями и применять их.
Таким образом мы подходим к одной из основных проблем — как «научить» машину хранить и обрабатывать знания, не пользуясь помощью человека в их подготовке, а получая их на основе собственной деятельности. Эта проблема решается 6 различ-ными направлениями в теории искусственного интеллекта:
1) Представление знаний.
2) Манипулирование знаниями.
3) Общение.
4) Восприятие.
5) Обучение.
6) Поведение.
Рассмотрим первую из них, а именно — представление знаний.2. Представление знаний. Теоретическая часть2.1. Данные, информация и знания
Прежде, чем рассуждать о представлении знаний в доступном и «понятном» машине виде, требуется определиться с терминологией. Это в достаточной степени проблема-тично, так как такие термины, как «информация», «данные» и «знания» не имеют четкого определения, а то множество определений, что были созданы человечеством, иногда не просто частично пересекаются, а даже противоречат одно другому. Пере-числим некоторые из них, которые более точно описывают нашу предметную об-ласть.
Данные— факты и идеи, представленные в некотором, четко формализован-
ном виде, в котором их можно использовать для передачи в инфор-
мационном процессе;
— сведения, представленные в определенной знаковой системе и
на определенном материальном носителе для обеспечения возмож-
ностей хранения, передачи, приема и обработки.Информация— данные, определенным образом организованные, имеющие для
своего получателя смысл, значение и ценность, необходимые ему для
принятия решений, а также реализации других функций;
— это данные, сопровождающиеся смысловой нагрузкой, помещен-
ные в некоторый контекст; данные, как-либо оцениваемые получа-
телем информации. При этом то, что для одних является данными,
для других может оказаться информацией.Знания— проверенная информация и/или та информация, которой дове-ряют, результаты принятия решений, поведения, обобщенные в виде
теорем и законов, совокупности взглядов;
— зафиксированная и проверенная практикой информация, которая
может многократно использоваться людьми для решения тех или
иных задач.
Таким образом, мы получаем следующие закономерности:/>
имеют смысл
/>проверенная/>
При этом на данной диаграмме при движении слева направо уменьшается формали-зованность представления. И стоящая перед нами задача — представление знаний, самой неформальной сущности.
2.2. Классификация знаний/>
Можно найти и другие критерии для классификации знаний, но уже этого достаточ-но, чтобы показать разнородность человеческих знаний. Так, эмпирическое знание может быть одновременно и процедурным и личностным.
Логично предположить, что для описания той или иной категории лучше подходят определенные средства, в то время как другие значительно понижают эффектив-ность хранения и/или использования. Остановимся на общих моментах, абстрагиро-вавшись от вида категории знаний.2.3. Особенности представления знаний внутри ИС
Представление знаний в памяти ЭВМ или на внешних носителях должно иметь осо-бенности, отличающие знания от данных, например, такие как:внутренняя интерпретируемость;
структурированность;
связность;
семантическая метрика;
активность;
конвертируемость.
∙
Сперва следует отдельно указать, что обрабатываемой единицей для знаний является факт, а не запись данных. Факт — это некоторая запись, наделенная семантикой.
Теперь рассмотрим каждый вышеобозначенный пункт в отдельности. Внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в кото-рых это имя упомянуто. Роль «имени» может выполнять набор аттрибутов. Смысл такого расширения данных — идентифицировать данные и их назначение должна уметь не только посторонняя программа, которая обладает информацией о том, как правильно расшифровать эти данные, но и сама система.
Структурированность. Информационные единицы должны обладать гибкой струк-турой. Для них может выполняться рекурсия—вложимость одних информационных единиц в другие. Иначе говоря, должна существовать возможность произвольно-го установления между отдельными информационными единицами отношений типа «часть—целое», «род—вид» или «элемент—класс».
Связность. Между информационными единицами должна быть предусмотрена воз-можность установления связей различного типа. Семантика отношений может носить декларативный или процедурный характер. Например, две и более информацион-ные единицы могут быть связаны отношением «одновременно», две информационные единицы — отношением «причина—следствие» или «быть рядом».
Семантическая метрика. На множестве информационных единиц в некоторых слу-чаях полезно задавать отношение, характеризующее их ситуационную близость, т.е. силу ассоциативной связи. Отношение релевантности при работе с информационны-ми единицами позволяет находить знания, близкие к уже найденным, но не имеющие с ними прямой связи. Этот пункт считается критичным для моделирования челове-ческих воспоминаний, построения ассоциаций, моделирования процесса генерации идей.
Активность. Данные обычно пассивны и используются командами в случае необхо-димости. Для ИС выполнение программ должно наоборот инициироваться текущим состоянием системы.
Конвертируемость. Содержание знаний не должно зависить от его записи. Поэтому форма представления, уровень детализации и степень неопределенности информации о предметной области может трансформироваться в процессе перехода к очередному этапу решения интеллектуальной задачи. Это свойство, в отличие от предыдущих, отражает динамичность знаний и связано с обучением системы.2.4. Модели представления знаний
Среди множества разработанных моделей представления знаний можно выделить два основных подхода: эмпирический и теоретический./>
Эмпирический подход основывается на исследовании сознания человека, изучении
принципов организации памяти и моделировании механизмов решения задач. Другой подход — теоретический, можно также назвать теоретически обоснованным. Он «гарантирует» правильность решений. В рамках этого подхода до настоящего времени удавалось решать только сравнительно простые задачи из узкой предметной
области. Кроме моделей, разработанных в рамках каждого из этих подходов, отдельно вы-деляют (относя к обоим подходом сразу) бионическое направление, представленное генетическими алгоритмами и нейронными сетями.
В каждом подходе мы увидим свое отношение и к тому, что является знанием, и к тому, как его представлять. Если в теоретических моделях знания строго формали-зованы, то эмпирические призваны дать некоторую свободу. Однако, ценой за эту свободу будет потенциальная невыводимость некоторых решений и невозможность найти ответ на поставленный вопрос, когда теоретические модели это гарантируют.
Рассмотрим каждую из моделей.2.4.1. Продукционная модель
Это одна из самых распространенных моделей представления знаний. В ее осно-ве лежит набор правил вида «если условие, то действие», описывающих знания. Оперируя этими правилами можно построить прямой или обратный вывод. Прямой вывод — это поиск действия по заданному условию, обратный — поиск возможных условий, которые могли бы привести к указанному действию.
Продукционная модель понятна и с ее помощью можно легко записать поведение или даже построение выводов, однако при достаточном количестве правил возникает противоречивость некоторых из них, которая приводит модель в негодность. Также к ее недостаткам можно отнести неясность взаимных отношений правил и сложность оценки базы знаний.2.4.2. Логическая модель
Вся информация в логической модели рассматривается как совокупность фактов и связывающих их утверждений, которые представляются как формулы в некоторой логике. Знания при этом представляются набором подобных утверждений, а постро-ение выводов и получение новых знаний сводится к реализации процедуры логиче-ского вывода. Этот процесс может быть строго формализован, так как в его основе лежит классический аппарат математической логики.
Сложности могут возникнуть при описании неоднородных миров (объекты относятся к разным категориям и их связывают различные отношения). Для преодоления этой и других сложностей в конкретных предметных областях используют расширенные модели, использующие нечеткую логику, оперирующие эмпирическими кванторами.
Такие расширенные модели объединяют возможности логического и лингвистиче-ского подходов, в результате чего называются логико-лингвистическими моделями данной предметной области.2.4.3. Сетевая модель
Сетевая модель (или семантическая сеть) в инженерии знаний представляется на-правленным графом, узлы которого соответствуют понятиям и объектам, а дуги — отношениям между ними. В сетевой модели основными отношениями являются is-a и part-of, с помощью которых можно описать большой объем знаний.
Семантическая сеть позволяет снизить объем хранимых данных, обеспечивает реали-зацию ассоциативных связей. Проблема гибкости модели и существования бесконеч-ного множества возможных связей решается добавлением новых типов отношений. В проектах, посвященных моделированию человеческой памяти, также было предло-жено при использовании расширяемой подобным образом семантической сети также строить модель, хранящую все типы соединений и отношения подобия и взаимоза-меняемости между ними.2.4.4. Формальные грамматики
Форальная грамматика (теория) состоит из алфавита (словаря), множества синтак-сических правил, которые позволяют определить истинность или ложность выраже-ний, построенных в данном языке, базовой системы подобных выражений, которые всегда истинны и называются аксиомами, множества правил вывода, позволяющих преобразовывать одно выражение в другое.
В основе этой модели лежит исчисление высказываний, которое можно считать клас-сическим примером аксиоматических систем. Эта система хорошо исследована и име-ет разработанную модель логического вывода. Эти свойства переносятся и на модель, ее использующую.
Главным недостатком является отсутствие гибкости системы. В случае модифика-ции или расширения модели может потребоваться перестроить всю систему, что для практических систем неприемлемо. Как следствие, формальные грамматики исполь-зуются в тех предметных областях, которые хорошо локализуются и мало зависят от внешних факторов.2.4.5. Фреймовые модели
Фреймовая модель основана на концепции Марвина Мински — профессора Массачу-сетского технологического института, основателя лаборатории искусственного интел-лекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания. В отличие от других моделей в ней фиксируется жесткая структура информационных единиц, которая называется протофреймом (конкретным фреймом).
Сам фрейм представляет собой структуру данных для представления некоторого объекта. Информация, относящаяся к фрейму, содержится в составляющих его сло-тах. Значением слота может быть практически что угодно: числа или математиче-ские соотношения, тексты на естественном языке или программы, правила вывода (в случае терминального слота), либо ссылки на другие фреймы. Это позволяет ре-ализовать систему отношений между фреймами и даже рекурсию.
Каждый фрейм состоит из произвольного числа слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем.
Иерархия фреймов может описывать либо объект (тогда фреймы — составные ча-сти объекта, а слоты описывают его свойства), либо ситуацию или процесс (тогда фреймы — факты или этапы, а в слотах содержатся еще и вызываемые процедуры).2.4.6. Комбинаторные модели
Комбинаторные модели основаны на рассмотрении дискретных объектов, конечных множеств и заданном на них отношении порядка. В рамках комбинаторики также рассматриваются все возможные изменения, перестановки и сочетания, в рамках заданных множеств.
Комбинаторные модели используются в задачах топологии (например, поиск пути), задачах прогнозирования поведения автоматов, при изучении деревьев решений, ча-стично упорядоченных множеств.
Основная проблема указана еще в определении этой модели: она оперирует толь-ко дискретными объектами и конечными множествами, связанными однородными отношениями.2.4.7. Ленемы
Ленемы представляют собой смешанный тип модели, являющийся как бы «развити- ем» других моделей (фреймы, семантические сети и т.д.). Ленема предназначена для структурного комплексного описания понятий предмет-
ной области. По изобразительным возможностям ленемы более совершенны, чем та-кие традиционные модели представления знаний, как семантическая сеть, фрейм, система продукций. Однако, для некоторых понятий модель представления знаний на основе ленем может быть неудобной и даже неприемлемой. Например, это та-кие понятия, в описании которых очень большую роль играет внутренняя динамика. Модель, созданная на базе ленем, позволяет объединить на пользовательском уровне три существующие в настоящее время парадигмы представления знаний:
1) логическую (продукционная и логическая модели);
2) структурную (семантические сети и фреймы);
3) процедурную.
Для некоторых ситуаций это очень удобно, так как при реализации сложных моде-лей, включающих знания различных типов, возникает необходимость совмещения в одном языке представления знаний различных концепций.2.4.8. Алгебраические модели
Алгебраическая модель подразумевает представление знаний в виде некоторых ал-гебраических примитивов, над которыми определено множество действий (некоторые из которых можно задать таблично). Для набора знаний представленного в таком виде действуют правила алгебраических множеств, такие как аксиоматизация, опре-деление подсистем и отношений эквивалентности. Также возможно построение цепей множеств (множества, для которых определен порядок отношения «быть подсисте-мой»).
Изначально предполагалось использовать подобную модель в качестве формализо-ванной системы построения аналогий (за счет определения эквивалентности). Одна-ко, на эту формальную модель очень сложно отобразить весь набор знаний, поэтому от этой идеи отказались.2.4.9. Нейронные сети, генетические алгоритмы
Эти модели нельзя строго отнести к эмпирическому или теоретическому подходам. Их относят, как было сказано ранее, к бионическому направлению. Оно основывается на предположении о том, что если в искусственной системе воспроизвести структуры и процессы человеческого мозга, то и результаты решения задач такой системой будут подобны результатам, получаемым человеком.
Так, в нейронных сетях моделируются персептроны и их поведение, призванные ско-пировать дейтельность мозга, а генетические алгоритмы несут в себе принципы есте-ственного отбора и эволюции (за счет внесения изменений через мутации и смешение наследственностей).
Особенностью моделей этого типа является широкое использование эвристик, что в каждом случае требует доказательства правильности получаемых решений.3. Заключение
Мы рассмотрели основные подходы к построению моделей представления знаний. У каждой из них есть свои достоинства и свои недостатки, которые делают каждую из них наиболее эффективной в конкретной области и при определенных условиях.
Однако, после рассмотрения этих моделей становится очевидно, что создание интел-лекта, подобного человеческому в плане самостоятельных обработки информации и использования знаний, пока невозможно. По крайней мере, не в чистых моделях. Логично предположитель, что требуется совместить некоторые из этих моделей для получения основных качеств, свойственных человеческому разуму.
Но даже в случае создания подобного интеллекта останется еще несколько качеств, которые практически невозможно запрограммировать (о чем неоднократно говорят, например, создатели и исследователи экспертных систем) — такие как неординар-ность мышления и способность к творчеству, умение строить предположения и до-гадки, создавать теории и идеи. И, как ни странно, именно эти качества в свое время подтолкнули человечество к идее создания искусственного интеллекта.Список литературы
[1] http://ru.wikipedia.org/
[2] http://aiportal.ru/
[3] http://makhfi.com/
[4] http://uni-dubna.ru/~mazny/students/upr_zn/
[5] http://hr-portal.ru/