На бирже курсовых и дипломных проектов можно найти образцы готовых работ или получить помощь в написании уникальных курсовых работ, дипломов, лабораторных работ, контрольных работ, диссертаций, рефератов. Так же вы мажете самостоятельно повысить уникальность своей работы для прохождения проверки на плагиат всего за несколько минут.

ЛИЧНЫЙ КАБИНЕТ 

 

Здравствуйте гость!

 

Логин:

Пароль:

 

Запомнить

 

 

Забыли пароль? Регистрация

Повышение уникальности

Предлагаем нашим посетителям воспользоваться бесплатным программным обеспечением «StudentHelp», которое позволит вам всего за несколько минут, выполнить повышение уникальности любого файла в формате MS Word. После такого повышения уникальности, ваша работа легко пройдете проверку в системах антиплагиат вуз, antiplagiat.ru, etxt.ru или advego.ru. Программа «StudentHelp» работает по уникальной технологии и при повышении уникальности не вставляет в текст скрытых символов, и даже если препод скопирует текст в блокнот – не увидит ни каких отличий от текста в Word файле.

Результат поиска


Наименование:


курсовая работа Применение Байесовых сетей

Информация:

Тип работы: курсовая работа. Добавлен: 18.05.2012. Сдан: 2011. Страниц: 12. Уникальность по antiplagiat.ru: < 30%

Описание (план):


ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ 

ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ 
УНИВЕРСИТЕТ 

 
КАФЕДРА САПР и ПК
 
 
 
 
 
 

Применение Байесовых сетей. 
 
 

ПО  КУРСУ «МОДЕЛИРОВАНИЕ» 
 
 
 
 
 
 
 
 
 

                  Выполнил  слушатель                                                   
                  группы  ИВТ-363
                  Ефанов  П.А.
                                                                                                                                   
                  Проверил
                  Кузнецов  В.В.                              
 
 
 
 
 
 

 
  Волгоград 2006

Содержание.

Введение

 
Байесовы  сети представляют собой графовые модели вероятностных и причинно-следственных отношений между переменными в статистическом информационном моделировании. В байесовых сетях могут органически сочетаться эмпирические частоты появления различных значений переменных, субъективные оценки «ожиданий» и теоретические представления о математических вероятностях тех или иных следствий из априорной информации. Это является важным практическим преимуществом и отличает байесовы сети от других методик информационного моделирования.  

Наблюдаемые события редко могут быть описаны  как прямые следствия строго детерминированных причин. На практике широко применяется вероятностное описание явлений. Обоснований тому несколько: и наличие неустранимых погрешностей в процессе экспериментирования и наблюдений, и невозможность полного описания структурных сложностей изучаемой системы, и неопределенности вследствие конечности объема наблюдений.
На  пути вероятностного моделирования  встречаются определенные сложности, которые (если отвлечься от чисто теоретических проблем) можно условно разделить на две группы:
    технические (вычислительная сложность, «комбинаторные взрывы» и т.п.);
    идейные (наличие неопределенности, сложности при постановке задачи в терминах вероятностей, недостаточность статистического материала).
 
Для иллюстрации одной из «идейных»  сложностей рассмотрим простой пример из области вероятностного прогнозирования. Требуется оценить вероятность положительного исхода в каждой из трех ситуаций:
    Знатная леди утверждает, что она может отличить на вкус, был ли чай налит в сливки или наоборот — сливки в чай. Ей удалось это проделать 10 раз в течение бала.
    Азартный игрок утверждает, что он может предсказать, орлом или решкой выпадет монета (которую вы ему дадите). Он смог выиграть такое пари уже 10 раз за этот вечер, ни разу не проиграв!
    Эксперт в классической музыке заявляет, что он в состоянии различить творения Гайдна и Моцарта лишь по одной странице партитуры. Он уверенно проделал это 10 раз в музыкальной библиотеке.
 
Удивительная  особенность — во всех трех случаях  мы формально имеем одинаковые экспериментальные свидетельства в пользу высказанных утверждений — в каждом случае они достоверно подтверждены 10 раз. Однако мы с восхищением и удивлением отнесемся к способностям леди, весьма скептически воспримем заявления бравого игрока, и совершенно естественно согласимся с доводами музыкального эксперта. Наши субъективные оценки вероятности этих трех ситуаций весьма отличаются. И, несмотря на то, что мы имеем дело с повторяющимися событиями, весьма непросто совместить их с классическими положениями теории вероятностей.
Особенно  затруднительно получить формулировку, понятную вычислительной машине.
Другая  сторона идейных трудностей возникает  при практической необходимости вероятностного прогнозирования событий, к которым не вполне применимы классические представления о статистической повторяемости. Представим себе серию экспериментов с бросанием кубика, сделанного из сахара, на влажную поверхность стола. Вероятности исходов последующих испытаний зависят от относительной частоты исходов предыдущих испытаний, при этом исследуемая система каждый раз необратимо изменяется в результате каждого эксперимента. Этим свойством обладают многие биологические и социальные системы, что делает их вероятностное моделирование классическими методами крайне проблематичным.
Часть из указанных проблем решается в  вероятностных байесовых сетях, которые представляют собой графовые модели причинно-следственных отношений между случайными переменными. В байесовых сетях могут органически сочетаться эмпирические частоты появления различных значений переменных, субъективные оценки «ожиданий» и теоретические представления о математических вероятностях тех или иных следствий из априорной информации. Это является важным практическим преимуществом и отличает байесовы сети от других методик информационного моделирования.
Байесовы  сети широко применяются в таких  областях, как медицина, стратегическое планирование, финансы и экономика. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Основные  понятия и определения

Законы  теории вероятностей.

 
Понятие вероятности ассоциируется с  проведением эксперимента, результаты которого, именуемые исходами, изменяются случайным образом. Множество всех возможных исходов эксперимента называется пространством элементарных событий, а любое подмножество этого пространства – событием.
Эксперимент может быть связан также с непрерывным  пространством событий.
Если  в эксперименте, состоящем из n опытов, событие Е имело место m раз, то вероятность P{E} появления события Е математически определяется соотношением

Приведенное определение означает, что если эксперимент  повторяется бесконечное число  раз, то, искомая вероятность представляется граничным значение дроби m/n.
По  определению  , где вероятность P{E} равна 0, если событие E невозможно, и 1, если оно достоверно. 

Законы  сложения вероятностей.

 
Для двух событий E и F запись E+F означает их объединение, а EF – пересечение. События E и F называются несовместными (взаимно исключающими), если они не пересекаются, т.е. наступление одного события исключает возможность реализации другого. При принятых определениях закон сложения вероятностей определяется соотношением

Первая  строка системы в случае несовместности E и F, вторая - иначе.
Вероятность того, что события E и F произойдут одновременно, обозначается как P{EF}. Если эти события независимы, тогда
 

Условные  вероятности.

 
Для двух события E и F условная вероятность события E при условии, что наступило событие F, обозначается как P{E|F} и определяется по формуле

Если  событие E содержится в событии F (т.е. множество исходов E является подмножеством исходов F), тогда

Два события E и F являются независимыми тогда и только тогда, когда выполняется равенство P{E|F}=P{E}. В этом случае формула условной вероятности сводится к следующему

Теорема умножения, если соответствующие условные вероятности определены

Теорема умножения для большого числа  событий, если соответствующие условные вероятности определены

Формула полной вероятности для группы несовместных событий Bi


Формула Байеса.

 
Пусть Ai – полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности

Доказательство  следует из теоремы умножения  и формулы полной вероятности. 

Введение  в байесовские  сети доверия.

 
Байесовские сети доверия – Bayesian Belief  Network –  используются в тех областях, которые характеризуются наследованной неопределённостью. Эта неопределённость может возникать вследствие:
    неполного понимания предметной области;
    неполных знаний;
    когда задача характеризуется случайностью.
 
Таким образом, байесовские сети доверия (БСД) применяют для моделирования ситуаций, содержащих неопределённость в некотором смысле. Для байесовских сетей доверия иногда используется ещё одно название причинно-следственная сеть, в которых случайные события соединены причинно-следственными связями.
Соединения методом причин и следствий позволяют более просто оценивать вероятности событий. В реальном мире оценивание наиболее часто делается в направлении от “наблюдателя” к  “наблюдению”, или от “эффекта” к “следствию”, которое в общем случае более сложно оценить, чем направление  “следствие –>     эффект”, то есть в направлении от следствии.

Рис.1. Пример простейшей байесовской сети доверия. 
 

Рассмотрим  пример сети (рис.1), в которой вероятность  пребывания вершины «e» в различных  состояниях (ek) зависит от состояний (ci , dj) вершин «c» и «d» и определяется выражением:

где p(ek|ci, dj) – вероятность пребывания в состоянии ek в зависимости от состояний ci, dj. Так как события, представленные вершинами «c» и «d» независимы, то
p(ek |ci , dj) = p(ci) *p(dj). 


Рис.2. Двухуровневая БСД. 
 

Рассмотрим  пример более сложной сети (рис.2). Данный рисунок иллюстрирует условную независимость событий. Для оценки вершин «c» и «d» используются те же выражения, что и  для вычисления p(ek), тогда:
  
,
  
.
Из  этих выражений видно, что вершина  «e» условно не зависит от вершин A1, A2, B1, B2, так как нет стрелок  непосредственно соединяющих эти  вершины.
Рассмотрев  эти примеры попробуем теперь более точно определить основные понятия, используемые в БСД. Байесовские сети доверия — это направленный ациклический граф, обладающий следующими свойствами:
    каждая вершина представляет собой событие, описываемое случайной величиной, которая может иметь несколько состояний;
    все вершины, связанные с “родительскими” определяются таблицей условных вероятностей (ТУВ) или функцией условных вероятностей (ФУВ);
    для вершин без “родителей” вероятности её состояний являются безусловными ( маргинальными).
Другими словами, в байесовских сетях  доверия вершины представляют собой случайные переменные, а дуги – вероятностные зависимости, которые определяются через таблицы условных вероятностей. Таблица условных вероятностей каждой вершины содержит вероятности состояний этой вершины при условии состояний её  “родителей”.

Моделирование в условиях неопределенности

Экспертные  системы и формальная логика

 
Попробуем проследить за способом работы эксперта в некоторой определенной области. Примерами экспертов являются врач, проводящий обследование, финансист, изучающий условия предоставления ссуды, либо пилот, управляющий самолетом.
Действия  эксперта могут условно быть представлены в виде повторяющейся последовательности из трех этапов:
    получение информации о состоянии окружающего мира;
    принятие решения относительно выбора некоторых действий, по поводу которых у эксперта имеются определенные ожидания последствий;
    приобретение опыта путем сопоставления результатов действий и ожиданий и возврат к первому этапу.
 
Приобретенный новый опыт и информация о мире позволяют эксперту сообразно действовать в будущем. Попытки компьютерного моделирования действий эксперта привели в конце 60-х годов к появлению экспертных систем (ЭС) , которые чаще всего основывались на продукционных правилах типа «ЕСЛИ условие, ТО факт или действие». Будущее подобных систем связывалось при этом с заменой экспертов их моделями. Однако после первых успехов обнажились проблемы, и первой среди них — серьезные затруднения при попытках работы с нечеткой, недоопределенной информацией.
Следующие поколения ЭС претерпели кардинальные изменения:
    вместо моделирования эксперта моделируется предметная область;
    вместо попыток учета неопределенности в правилах — использование классической теории вероятностей и теории принятия решений;
    вместо попыток замены эксперта — оказание ему помощи.
 
В конце 80-х годов были предложены обобщения ЭС в виде байесовых  сетей, и была показана практическая возможность вычислений вероятностных выводов даже для сетей больших размеров. Вернемся к трехэтапному описанию профессиональных действий эксперта. Сейчас нас будет интересовать вопрос, как наблюдения эксперта, т. е. получение им информации о внешнем мире, изменяют его ожидания по поводу ненаблюдаемых событий? 

Особенности вывода суждений в  условиях неопределенности

 
Суть  приобретаемого знания в условиях неопределенности состоит в понимании, влияет ли полученная информация на наши ожидания относительно других событий. Основная причина трудностей при использовании систем, основанных на правилах, состоит в учете «сторонних», «косвенных» последствий наблюдаемых событий. Проиллюстрируем это на уже успевшем стать классическим примере.
Шерлок  Холмс вышел из дома утром и  заметил, что трава вокруг влажная. Он рассудил: «Я думаю, что ночью был дождь. Следовательно, трава возле дома моего соседа, доктора Ватсона, вероятно, также влажная». Таким образом, информация о состоянии травы у дома Холмса повлияла на его ожидания относительно влажности травы у дома Ватсона. Но предположим, что Холмс проверил состояние сборника дождевой воды и обнаружил, что тот - сухой. В результате Холмс вынужден изменить ход своих рассуждений, и состояние травы возле его дома перестает влиять на ожидания по поводу травы у соседа.
Теперь  рассмотрим две возможные причины, почему трава у дома Холмса оказалась  влажной. Помимо дождя, Холмс мог просто забыть выключить поливальную установку накануне. Допустим, на следующее утро Холмс снова обнаруживает, что трава влажная. Это повышает его субъективные вероятности и для прошедшего дождя, и по поводу забытой дождевальной установки. Затем Холмс обнаруживает, что трава у дома Ватсона также влажная и заключает, что ночью был дождь.
Следующий шаг рассуждений практически  невозможно воспроизвести в системах, основанных на правилах, однако он абсолютно  естественен для человека: влажность травы у дома Ватсона объясняется дождем, и следовательно нет оснований продолжать ожидать, что была забыта включенной поливальная машина. Следовательно, возросшая, было, субъективная вероятность относительно забытой поливальной машины уменьшается до (практически) исходного значения, имевшего место до выхода Холмса из дома. Такой способ рассуждения можно назвать «попутное объяснение», «контекстное объяснение» или «редукция причины» (explaining away).
Важная  особенность «попутного объяснения»  состоит в изменении отношений зависимости между событиями по мере поступления информации. До выхода из дома Холмса факты дождя и работы поливальной установки были независимы. После получения информации о траве у дома они стали зависимыми. Далее, когда появилась информации о влажности травы у дома Ватсона, состояние зависимости вновь изменилось.
Эту ситуацию удобно описать при помощи графа, узлы которого представляют события (или переменные), а пара узлов (A, B) связывается направленным ребром, если информация об A может служить причиной для B. В этом случае узел A будет родителем для B, который, в свою очередь, называется узлом-потомком по отношению к A.
История с травой у Холмса и Ватсона  представлена на рис. 1. 
 


Рисунок 1 Граф рассуждений Шерлока Холмса 
 

Граф  на рис. 1 может быть отнесен к  семейству байесовых сетей. В  данном примере переменные в узлах могут принимать только булевы значения 1 или 0 (да/нет). Из графа на рис. 1 можно сделать несколько полезных выводов о зависимости и независимости переменных. В традиционной постановке байесовы сети не предназначены для оперирования с непрерывным набором состояний (например, с действительным числом на заданном отрезке). Для представления действительных чисел в некоторых приложениях можно провести разбиение отрезка на сегменты и рассматривать дискретный набор их центров.
Например, если известно, что ночью не было дождя, то информация о состоянии  травы у дома Ватсона не оказывает  влияния на ожидания по поводу состояния  травы у дома Холмса.
В середине 80-х годов были подробно проанализированы способы, которыми влияние информации распространяется между переменными в байесовой сети. Будем считать, что две переменные разделены, если новые сведения о значении одной из них не оказывают влияния на ожидания по поводу другой. Если состояние переменной известно, мы будем называть такую переменную конкретизированной.
В байесовой сети возможны три типа отношений между переменными:
    последовательные соединения (рис. 2a);
    дивергентные соединения (рис. 2b),;
    конвергентные соединения (рис. 2c).
Ситуация  на рис. 2c требует, по-видимому, дополнительных пояснений—как возникает зависимость между предками конвергентного узла, когда становится известным значение потомка. Для простоты рассмотрим пример, когда узел A имеет всего двух предков –B и C. Пусть эти две переменные отвечают за выпадение орла и решки при независимом бросании двух разных монет, а переменная A — логический индикатор, который «загорается», когда обе монеты оказались в одинаковом состоянии (например, обе - решки). Теперь легко понять, что если значение индикаторной переменной стало известным, то значения B и C стали зависимыми — знание одного из них полностью определяет оставшееся.
Общее свойство (условной) независимости  переменных — узлов в байесовой сети получило название d-разделения (d-separation). 

Определение d-разделимости

 
Две переменные A и B в байесовой сети являются d-разделенными, если на каждом пути, соединяющем эти две вершины  на графе, найдется промежуточная переменная V, такая что:
    соединение с V последовательное или дивергентное и значение V известно, либо
    соединение конвергентное и нет свидетельств ни о значении V, ни о каждом из ее потомков.
 
Так, в сети задачи Шерлока Холмса (рис. 1) переменные «Полив?» и «Трава у  дома Ватсона?» являются d-разделенными. Граф содержит на пути между этими переменными конвергентное соединение с переменной «Трава у дома Холмса?». 
 

 
 

(a) 

 
 

(b) 
 


(c) 

Рисунок 2 Три типа отношений между переменными 

(a) Последовательное соединение. Влияние информации может распространяться от A к C и обратно, пока значение B не конкретизировано. (b) Дивергентное соединение. Влияние может распространяться между потомками узла A, пока его значение не конкретизировано. (c) Конвергентное соединение. Если об A ничего не известно, кроме того, что может быть выведено из информации о его предках B,C,... ,E, то эти переменные предки являются разделенными. При уточнении A открывается канал взаимного влияния между его предками.
Свойство d-разделимости соответствует особенностям логики эксперта-человека, поэтому крайне желательно, чтобы в рассуждениях машин относительно двух d-разделенных переменных новая информация об одной из них не изменяла степень детерминированности второй переменной. Формально, для переменных A и C, независимых при условии B, имеет место соотношение P(A | B) = P(A | B, C).
Отметим, что интуитивное восприятие условной зависимости и независимости иногда, даже в простых случаях, оказывается затрудненным, так как сложно из всех исходов событий мысленно выделить только те события, в которых значение обусловливающей переменной определено, и далее в рассуждения оперировать только ими.
Вот простой пример, поясняющий эту трудность: в некотором сообществе мужчины среднего возраста и молодые женщины оказались материально более обеспеченными, чем остальные люди. Тогда при условии фиксированного повышенного уровня обеспеченности пол и возраст человека оказываются условно зависимыми друг от друга!
Еще один классический пример, связанный с особенностями условных вероятностей. Рассмотрим некоторый колледж, охотно принимающий на обучение сообразительных и спортивных молодых людей (и тех, кто обладает обоими замечательными качествами!). Разумно считать, что среди всех молодых людей студенческого возраста спортивные и интеллектуальные показатели независимы. Теперь если вернуться к множеству зачисленных в колледж, то легко видеть, что высокая сообразительность эффективно понижает вероятность спортивности и наоборот, так как каждого из этих свойств по-отдельности достаточно для приема в колледж. Таким образом, спортивность и умственные показатели оказались зависимыми при условии обучения в колледже. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Использование Байесовых сетей.

Вероятности прогнозируемых значений отдельных переменных

 
   На  практике нам необходимы распределения  интересующих нас переменных, взятые по отдельности. Они могут быть получены из соотношения для полной вероятности при помощи маргинализации — суммирования по реализациям всех переменных, кроме, выбранных.
   Приведем  пример точных вычислений в простой  байесовой сети, моделирующей задачу Шерлока Холмса. Обозначения и смысл переменных в сети : R —был ли дождь, S — включена ли поливальная установка, C — влажная ли трава у дома Холмса, и W — влажная ли трава у дома Ватсона.
   Все четыре переменные принимают булевы значения 0 — ложь, (f) или 1 — истина (t). Совместная вероятность P(R, S, C, W), таким  образом, дается совокупной таблицей из 16 чисел. Таблица вероятностей нормирована, так что
   
   Зная  совместное распределение, легко найти  любые интересующие нас условные и частичные распределения. Например, вероятность того, что ночью не было дождя при условии, что трава  у дома Ватсона — влажная, дается простым вычислением:
    
   Из  теоремы об умножении вероятностей полная вероятность представляется цепочкой условных вероятностей:
   P(R, S, C, W) = P(R) * P(S | R) * P(C |R,S)*P(W | R, S, C).
   В описанной ранее байесовой сети ориентированные ребра графа  отражают суть вероятностей, которые реально имеют место в задаче. Поэтому формула для полной вероятности существенно упрощается:
   P(R, S, C, W) = P(R) *P(S) * P(C |R,S)*P(W | R).
   Порядок следования переменных в соотношении  для полной вероятности, вообще говоря, может быть любым. Однако на практике целесообразно выбирать такой порядок, при котором условные вероятности максимально редуцируются. Это происходит, если начинать с переменных-«причин», постепенно переходя к «следствиям». При этом полезно представлять себе некоторую «историю», согласно которой причины влияют на следствия.
и т.д.................


Перейти к полному тексту работы


Скачать работу с онлайн повышением уникальности до 90% по antiplagiat.ru, etxt.ru или advego.ru


Смотреть полный текст работы бесплатно


Смотреть похожие работы


* Примечание. Уникальность работы указана на дату публикации, текущее значение может отличаться от указанного.