"http://www.dore.ru/perl/nntp.pl?f=1&gid=17&mid=69362":
Э-муэ...
А можно конкретнее?
Теорема Байеса относится к расчёту апостериорных вероятностей, т.е. у нас есть
несколько вариантов, для каждого из которых априори заданы вероятности
(пациент может быть: 0 - здоров, 1 - инфаркт, 2 - пьян, 3 - травма... - и
каждое состояние ожидается с вероятностью P[i])
При этом известно, что некоторое событие B наступает в состоянии i с
вероятностью P(B|i) - боли в области сердца у здорового с вероятностью 0.01,
при инфакте 0.60, у пьяного 0.05, при травме 0.20 и т.п.
О наступлении события В нам известно. Теорема Байеса позволяет отыскать
апостериорные ("после опыта") вероятности состояний.
P(i|B)=P[i]*P(B|i)/SUM(P[j]*P(B|j))
Hо чтобы довести до алгоритмизации, желательна более конкретная постановка...
Евгений Машеров АКА СанитарЖеня 2:5020/828.46
Неплохое объяснение. Немного разжую.
У нас есть пространство событий для поступивших людей:
E
1 — здоров
E
2 — инфаркт
E
3 — пьян
E
4 — травма
Пока возьмём эти 4. Пространство — это умное слово, обозначающее все возможные события, которые могут произойти. В нашей модели их четыре. Это не значит, что не может быть других состояний в принципе. Их не может быть в нашей модели. Чувствуешь разницу.
Теперь у нас есть четыре вероятности, которые известны:
P(E
1)=P
1
P(E
2)=P
2
P(E
3)=P
3
P(E
4)=P
4
Для нас важно то, что P
1+P
2+P
3+P
4=1 — по определению сумма вероятностей по всему пространству событий всегда равна 1.
Теперь у нас есть ещё событие — боли в области сердца. Назовём его В. Таких событий может быть несколько тоже. Но в приведённом примере — только одна. Очевидно, что вероятность события В зависит от состояния человека. Обозначают это дело Р(В|Е
i), где i пробегает от 1 до 4 в нашем случае. Важно опять, что сумма всех P[i]*P(B|i)/SUM(P[j]*P(B|j)) = 1.
Так вот, у тебя есть человек с жалобой на боли в сердце. Тебе надо отыскать вероятность того, какой он был — здоровый, больной, пьяный или с трамвой. Т.е. у тебя событие В зависит от Е
i, а получилось наоборот у тебя уже В на руках, а надо отыскать как было до этого. Вот Байес и позволяет:
Обратная условная вероятность Р(E
i|B) — какова вероятность, что у человек инфаркт, если он жалуется на боли в сердце — Р(E
1|B). Такая вероятность может быть вычисленна по формулке:
Р(E
i|B)=P(E
i)*P(B|E
i)/(P(E
1)*P(B|E
1)+P(E
2)*P(B|E
2)+P(E
3)*P(B|E
3)+P(E
4)*P(B|E
4))
Скажем, ты сидишь в скорой и знаешь, что прибывающие люди делятся на эти четыре категории. Пусть вероятности будут такими:
P(E
1)=P
1=0.2
P(E
2)=P
2=0.25
P(E
3)=P
3=0.45
P(E
4)=P
4=0.1
И вероятности жалобы на боли в груди такие:
Р(В|Е
1)=0.03
Р(В|Е
2)=0.9
Р(В|Е
3)=0.01
Р(В|Е
4)=0.06
И вот приехал человечек к тебе с жалобой на боли в груди. Какова вероятность, что у него инфаркт? Считаем по Байесу:
Р(E
2|B)=P
2*P(B|E
2)/(P
1)*P(B|E
1)+P
2*P(B|E
2)+P
3*P(B|E
3)+P
4*P(B|E
4))=
0.25*0.9/(0.2*0.3+0.25*0.9+0.45*0.01+0.1*0.06)=0.225/(0.06+0.225+0.0045+0.006)=0.225/0.2955=0.761421319
Легко проверить, что сумма всех Р(E
i|B) будет единица.
Числитель станет равным знаменателю.
В числителе в формуле только одна часть из суммы в знаменателе. Если сложить всё вместе, то и будет числитель равен знаменателю.
Фу, не знаю, стало ли понятнее.
PS Пришлось индексировать с 1 до 4, а то тэг нижнего индекса не пашет у нас для 0.