贝叶斯网络是用于处理概率事件并解决不确定性问题的关键计算机技术。我们可以将贝叶斯网络定义为:
"贝叶斯网络是一种概率图形模型,它使用有向无环图表示一组变量及其条件相关性。"
它是也称为贝叶斯网络,信念网络,决策网络或贝叶斯模型。
贝叶斯网络是概率性的,因为这些网络是基于概率分布,并且还将概率论用于预测和异常检测。
现实世界中的应用程序本质上是概率性的,为了表示多个事件之间的关系,我们需要一个贝叶斯网络。它也可以用于各种任务,包括预测,异常检测,诊断,自动洞察,推理,时间序列预测和不确定情况下的决策。
贝叶斯网络可用于根据数据和专家的意见构建模型,它包括两个部分:
有向无环图
条件概率表。
在不确定知识下表示和解决决策问题的贝叶斯网络的广义形式称为影响图。
贝叶斯网络图由节点和弧(定向链接)组成,其中:
每个节点与随机变量相对应,并且变量可以是连续或离散。
圆弧或有向箭头代表随机变量之间的因果关系或条件概率。这些有向链接或箭头连接图中的一对节点。
这些链接表示一个节点直接影响另一个节点,如果没有有向链接,则意味着节点彼此独立。 在上图中,A,B,C和D是由网络图的节点表示的随机变量。 如果我们正在考虑通过有向箭头将其与节点A连接的节点B,则将节点A称为节点B的父级。 节点C独立于节点A。
注意: 贝叶斯网络图不包含任何循环图。因此,它被称为有向无环图或DAG。
贝叶斯网络主要有两个组成部分:
原因成分
实际数字
贝叶斯网络中的每个节点都有条件概率分布 P(X
i | Parent(X
i )),确定父节点对该节点的影响。
贝叶斯网络基于联合概率分布和条件概率。因此,让我们首先了解联合概率分布:
联合概率分布:
如果我们有变量x1,x2,x3,.....,xn,那么x1,x2,x3..xn的不同组合的概率称为联合概率分布。
P [x
1 ,x
2 ,x
3 ,.....,x
n ] ,就联合概率分布而言,可以这样写。
= P [x
1 | x
2 ,x
3 ,.....,x
n ] P [x
2 ,x
3 ,.....,x
n ]
= P [x
1 | x
2 ,x
3 ,.....,x
n ] P [x
2 | x
3 ,.....,x
n ] .... P [x
n-1 | x
n ] P [x
n ]。
通常对于每个变量Xi,我们都可以将等式写为:
P(Xi|Xi-1,........., X1) = P(Xi |Parents(Xi ))
贝叶斯网络的解释:
让我们通过创建一个有向非循环图的示例来了解贝叶斯网络:
示例: 哈利在家里安装了一个新的防盗警报器,以侦查盗窃案。该报警器在检测到爆窃时可靠地做出响应,但也对轻微地震做出响应。哈利有两个邻居戴维(David)和索菲亚(Sophia),当他们听到警报时,他们有责任在工作中通知哈利。大卫在听到警报时总是打给哈利,但有时他对电话铃响感到困惑,并在那个时候打电话。另一方面,索菲亚(Sophia)喜欢听音乐,所以有时她错过了听到警报的声音。在这里,我们要计算盗窃警报的概率。
问题:
计算警报响起但没有入室盗窃或发生地震以及戴维和索菲亚的可能性都叫哈利。
解决方案:
上述问题的贝叶斯网络如下。网络结构表明,爆窃和地震是警报的父节点,并直接影响警报响起的可能性,但是David和Sophia的呼叫取决于警报的可能性。
网络表示我们的假设不能直接感知盗窃,也不会注意到小地震,并且在致电之前也没有商定。
每个节点的条件分布以条件概率表或CPT的形式给出。
CPT中的每一行都必须为1,因为表中的所有条目都代表该变量的详尽案例集。
在CPT中,具有k个布尔父级的布尔变量包含2 K 个概率。因此,如果有两个父母,那么CPT将包含4个概率值
此网络中发生的所有事件的列表:
盗窃(B)
地震(E)
警报(A)
David Calls(D)
Sophia通话(S)
我们可以以概率形式写问题陈述的事件: P [D,S,A,B,E] ,可以使用联合概率来重写上述概率陈述分布:
P [D,S,A,B,E] = P [D | S,A,B,E]。 P [S,A,B,E]
= P [D | S,A,B,E]。 P [S | A,B,E]。 P [A,B,E]
= P [D |一种]。 P [S | A,B,E]。 P [A,B,E]
= P [D |一种]。 P [S |一种]。 P [A | B,E]。 P [B,E]
= P [D |一种 ]。 P [S |一种]。 P [A | B,E]。 P [B | E]。 P [E]
让我们观察一下被盗的可能性地震分量:
P(B = True)= 0.002,这是入室盗窃的可能性。
P(B = False)= 0.998,这是没有爆窃的可能性。
P(E =真)= 0.001,这是发生小地震的可能性
P(E = False)= 0.99,这是未发生地震的可能性。
我们可以根据下表提供条件概率:
警报A的条件概率表:
条件概率警报A取决于防盗和地震:
B |
E |
P(A = True) |
P(A = False) |
true |
true |
0.94 |
0.06 |
true |
false |
0.95 |
0.04 |
false |
true |
0.31 |
0.69 |
false |
false |
0.001 |
0.999 |
David Calls的条件概率表:
David将要呼叫的条件概率取决于Alarm的概率。
A |
P(D = True) |
P(D = False) |
true |
0.91 |
0.09 |
false |
0.05 |
0.95 |
Sophia呼叫的条件概率表:
她呼叫的Sophia的条件概率取决于其父节点"警报"。
A |
P(S = True) |
P(S = False) |
true |
0.75 |
0.25 |
false |
0.02 |
0.98 |
从联合分布的公式中,我们可以以概率分布的形式写问题陈述:
P(S,D,A,¬B,¬E )= P(S | A)* P(D | A)* P(A |¬B^¬E)* P(¬B)* P(¬E)。
= 0.75 * 0.91 * 0.001 * 0.998 * 0.999
= 0.00068045、
因此,贝叶斯网络可以使用联合分发来回答有关该域的任何查询。
贝叶斯网络的语义:
有两种方法可以理解贝叶斯网络的语义,如下所示:
1、以了解网络作为联合概率分布的表示。
了解如何构建网络很有帮助。
2、将网络理解为条件独立性声明集合的编码。
这对设计推理过程很有帮助。