条件概率是指事件A在事件B确定发生下的概率,符号定义是P(A|B)
联合概率是指事件A和B共同发生的概率,符合定义是P(AB)
边缘概率是指某个事件A发生的概率,符号定义是P(B)
AB共同发生,可以分解为
- 先发生B,那么P(B)
- 在B确定发生的前提下,再发生A,那么P(A|B)
这是一个乘法的关系,所以它们的联系是:
- P(B)*P(A|B)=P(AB)
那么当P(B)!=0时,条件概率的计算公式是:
- P(A|B)=P(AB)/P(B)
- 即条件概率=联合概率/边缘概率
贝叶斯定理是怎么回事?
由条件概率定义,
- P(AB)=P(B)*P(A|B)
- P(BA)=P(A)*P(B|A)
另外,P(AB)=P(BA),所以
- P(B)*P(A|B) = P(A)*P(B|A)
所以,
- P(A|B) = P(A)*P(B|A)/P(B) 公式1
公式1就是贝叶斯定理,
可以用文氏图表示
- 整个矩形面积是1
- 左圆是事件A发生的概率P(A),右圆是事件B发生的概率P(B)
- 两圆相交即为AB同时发生的概率P(AB)
- 相交部分面积/左圆面积,即P(B|A)
- 相交部分面积/右圆面积,即P(A|B)
附注(some statistics variable):
U= E(X)
Var(X) = E((X-U)^2)
Q(X) = sqrt(Var(X))
Cov(X,Y) = E((X-Ux)(Y-Uy))
P(X,Y) = Cov(X,Y)/(Q(X)*Q(Y))