条件概率是指事件A在事件B确定发生下的概率,符号定义是P(A|B)

联合概率是指事件A和B共同发生的概率,符合定义是P(AB)

边缘概率是指某个事件A发生的概率,符号定义是P(B)

AB共同发生,可以分解为

  • 先发生B,那么P(B)
  • 在B确定发生的前提下,再发生A,那么P(A|B)

这是一个乘法的关系,所以它们的联系是:

  • P(B)*P(A|B)=P(AB)

那么当P(B)!=0时,条件概率的计算公式是:

  • P(A|B)=P(AB)/P(B)
  • 即条件概率=联合概率/边缘概率

贝叶斯定理是怎么回事?

由条件概率定义,

  • P(AB)=P(B)*P(A|B)
  • P(BA)=P(A)*P(B|A)

另外,P(AB)=P(BA),所以

  • P(B)*P(A|B) = P(A)*P(B|A)

所以,

  • P(A|B) = P(A)*P(B|A)/P(B)                         公式1

公式1就是贝叶斯定理,

可以用文氏图表示

image

  • 整个矩形面积是1
  • 左圆是事件A发生的概率P(A),右圆是事件B发生的概率P(B)
  • 两圆相交即为AB同时发生的概率P(AB)
  • 相交部分面积/左圆面积,即P(B|A)
  • 相交部分面积/右圆面积,即P(A|B)

附注(some statistics variable)

U= E(X)

Var(X) = E((X-U)^2)

Q(X) = sqrt(Var(X))

Cov(X,Y) = E((X-Ux)(Y-Uy))

P(X,Y) = Cov(X,Y)/(Q(X)*Q(Y))