Fuck me on GayHub

极大似然估计的朴素理解

最大似然法,英文名称是Maximum Likelihood Method,在统计中应用很广。这个方法的思想最早由高斯提出来,后来由菲舍加以推广并命名。

最大似然法是要解决这样一个问题:给定一组数据和一个参数待定的模型,如何确定模型的参数,使得这个确定参数后的模型在所有模型中产生已知数据的概率最大。通俗一点讲,就是在什么情况下最有可能发生已知的事件。举个例子,假如有一个罐子,里面有黑白两种颜色的球,数目多少不知,两种颜色的比例也不知。我们想知道罐中白球和黑球的比例,但我们不能把罐中的球全部拿出来数。现在我们可以每次任意从已经摇匀的罐中拿一个球出来,记录球的颜色,然后把拿出来的球再放回罐中。这个过程可以重复,我们可以用记录的球的颜色来估计罐中黑白球的比例。假如在前面的一百次重复记录中,有七十次是白球,请问罐中白球所占的比例最有可能是多少?

我想很多人立马有答案:70%。这个答案是正确的。可是为什么呢?(常识嘛!这还要问?!)其实,在很多常识的背后,都有相应的理论支持。在上面的问题中,就有最大似然法的支持。

在很久以前的一个下午,自己在图书馆看书,书中讲到了同一独立分布(i.i.d., identical and independent distribution),与概率相关。当时已经听说最大似然法很长时间了,最大似然法在不同场合应用的结论看过不少,但自己还没有真正地学习和应用过。突然想到了上面的例子(类似的例子在自己以后的阅读很常见,当时没有意识到自己到底以前看过类似的例子没有),决定自己动手算一算。

我们假设罐中白球的比例是$p$,那么黑球的比例就是$1-p$。因为每抽一个球出来,在记录颜色之后,我们把抽出的球放回了罐中并摇匀,所以每次抽出来的球的颜色服从同一独立分布。这里我们把一次抽出来球的颜色称为一次抽样。题目中在一百次抽样中,七十次是白球的概率是$P(Data | M)$,这里$Data$是所有的数据,$M$是所给出的模型,表示每次抽出来的球是白色的概率为$p$。如果第一抽样的结果记为$x_1$,第二抽样的结果记为$x_2$,那么$Data=(x_1,x_2,:\dots:,x_{100})$。这样,

$P(Data | M)$

= $P(x_1,x_2,:\dots:,x_{100}|M)$

= $P(x_1|M)P(x_2|M)…P(x_{100}|M)$

= $p^{70}(1-p)^{30}$

那么$p$在取什么值的时候,$P(Data |M)$的值最大呢?将$p^{70}(1-p)^{30}$对$p$求导,并其等于零。

$70p^{69}(1-p)^{30}-p^{70}*30(1-p)^{29}=0。$

解方程可以得到$p=0.7$。

参考文献

学习之恍然大悟时刻:最大似然法

http://www.zhizhihu.com/html/y2010/1520.html