R语言混合正态分布极大似然估计和EM算法

为了在统计过程中发现更多有趣的结果,我们将解决极大似然估计没有简单分析表达式的情况。

由Kaizong Ye,Coin Ge撰写

举例来说,如果我们混合了各种分布,

作为说明,我们可以使用样例数据

第一步是编写混合分布的对数似然函数

极大似然性的最简单函数如下(从一组初始参数开始,只是为了获得梯度下降的起点)

因为我们可以通过使用约束优化算法来做到“更好”,例如,概率一定在0到1之间。


热门课程

R语言数据分析挖掘必知必会

面对扑面而来的数据浪潮,包含Google、Facebook等国际企业,都已采用R语言进行数据分析

探索课程

为了可视化估计的密度,我们使用

另一个解决方案是使用EM算法。我们将从参数的初始值开始,并比较属于每个类的机会

从属于每个类别的这些概率中,我们将估算两个正态分布的参数。使用极大似然

这个想法实际上是有一个循环的:我们估计属于这些类的概率(考虑到正态分布的参数),一旦有了这些概率,就可以重新估计参数。然后我们再次开始

然后,我们恢复混合分布的“最佳”参数

这相对接近我们的估计。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498