R语言中广义线性模型(GLM)中的分布和连接函数分析

通常,GLM的连接函数可能比分布更重要。

为了说明,考虑以下数据集,其中包含5个观察值

然后考虑具有不同分布的几个模型,以及一个链接

还可以考虑一些Tweedie分布,甚至更一般

考虑使用线性链接函数在第一种情况下获得的预测


热门课程

R语言数据分析挖掘必知必会

面对扑面而来的数据浪潮,包含Google、Facebook等国际企业,都已采用R语言进行数据分析

探索课程

这些预测非常接近。在指数预测的情况下,我们获得

我们实际上可以近距离看。例如,在线性情况下,考虑使用Tweedie模型获得的斜率(实际上将包括此处提到的所有参数famile)

对于Gamma回归或高斯逆回归,由于方差是预测的幂,因此,如果预测较小,则方差应该较小。因此,在图的左侧,误差应该较小,并且方差函数的功效更高。

当然,我们可以对指数模型做同样的事情

或者,如果我们添加置信区间,我们将获得

​  

因此,这里的“斜率”也非常相似…如果我们看一下在图表左侧产生的误差,可以得出

因此,分布通常也不是GLM上最重要的一点。


可下载资源

​非常感谢您阅读本文,如需帮助请联系我们!


关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。


 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498