在保险业中,由于分散投资,通常会在合法的大型投资组合中提及大数定律。在一定时期内,损失“可预测”。
当然,在标准的统计假设下,即有限的期望值和独立性。由于在保险业中,灾难通常很少发生,而且代价非常高昂,精算师可能有兴趣对少量事件的发生进行建模。背后的定理有时也被称为小数定律。
可下载资源
泊松分布
所谓的泊松分布(请参阅http://en.wikipedia.org/…)由SiméonPoisson于1837年进行了介绍。亚伯拉罕·德·莫伊夫(Abraham De Moivre)于1711年在De Mensura Sortis seu对其进行了定义。
让
De Moivre从二项式分布的近似值获得了该分布。回想一下,二项式分布是精算科学中的标准分布,例如,用来模拟
而如果
小数定律
与Poisson分布有关的主要定理的启发式如下:
启发式方法是,如果考虑大量观察值,并且计算给定(小)区域中有多少观察值,则此类观察值的数量就是泊松分布。
n=1000
polygon(c(u,rev(u)),c(v,rev(-v)),col="yellow",border=NA)
I=(X^2+Y^2)<1
points(X[I],Y[I],cex=.6,pch=19,col="red")
如果我们进行一些模拟
> n=1000
> ns=100000
> N=rep(NA,ns)
>
+
+
+
+
+
>
> mean(N)
[1] 31.41257
泊松分布的参数是黄色圆盘的面积,即正方形的面积,即
> lines(0:60-.5,dpois(0:60,lambda),type="b",col="red")
为了获得与保险模型有关的解释,让我们
泊松过程
如上所述,当事件以某种方式随机且独立地随时间发生时,就会出现泊松分布。然后很自然地研究两次事件之间的时间(或在保险范围内两次索赔)。
泊松分布和索赔发生
既不是SiméonPoisson也不是De Moivre,而是Ladislaus Von Bortkiewicz首先提到了Poisson分布是小数定律。1898年,他研究了1875年至1894年间被马踢倒杀死的士兵的人数,其中有200个兵团。
他确实获得了以下分布(此处,泊松分布的参数为0.61,即每年的平均死亡人数)
在很多情况下,泊松分布都非常适合。例如,如果我们考虑1850年后在佛罗里达州的飓风数量,
泊松分布和回归期
返回期是由Emil Gumbel在水文学中介绍的,用于链接概率和持续时间。十年事件的发生概率为1/10。那么10是发生之前的平均等待时间。这并不意味着该事件不会在10年之前发生,或者必须在10年之前发生。考虑一个返回期
则
上表中的对角线非常有趣。似乎在某种程度上趋向极限值(此处为63.2%)。在n年内观察到的事件数量具有二项式分布,其概率为
稀有概率与泊松分布
计算稀有事件的概率时,泊松分布不断出现。例如,在50年的时间里,至少有一次在核电厂发生事故的可能性。假设在反应堆中发生事故的年概率
当然,线性近似是不正确的
另一方面
>
>
[1] 0.1812733
>
[1] 0.1812692
这是具有参数为的泊松分布
解决这个问题的另一种方法是基于以下思想:鉴于在对全球450座反应堆进行的45年观察中(,观察到了三起重大事故,包括“三哩岛”(1979年)和“福岛”(2011年),即两次事故之间的平均时间估计为16年。对于单个反应堆,我们可以假设事件发生之前等待的平均时间是16年的450倍,即7200年。或者,一个反应堆在一年内发生一次事件的概率是7200以上的事件之一(这是“返还期”概念背后的想法)。如果我们假设事故的到来是随机且彼此独立发生的(如上定义),则在50年内观察到的重大事故数量遵循参数为50 /(7200/80)的泊松分布。也,
即
>
[1] 0.4262466
可下载资源
关于作者
Kaizong Ye是拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。
本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。
非常感谢您阅读本文,如需帮助请联系我们!