R语言Lee-Carter模型对年死亡率建模预测期望寿命

正如有配偶的寿命之间存在很强的相关性,我们可能会问,孩子和孙子的出生是否具有对一个人的剩余生命的影响(或者我们是否可以像这样假设独立性)。

由Kaizong Ye,Sherry Deng撰写

最近我们被客户要求撰写关于死亡率建模的研究报告,包括一些图形和统计输出。昨天上午,我们获得了分娩产妇的平均年龄两个图表,根据孩子的出生顺序排序,区间是1905-1965年

然后是1960-2000年:

这些图形令人兴奋,特别是在过去30年中观察到的增长方面,这使我想到了寿命的增长趋势。

我们可以找到其他有趣的数据(在这种情况下为平均 出生年龄 )。


课程

R语言数据分析挖掘必知必会

从数据获取和清理开始,有目的的进行探索性分析与可视化。让数据从生涩的资料,摇身成为有温度的故事。

立即参加

 
> age$Age=as.character(age$AGE)
> age$AGE=as.numeric(substr(age$Age,1,2))+
+ as.numeric(substr(age$Age,4,4))/10
> plot(age$ANNEE+.5,age$AGE,
+ type="l",lwd=2,col="blue")

我们在上面的图中发现深蓝色的曲线,

获取祖母的平均年龄,我们进一步分析

 
> tail(age)
      AGE   Age NAIS.MERE NAIS.GRD.MERE age.GRD.MERE
2000  2000 30.3 30,3     1970.2       1942.87        57.63
2001  2001 30.4 30,4     1971.1       1943.80        57.70
2002  2002 30.4 30,4     1972.1       1944.92        57.58
2003  2003 30.5 30,5     1973.0       1945.95        57.55
2004  2004 30.5 30,5     1974.0       1947.05        57.45
2005  2005 30.6 30,6     1974.9       1948.04        57.46
> plot(age$ANNEE+.5,age$age.GRD.MERE,
+ type="l",lwd=2,col="red")

再一次,我们可以形象地看到外婆的出生年龄

我们可以通过使用Lee-Carter模型对年死亡率进行建模,并推断到当前世纪,我们可以推断出剩余期望寿命。

> Deces <- read.table("Dec.txt",header=TRUE)
> Expo  <- read.table("Expo.txt",header=TRUE,skip=2)
> Deces$Age <- as.nu
> Expo$Age <- as.numeric(as.character(Expo$Age))
> Expo$Age[is.n
Deces$Female/Expo$Female,nL,nC)
>  POPF <- matrix(Expo$Female,nL,nC)
>  BASEF <- demogdata(data=MUF, pop=POPF,ages=AGE,
+ years=YEAR, t
> K1 <- LCF$kt
nction(xentier,T){
+ return(ext) }
> EVIE = function(x,T){
+ x1 <- trunc(x)
> tail(age)
     AGE   Age NAIS.MERE NAIS.GRD.MERE age.GRD.MERE       EV
2000 30.3 30,3     1970.2       1942.87        57.63 29.13876
2001 30.4 30,4     1971.1       1943.80        57.70 29.17047
2002 30.4 30,4     1972.1       1944.92        57.58 29.39027
2003 30.5 30,5     1973.0       1945.95        57.55 29.52041
2004 30.5 30,5     1974.0       1947.05        57.45 29.72511
2005 30.6 30,6     1974.9       1948.04        57.46 29.80398


This image has an empty alt attribute; its file name is image.png

专栏

精算科学

关于结合数学、统计方法以及程序语言对经济活动来做风险分析、评估的见解。

探索专栏

换句话说,在最后一行,2005年,一名57.46岁女性的(剩余)期望寿命约为29.80岁。然后,我们不仅可以看到他祖母的平均年龄,还可以看到她的剩余期望寿命,

然后我们就可以确定曾祖母的(平均)年龄,


R语言预测人口死亡率:用李·卡特(Lee-Carter)模型、非线性模型进行平滑估计

阅读文章


以及曾祖母的(剩余)寿命

现在我们也可以对这项快速研究的局限性感到疑惑。特别是,正如有配偶的寿命之间存在很强的相关性,我们可能会问,孩子和孙子的出生是否具有对一个人的剩余生命的影响(或者我们是否可以像这样假设独立性)。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds