Matlab用回归、SEIRD模型、聚类预测美国总统大选、新冠疫情对中美经济的影响

美国总统大选全球瞩目,两位候选人的政策倾向在一些方面差异较大,对总统获选的结果的大致量化预测也是重点,同时2020年的竞选面临着新冠疫情的影响,这为预测分析带来挑战。

通过往年经验可知,美国大选实质上是民主党与共和党之间的抗争,因此我们可以在此前党派总统找到两位选举人的影子。

Haoran Chen撰写

对于两人竞选,因为对总统选举时各种政策难以量化,因此我们选择特朗普在2017年至2019年任职时的经济数据求解模型,对于拜登则通过同为民主党的奥巴马在2009年至2016年任职期间的数据求解模型,美国相同党派总统政策的趋同性支持了我们这一假设。

×

SEIR模型是传染病模型的一种,一般将传染病流行范围内的人群分为以下几类:

(1)S 类,易感者 (Susceptible),指未得病者,但缺乏免疫能力,与感染者接触后容易受到感染;

(2)E 类,暴露者 (Exposed),指接触过感染者,但暂无能力传染给其他人的人,对潜伏期长的传染病适用;

(3)I 类,感病者 (Infectious),指染上传染病的人,可以传播给 S 类成员,将其变为 E 类或 I 类成员;

(4)R 类,康复者 (Recovered),指被隔离或因病愈而具有免疫力的人。如免疫期有限,R 类成员可以重新变为 S 类。


为什么在“新冠”疫情模拟过程中选择SEIR模型作为基础模型

(1)原因一:SEIR模型相较于其他的几个传染病模型,多了几项内容。结合本次疫情分析,我们可以知道,“新冠”疫情是由为期14天的潜伏期的,而且当感染者经过治愈或是自身免疫成为治愈者后,体内产生抗体,不会再成为易感人群被感染者感染。所以在模型中E项是必须存在的。SEIR模型符合新冠疫情的传染特征。


(2)原因二:同时根现有的一些资料显示,可知,很多专业的研究团队都在使用该模型研究疫情的发展情况。例如:钟南山院士团队在Journal of Thoracic Disease《胸部疾病杂志》发表了题为“Modified SEIR and AI prediction of the epidemics trend ofCOVID-19 in China under public

health interventions”(基于SEIR优化模型和AI对在公共卫生干预下的中国COVID-19发展趋势预测)的文章。

而对于经济预测模型,我们查找FRED的经济调查数据,选择税收、CPI、工业生产指数、失业率、贸易差额、货币M1、教育支出、科研支出、圣路易斯联储金融压力指数、纳斯达克综合指数、卫生保健支出、道路建设支出等十二个指标,对GDP进行回归分析,获得GDP预测模型。

解决方案

由上模型获得的数据是未发生新冠疫情的预测值,对于新冠疫情的影响,我们通过构造SEIRD模型预测新冠疫情对美国经济的影响。

根据医疗支出及劳动能力丧失两方面带来的影响,获得经济日损失等式,据此与上述GDP预测模型结合,获得疫情下美国大选后经济走向。而特朗普和拜登二者的政策在疫情防控的侧重点不同,进而影响感染率、治愈率等因素,根据实际数据再进行分析。

数据源准备

从网站上获取过去几年的美国经济数据,以季度为单位罗列好数据,选取了税收、CPI、工业生产指数、失业率、贸易差额、货币M1、教育支出、科研支出、圣路易斯联储金融压力指数、纳斯达克综合指数、卫生保健支出、道路建设支出作为评价经济的十二个指标,这些指标都一定程度上反映着美国金融繁荣度,并且有实际数据量化。


视频

K近邻KNN算法原理与R语言结合新冠疫情对股票价格预测

探索见解

去bilibili观看

探索更多视频


视频

KMEANS均值聚类和层次聚类:R语言分析生活幸福质量系数可视化实例

探索见解

去bilibili观看

探索更多视频

我们从FRED网站上获得自2009年至2019年每个季度的上述指标的数据(教育支出每年四等分处理),按照奥巴马和特朗普分别制表。

上图是示例经济表格数据

上图是美国新冠疫情数据


R软件SIR模型网络结构扩散过程模拟

阅读文章


过程

(以奥巴马执政时期分析为示例)先是对12个元素进行聚类分析,计算它们之间的相关系数,列出矩阵,判断它们之间是否具有较强的相关性。根据矩阵结果,可以判断出的确有一些指标有较强的相关性。因此我们决定将变量化为5类,得到指标聚类树形图如下


随时关注您喜欢的主题


由图可以看出,第1、3、6、7、10、12项指标有较大的相关性,4、11也是如此,因此我们选取第1、2、4、5、8、9;六个指标进行分析。

求得七个估计值为[1.4028  0  -0.0149  -0.0817  0  0.0068  -0.0301] *104

对于特朗普执政时期的数据,我们求得估计值为:

[2.1404  0.0002  0.05  -0.1872  -0  0.0020  0.0477]*104

利用Matlab,求得F=577.0464,查表得上分位数

而特朗普时期的数据为127.009。

因而拒绝原假设,模型整体上通过检验。但是指标中有两项等于0,所以进一步作如下检验:

H0j:cj=0,j=0,1,..,m

 当H0j成立时,有:

tj=βj/cjjQ/(n-m-1)~t(n-m-1)

利用Matlab求解,得到统计量:

t0=6.762,t1=0.1844,t2=-1.4655,t3=-8.8447,t4=0.691,t5=4.2058,t6=-4.6903

而特朗普时期的数据为:

t0=7.2182,t1=0.9806,t2=2.4411,t3=-6.0462,t4=-1.2711,t5=0.816,t6=2.3186

查表得上α/2分位数t0.02525=2.0595

对于上面结果的检验,可知接受1、2、4,即这三个对应的变量对模型的影响并不显著。综上我们得到奥巴马时期的回归模型为:

y=14028-8170x4+68x8-301x9

最后我们得出拜登当选对美国经济更有益,对新冠疫情防控更有利对中国战略威胁更大。

这两张图是特朗普执政时期因为新冠疫情美国的SEIRD人数及经济损失模型

这是根据特朗普的政策所得到的美国新冠疫情损失预测,由图可知,提高治愈率,在长期仍然会造成很大影响;对于拜登,我们降低感染率,取 

由图可知,拜登的政策,在前期会付出比较大的经济代价,但长期将会有效遏制新冠疫情。 


关于作者

在此对Haoran Chen对本文所作的贡献表示诚挚感谢他毕业于北京化工大学,专长深度学习、数学建模、数据分析。

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds