随着天气预报技术的发展，数值预报产品日益丰富，预报方法多种多样。

由Kaizong Ye，Liao Bao撰写

我们被客户要求撰写关于气象集成预报技术的研究报告，包括一些图形和统计输出。在实际应用中，对每个具体的问题，各种预报方法得出的结果通常是不一致的，因而不知道如何将它们统一起来。

因此需要采用一种较好的处理方法，把不同预报方法对同一要素的多种预报结果综合在一起，从而得出一个优于单一预报方法的预报结论，这就是预报方法的集成问题。

× 70年代后期，随着计算机在气象领域的逐步应用，天气预报工作的发展也随之翻开了崭新的一页。然而当时计算机并没有真正应用到数值模拟预报上，而是代替人工作一些填图、物理量分析计算等简单工作。天气预报主要依赖天气图分析和物理量计算，辅以天气雷达而进行。天气预报仅限于短期预报。80年代后期，随着计算机计算速度的大幅提高，数值预报产品应运而生，而且很快从研究领域过渡到实际应用领域，并且开始在天气预报工作中发挥一定作用。到了90年代中期，随着我国经济实力的增强，社会生产对天气预报的要求越来越高，国家对气象领域的投入开始加大。这一时期天气预报的方向除了短期预报外，还增加了中长期预报。90年代后期，天气图分析已逐步淡化，日常的天气预报开始逐渐依赖数值预报。进入21世纪，随着互联网的广泛应用，天气预报的大量工作集中在对各种不同数值预报产品的可靠性和可能性的分析上，同时计算机的计算能力得到加强，以及数值预报模式的逐步完善又为中长期预报的可能性提供了保证。而随着全国各地天气雷达网点的加密，天气预报的另一个方向也逐步由短期预报向短时预报过渡。

本文分析了传统的基于加权的集成预报方法及其在气象预测应用中存在的问题

在此基础上提出了一种新的基于数据挖掘的集成预报方法，该方法选用BP人工神经网络建立集成预报分类器，对文中BP人工神经网络、多元回归、SVM、决策树模型四种子预报方法的预报结果进行集成和综合。

基于数据挖掘的集成预报方法利用从子预报方法中筛选的训练集进行训练，得到集成预报分类器；该集成预报分类器可以根据环流因子的输入，直接得到一种最优子预报方法，然后利用得到的最优子预报方法去预测，将最优子预报方法的预报结果作为集成预报的预报结果。

实验数据集描述

实验使用的输入数据是环流因子，是由国家气候中心气候系统诊断预测室再处理资料，资料数据全都为整型。

环流因子数据

可下载资源

完整程序、数据和文档（word）

最受欢迎的见解

1.R语言实现CNN（卷积神经网络）模型进行回归

2.r语言实现拟合神经网络预测和结果可视化

3.python用遗传算法-神经网络-模糊逻辑控制算法对乐透分析

4.R语言结合新冠疫情COVID-19股票价格预测：ARIMA，KNN和神经网络时间序列分析

5.Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

6.Matlab用深度学习长短期记忆（LSTM）神经网络对文本数据进行分类

7.用于NLP的seq2seq模型实例用Keras实现神经机器翻译

8.R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测

9.Python用RNN循环神经网络：LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列预测

30年降水数据

本文介绍了四种常见的气象子预报方法：BP人工神经网络、多元回归、SVM、决策树模型，并通过实际的数据集进行预报检验。从实验结果可以得出，对于不同的预报环境和预报样本，并没有哪一种子预报方法的预报结果能够保证始终是最优的。

视频

从决策树到随机森林：R语言信用卡违约分析信贷数据实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

Boosting集成学习原理与R语言提升回归树BRT预测短鳍鳗分布生态学实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

支持向量机SVM、支持向量回归SVR和R语言网格搜索超参数优化实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

人工神经网络ANN中的前向传播和R语言分析学生成绩数据案例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜


环流因子=read.csv("环流因子.csv") 
降水数据=read.csv("30年降水数据.csv")

转换降水数据


y=0  
   
 for(i in 2:ncol(降水数据)){  
 y=c(y,降水数据[,i])
 
 
 环流因子=环流因子[1:length(yy),]  
   
 datanew=data.frame(降水数据=yy,环流因子[,-1])

多元回归

model=lm(降水数据~.,data=datanew)

plot(datanew[,2:1])  
 abline(model)

R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

阅读文章 ➜

svm支持向量机

现在我们在训练集上使用来训练线性SVM


## ## ## Parameters: ##    SVM-Type:  eps-regression ##  SVM-Kernel:  radial ##        cost:  1 ##       gamma:  0.01351351 ##     epsilon:  0.1 ## ## ## Number of Support Vectors:  107

随时关注您喜欢的主题

绘制拟合图

points(datanew[,2], predictedY, col = "red", pch=4)

mse <- function(error)  
 {  
   sqrt(mean(error^2))  
 }
 
## [1] 599.4382

决策树

绘制决策树



## Variables actually used in tree construction:  
## [1] X.19 X.30 X.57 X.72 X.73  
##  
## Root node error: 328275991/372 = 882462


draw.tree(CARTmodel)

根据cp值对决策树进行剪枝

 cable[which.min(CARTmodel$cptable[,"xerror"]),"CP"]

对数据进行预测

plot(tree.pred,  datanew.test$降水数据 )  
 abline(0,1)

神经网络

y=datanew$降水数据  
#  y<-data.frame((y-min(y))/(max(y)-min(y)))  
 names(y)<-'y'  
   
 mod1<-nnt(datanew
 
 summary(mod1)

## a 75-10-1 network with 771 weights  
## options were - linear output units  
##   b->h1  i1->h1  i2->h1  i3->h1  i4->h1  i5->h1  i6->h1  i7->h1  i8->h1  
##   -0.26    0.53   -0.19    0.00   -0.39   -0.57    0.40   -0.05    0.54  
##  i9->h1 i10->h1 i11->h1 i12->h1 i13->h1 i14->h1 i15->h1 i16->h1 i17->h1  
##    0.57   -0.51    0.53    0.66   -0.18   -0.15    0.36   -0.67   -0.54  
## i18->h1 i19->h1 i20->h1 i21->h1 i22->h1 i23->h1 i24->h1 i25->h1 i26->h1  
   
##   h9->o  h10->o  
##   47.66   55.81

模型集成

在实际应用中，对每个具体的问题，各种预报方法得出的结果通常是不一致的，因而不知道如何将它们统一起来。一般地，每个具体预报方法的预报思想不同，其适应的具体环境也就不同，得到的预报结果的准确程度也不相同，对某类数据有较好预报结果的方法，对其它数据不一定有较好结果。因此需要采用一种较好的处理方法，把不同数值模式对同一要素的多种预报结果综合集成在一起，从而得出一个优于单一预报方法的预报结论，这就是预报方法的集成问题。

尽管常用的集成预报方法有回归集成、平均集成、多数表决和加权集成预报方法等，然而这些集成预报方法本质上属于一种基于加权的集成方法。

本文方法的大致思想如下：以各子预报方程的历史拟合样本作为神经网络集成预报模型学习矩阵输入，相应的预报量序列作为学习矩阵的期望输出。只是确定权值的方式是不断地进行学习训练，权值存在于复杂的人工神经网络结构中，并不是线性和容易理解的。最后，把该子预报方法的预报结果作为集成预报方法的预报结果。

使用神经网络对训练结果进行集成

   
 mod1<-nnt(trainerror,y,size=10,linout=T)
 
 ## # weights:  61  
## initial  value 526570419.869292  
## iter  10 value 119410102.980870  
## iter  20 value 25370475.287456  
## final  value 25370458.492646  
## converged

summary(mod1)

## a 4-10-1 network with 61 weights  
## options were - linear output units  
##   b->h1  i1->h1  i2->h1  i3->h1  i4->h1  
##    0.37  148.56  162.50   -2.06    2.30  
##   b->h2  i1->h2  i2->h2  i3->h2  i4->h2  
##    0.48  -56.65   46.85    2.23   -1.23  
##   b->h3  i1->h3  i2->h3  i3->h3  i4->h3  
##   -0.11    7.56   15.11   -1.18    1.41  
##   b->h4  i1->h4  i2->h4  i3->h4  i4->h4  
##    0.42  -14.15  -11.55    1.49   -1.12  
##   b->h5  i1->h5  i2->h5  i3->h5  i4->h5  
##   -0.34   57.24   79.60 -176.40    6.91  
##   b->h6  i1->h6  i2->h6  i3->h6  i4->h6  
##   -0.44   -0.22    6.17    0.82   -0.01  
##   b->h7  i1->h7  i2->h7  i3->h7  i4->h7  
##    0.03   -0.14   -0.61    0.04   -0.14  
##   b->h8  i1->h8  i2->h8  i3->h8  i4->h8  
##   -0.34   65.01  -72.91  -10.22    9.67  
##   b->h9  i1->h9  i2->h9  i3->h9  i4->h9  
##    0.20   -1.31   14.80    0.90   -0.73  
##  b->h10 i1->h10 i2->h10 i3->h10 i4->h10  
##   -0.46   -2.63  -23.62   -0.60    1.51  
##    b->o   h1->o   h2->o   h3->o   h4->o   h5->o   h6->o   h7->o   h8->o  
##  368.20 -340.26   -4.79 4963.64 -158.47  517.21   24.37   -5.77   23.41  
##   h9->o  h10->o  
##   30.60  336.40

绘制拟合数据

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言气象模型集成预报技术：神经网络、回归、svm、决策树用环流因子预测降雨水数据

随着天气预报技术的发展，数值预报产品日益丰富，预报方法多种多样。

实验数据集描述

环流因子数据

30年降水数据

转换降水数据

多元回归

R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

svm支持向量机

随时关注您喜欢的主题

绘制拟合图

决策树

绘制决策树

根据cp值对决策树进行剪枝

对数据进行预测

神经网络

模型集成

使用神经网络对训练结果进行集成

绘制拟合数据

相关文章

R语言气象模型集成预报技术：神经网络、回归、svm、决策树用环流因子预测降雨水数据

随着天气预报技术的发展，数值预报产品日益丰富，预报方法多种多样。

实验数据集描述

环流因子数据

30年降水数据

转换降水数据

多元回归

R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

svm支持向量机

随时关注您喜欢的主题

绘制拟合图

决策树

绘制决策树

根据cp值对决策树进行剪枝

对数据进行预测

神经网络

模型集成

使用神经网络对训练结果进行集成

绘制拟合数据

相关文章

关注我们，永远不要错过任何见解。