R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化

气候变化和空气污染对现代社会产生了越来越大的影响。

由Kaizong Ye,Coin Ge撰写

在这种背景下,研究气象和空气污染之间的关系以及其对PM2.5浓度的影响变得非常重要。

首先,气象和空气污染之间的关系是一个复杂的研究领域。气象条件包括温度、湿度、风向、风速、气压等,这些因素会影响空气污染物的扩散、传输和转化。例如,风速较大时,有利于空气污染物的扩散,降低空气污染程度;而在静风条件下,污染物容易积聚,导致空气污染加重。

其次,PM2.5 是指空气动力学直径小于等于 2.5 微米的颗粒物,它是空气污染的重要指标之一。气象条件对 PM2.5 浓度的影响主要表现在以下几个方面:一是风向和风速决定了 PM2.5 的传输方向和速度,可能将污染物从一个地区输送到另一个地区;二是湿度可能影响 PM2.5 的形成和转化,高湿度条件下可能促进二次颗粒物的生成;三是温度的变化也可能影响大气化学反应,从而影响 PM2.5 的浓度。


为了更好地理解和解释这些关系,广义加性混合模型(GAMM)成为一种强大的工具。

广义加性混合模型(GAMM)是一种用于分析数据的统计模型。它结合了广义加性模型(GAM)和混合模型的特点。GAMM 可以处理非线性关系,同时考虑到数据中的随机效应和固定效应,能够更好地适应复杂的数据结构,为理解和解释各种数据关系提供了强大的工具。


可下载资源


成为新会员获取本文分析的智能体、数据、代码、报告


作者

长沙作为湖南省的省会城市,其气象条件和空气质量一直备受关注。通过分析长沙地区的气象数据、空气污染指标和PM2.5浓度,可以更加全面地了解该地区的空气质量状况,并揭示气象因素对其变化的影响。

本研究旨在使用R语言中的广义加性混合模型(GAMM)方法,帮助客户来探索长沙地区气象因素与空气污染之间的关系,并进一步研究它们对PM2.5浓度变化的影响。

我们将采集长沙地区的逐日气象数据、空气污染指标以及PM2.5浓度数据,应用GAMM模型进行分析。

在分析过程中,我们将考虑多种气象因素,如温度、湿度、风速等,并结合空气污染指标,如PM10、SO2、NO2等,来建立相应的GAMM模型。

查看数据

image.png
image.png

视频

R语言广义相加模型(GAM)在电力负荷预测中的应用

探索见解

去bilibili观看

探索更多视频


自适应网页宽度的 Bilibili 视频

视频

线性混合效应模型(LMM,Linear Mixed Models)和R语言实现案例

探索见解

去bilibili观看

探索更多视频

通过显著性检验,我们将评估各个因素对PM2.5浓度的影响程度,并进一步进行逐日变化的可视化分析,以呈现其动态变化规律。

读取数据


airquality=read.csv("长沙气象站逐日气象+空气污染 数据.csv")  
  
Region=read.csv("长沙市年各个站点的PM2.5 每日浓度.csv",skip=1)
image.png
image.png

Table 2. Significance tests of PM2.5levels for different season, region, daytime and day of week. 对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。

这段内容提到了对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。显著性检验是一种统计方法,用于确定两个或多个样本之间是否存在显著差异。

在这个情境中,研究人员可能希望了解不同季节、地区、白天和周日的PM2.5水平是否存在显著差异。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它对人体健康和环境质量有重要影响。

为了进行显著性检验,研究人员可能会收集来自不同季节、地区、白天和周日的PM2.5水平数据,并使用统计方法来比较这些数据。常用的显著性检验方法包括t检验、方差分析和卡方检验等。

Table 2. Significance tests of PM2.5levels for different season, region, daytime and day of week. 对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。

这段内容提到了对不同季节、地区、白天和周日的PM2.5水平进行显著性检验。显著性检验是一种统计方法,用于确定两个或多个样本之间是否存在显著差异。


图片

R语言用线性混合效应(多水平/层次/嵌套)模型分析声调高低与礼貌态度的关系

阅读文章


在这个情境中,研究人员可能希望了解不同季节、地区、白天和周日的PM2.5水平是否存在显著差异。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它对人体健康和环境质量有重要影响。


随时关注您喜欢的主题


为了进行显著性检验,研究人员可能会收集来自不同季节、地区、白天和周日的PM2.5水平数据,并使用统计方法来比较这些数据。常用的显著性检验方法包括t检验、方差分析和卡方检验等。

通过进行显著性检验,研究人员可以确定不同季节、地区、白天和周日的PM2.5水平是否存在显著差异,从而为环境保护和公共健康管理提供重要的科学依据。

Season

 
kruskal.test(PM2.5.ug.m3. ~ Season, data = airquality)
image.png

Region

image.png

Daytime

image.png

想了解更多关于模型定制、咨询辅导的信息?


Season

pairwise.t.tes=="summ
image.png
image.png
image.png
image.png
image.png
image.png
image.png

Region

image.png

Day of week

Weekends1=seq(3,nrow(airquality),by=7)  
  
Weekends2=seq(4,nrow(airquality),by=7)

wilcox.test( airquality$PM2.5.ug.m3.[airquality$Weekends==0] , airquali
image.png

Fig 3. Day to day variations of PM2.5in different seasons, 不同季节PM2.5的逐日变化

不同季节PM2.5的逐日变化指的是在不同季节中,每天空气中PM2.5浓度的变化情况。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它们可以悬浮在空气中并被人们吸入。PM2.5来源于工业排放、交通尾气、燃煤、木材燃烧等。

在不同季节中,PM2.5的逐日变化可能会有所不同。一般来说,春季和夏季的PM2.5浓度相对较低,而秋季和冬季的PM2.5浓度相对较高。

在春季,天气温暖,风力较大,降雨较多,这些因素有助于减少空气中的PM2.5浓度。此时,植物生长活跃,能够吸收大量的二氧化碳和颗粒物,从而净化空气。

夏季的PM2.5浓度一般较低,主要是因为高温和强烈的阳光可以加速颗粒物的分解和扩散。此外,夏季也是降雨量较多的季节,雨水可以洗刷空气中的颗粒物。

秋季的PM2.5浓度开始上升,主要是因为天气变冷,大气稳定,风力较小,这有利于颗粒物的积累。此外,秋季还是农作物收获季节,农田燃烧残留物会释放出大量的颗粒物。

冬季是PM2.5浓度最高的季节。在冬季,天气寒冷,大气层稳定,风力较小,这导致颗粒物在空气中滞留时间较长。此外,冬季是取暖季节,燃煤和木材燃烧释放的颗粒物也会增加。

总的来说,不同季节PM2.5的逐日变化受到多种因素的影响,包括气温、风力、降雨量、植物生长和人类活动等。了解这些变化有助于我们采取相应的措施来减少PM2.5的污染。

points(which(airquality$Season=="spring" & airquality$Weekends==1),airq
image.png
image.png
image.png
image.png

不同季节PM2.5的逐日变化 Diurnal variations of PM2.5in different months

不同季节PM2.5的逐日变化是指在不同季节中,每天PM2.5浓度的变化情况。PM2.5是指空气中直径小于或等于2.5微米的颗粒物,它们对人体健康有害。这些颗粒物主要来自于工业排放、交通尾气、燃烧过程和自然来源等。

在不同季节中,PM2.5的逐日变化可能受到多种因素的影响。例如,冬季由于采暖需求增加,燃煤和燃气的使用量增加,导致PM2.5浓度较高。而夏季由于气温升高,光化学反应增多,加上交通尾气和工业排放的贡献,PM2.5浓度也可能较高。

此外,气象条件也会对PM2.5的逐日变化产生影响。例如,风速、风向、降雨等天气因素都会影响PM2.5的扩散和沉降,从而影响其浓度。

因此,不同季节中PM2.5的逐日变化是一个动态的过程,受到多种因素的综合影响。通过对这种变化的研究和监测,可以更好地了解和应对空气质量问题。

grep( date,airquality$日期)),]$PM2.5.ug.m3.  
plot(Mar,type="p",col=j,ylab="95% CI")

3-5月份

image.png

6-8月份

image.png

9-11 月份

1111.png

12-2 月份

image.png

Correlation coefficient and COD versus distance between the stations 相关系数和COD随站间距离的变化

相关系数是用来衡量两个变量之间的线性关系强度和方向的统计指标。它的取值范围在-1到1之间,其中1表示完全正相关,-1表示完全负相关,0表示无相关性。

相关系数和站间距离的变化之间可能存在一定的关系。如果两个变量之间的相关系数较高(接近1或-1),则说明它们之间存在较强的线性关系。在这种情况下,站间距离的变化可能较小,因为变量之间的关系比较稳定。相反,如果两个变量之间的相关系数较低(接近0),则说明它们之间的线性关系较弱或不存在。在这种情况下,站间距离的变化可能较大,因为变量之间的关系较为不稳定。

abline(lm(cordata~distdata),col="red")
image.png
image.png

GAMM模型分析温度  湿度,风速 能见度 气压对PM2.5的影响

GAMM(Generalized Additive Mixed Models)是一种灵活的统计模型,结合了广义可加模型(GAM,Generalized Additive Models)和混合模型(Mixed Models)的优点。它可以用于解决包含非线性关系和随机效应的数据建模问题。

GAMM模型主要用于处理长期观测数据和重复测量数据,其中数据可能受到时间、空间或其他相关因素的影响。GAMM模型具有以下特点:

  1. 广义可加模型(GAM)的优点:GAM模型可以通过非线性平滑函数来建模解释变量与响应变量之间的复杂关系,适用于非线性关系的建模。
  2. 混合模型(Mixed Models)的优点:GAMM模型可以处理数据中的随机效应,比如个体间的差异或层级结构中的变化。
  3. 可解释性:GAMM模型通过可加函数模型来描述数据,可以直观地解释模型中的每个平滑项的效应。
gamm(PM2.5.ug.m3.~s(平均温度.摄
image.png
image.png
image.png
summary(b$gam) # gam style summary of fitted model
image.png

simple checking plots 模型检验

image.png

用AR1残差项拟合模型

image.png

lme拟合的细节

image.png
image.png

拟合模型的Gam总结

image.png

模型检验

image.png

关注我们,永远不要错过任何见解。


技术干货二维码

技术干货

最新洞察二维码

最新洞察

视频号二维码

视频号

This will close in 0 seconds

拓端AI助手