现实情况是，我们经常要处理多个自变量和一个因变量之间的关系

此外，虽然通过做散点图可以发现非线性关系，但很难归因其形式，多项式回归在广义线性模型中，由于其不可解释的系数，降低了模型的有用性。

由Kaizong Ye，Weilong Zhang撰写

在城市交通系统中，公交专用道作为提升公共交通效率和服务质量的重要基础设施，一直备受关注。

随着城市化进程的加速和机动车保有量的急剧增加，城市交通拥堵问题日益严重，公交运行效率受到极大影响。

设置公交专用道旨在为公交车提供优先通行权，减少交通干扰，提高公交车辆的运行速度和准点率。

本文使用的广义加性模型提供了一种首选方案来研究多个自变量与因变量之间的关系，

而无需事先了解因变量和自变量之间的关系，

而是使用非线性平滑项来拟合模型。

可下载资源

完整程序、数据和文档（word）

本文分析的智能体、数据、代码、报告分享至会员群

加入会员群

作者

Kaizong Ye
✉ 联系我们

GAM模型说明

广义相加模型（GAM：Generalized Additive Model），它模型公式如下：有p个自变量，其中X1与y是线性关系，其他变量与y是非线性关系，我们可以对每个变量与y拟合不同关系，对X2可以拟合局部回归，X3采用光滑样条，不必采用统一的关系，而最终结果‘加’在一起就可以了。

× 1.由于模型是可加的，这在很大程度上限制了模型的灵活性，变量间的相互作用常被忽略，虽然模型本身可以考察交互作用。 2.由于是基于非线性的模型，因此GAM模型的系数依然难以准确解释和描述。

研究目的：

最近我们被客户要求探讨公交专用道，工作日，向西方向，早高峰，停驻时间系数，延误系数对 行程时间变异度的影响。

视频

R语言广义相加模型（GAM）在电力负荷预测中的应用

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

预期结果

所有因素中，公交专用道对行程时间变异度的影响最大，且可以减少行程时间变异度。

变量说明

序号	自变量	变量类型
1	公交专用道	0.1 变量
2	工作日	0.1 变量
3	向西方向	0.1 变量
4	早高峰	0.1 变量
5	信号灯	离散变量整数
6	延误系数	连续变量
7	行程时间可靠性	连续变量

使用poisson(link = “log”)#连接函数

让我们使用summary函数对第一个模型进行诊断。

P值：给定变量对因变量的统计显着性，通过F检验进行检验（越低越好）。调整后的R平方（越高越好）。 s()是样条函数，括号里面的数字是定义的自由度，除了使用回归样条，还能使用局部样条lo()函数，得到的结果与上面的结果十分类似。

最受欢迎的见解

1.R语言多元Logistic逻辑回归应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI，NRI指标

R语言惩罚逻辑回归、线性判别分析LDA、广义加性模型GAM、多元自适应回归样条MARS、KNN、二次判别分析QDA、决策树、随机森林、支持向量机SVM分类优质劣质葡萄酒十折交叉验证和ROC可视化

阅读文章 ➜

采用plot()可以将模型画出来，图横坐标为自变量X，纵坐标为因变量Y。

不使用poisson连接函数

让我们使用summary函数进行诊断。

随时关注您喜欢的主题

P值：给定变量对因变量的统计显着性，通过F检验进行检验（越低越好）。从结果可以看到公交专用道对行程时间变异度有显著影响。

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言用GAM广义相加模型研究公交专用道对行程时间变异度数据的影响