R语言分段回归数据分析案例报告

我们在这里讨论所谓的“分段线性回归模型”，因为它们利用包含虚拟变量的交互项。

由Kaizong Ye，Coin Ge撰写

读取数据

可下载资源

data=read.csv("artificial-cover.csv")

查看部分数据

head(data)
 
##   tree.cover shurb.grass.cover
## 1       13.2              16.8
## 2       17.2              21.8
## 3       45.4              48.8
## 4       53.6              58.7
## 5       58.5              55.5
## 6       63.3              47.2

设这两段二次函数的解析式分别为 $a_1x^2+b_1x+c$ 和 $a_2x^2+b_2x+c$ ，分界点为 $x=x_0$ 。
那么这个函数整体可以表达为
$f(x) = (a_1x^2+b_1x+c_1) (1-u(x-x_0)) + (a_2x^2+b_2x+c) u(x-x_0)$
其中 $u(x)=\left\{ \begin{array}{rl} 1, & \text{if } x \ge 0 \\ 0, & \text{if } x < 0 \end{array} \right.$ 为阶跃函数。

设题主已经测得的数据点为 $(x_i,y_i), 1 \le i \le n$ 。误差函数不妨就取最小二乘误差，即 $E=\sum_{i=1}^n [y_i-f(x_i)]^2$ ，其自变量为 $f$ 中所有的参数（ $a_1,b_1,c_1,a_2,b_2,c_2,x_0$ ）。题主下面要做的事情就是求得这组参数的值以使得误差函数最小化了。

不过，因为阶跃函数有间断点，上述误差函数最小化起来有困难。
为了解决这个问题，可以用sigmoid函数 $\sigma(x) = \frac{1}{1+\text{e}^{-wx}}$ 来代替阶跃函数 $u(x)$ 。
这里引进了一个新的参数 $w>0$ ，它控制的是sigmoid函数的陡峭程度，当 $w \rightarrow + \infty$ 时sigmoid函数就变成了阶跃函数。不过sigmoid函数处处可导，优化起来就比较简便了。

###########用lm拟合，主要注意部分是bs（age,knots=c(...)）这部分把自变量分成不同部分
fit =lm(tree.cover~bs(shurb.grass.cover ,knots
############进行预测，预测数据也要分区
pred= predict (fit , newdata =list(shurb.grass.cover =data$shurb.grass.cover),se=T)
#############然后画图
plot(fit)

可以构造一个相对复杂的 LOWESS 模型（span参数取小一些），然后和一个简单的模型比较，如：

课程

R语言数据分析挖掘必知必会

从数据获取和清理开始，有目的的进行探索性分析与可视化。让数据从生涩的资料，摇身成为有温度的故事。

立即参加 ➜

qplot(x, y) + geom_smooth()  # 总趋势

散点图分为两部分

我们可以将原始散点图分为两部分，并拟合两条单独但相连的线。估计的分段式函数连接，在描述数据趋势方面做得更好。

因此，让我们为这些数据建立一个分段线性回归模型并可视化：

0) + geom_smooth() +
 theme(panel.background = element_rect(fill = 'white', colour = 'black'))

最受欢迎的见解

1.R语言多元Logistic逻辑回归应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI，NRI指标

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言分段回归数据分析案例报告

相关文章

关注我们，永远不要错过任何见解。