对于线性关系，我们可以进行简单的线性回归。对于其他关系，我们可以尝试拟合一条曲线。

由Kaizong Ye，Coin Ge撰写

曲线拟合是构建一条曲线或数学函数的过程，它对一系列数据点具有最佳的拟合效果。

#我们将使Y成为因变量，X成为预测变量
#因变量通常在Y轴上
plot(x,y,pch=19)

可下载资源

看起来我们可以拟合一条曲线。

考虑下面的数据，虽然我们可以使用线性回归来拟合这些数据，但是这些数据更像是一条二次曲线,相应的方程是y=ax^2+bx+c,

这是式子虽然可以理解为二次方程，但是我们呢可以从另外一个角度来理解这个式子：

如果将x2理解为一个特征，将x理解为另外一个特征,换句话说，本来我们的样本只有一个特征x，现在我们把他看成有两个特征的一个数据集。多了一个特征x2，那么从这个角度来看，这个式子依旧是一个线性回归的式子，但是从x的角度来看，他就是一个二次的方程

#拟合一次多项式方程。

fit <- lm(y~x)

#二次

fit2 <- lm(y~poly(x,2)

#三次

......

#生成50个数字的范围，从30开始到160结束

xx <- seq(30,160, length=50)

lines(xx, predict(fit, xx)

课程

从数据获取和清理开始，有目的的进行探索性分析与可视化。让数据从生涩的资料，摇身成为有温度的故事。

我们可以看到每条曲线的拟合程度。

我们可以使用summary()函数对拟合结果进行更详细的统计。

最受欢迎的见解

使用不同多项式R平方的总结。

1st: 0.5759
2nd: 0.9474
3rd: 0.9924
4th: 0.9943

R语言泊松Poisson回归模型分析案例

阅读文章 ➜

我们可以用 “方差分析 “来比较不同的模型。

Pr(>F)值是拒绝无效假设的概率，即一个模型不比另一个模型更适合。我们有非常显著的P值，所以我们可以拒绝无效假设，即fit2比fit提供了更好的拟合。

我们还可以创建一个反映多项式方程的函数。

从三次多项式推算出来的数值与原始数值有很好的拟合，我们可以从R-squared值中得知。

对于非线性曲线拟合，我们可以使用lm()和poly()函数，这也为多项式函数对数据集的拟合程度提供了有用的统计数据。我们还可以使用方差分析测试来评估不同模型之间的对比程度。从模型中可以定义一个反映多项式函数的函数，它可以用来推算因变量。

yy<-third(xx,fit)

plot(xx,yy)

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！