对于线性关系,我们可以进行简单的线性回归。对于其他关系,我们可以尝试拟合一条曲线。
曲线拟合是构建一条曲线或数学函数的过程,它对一系列数据点具有最佳的拟合效果。
使用示例数据集
#我们将使Y成为因变量,X成为预测变量
#因变量通常在Y轴上
plot(x,y,pch=19)
可下载资源
data:image/s3,"s3://crabby-images/bb662/bb66256e211753184c2080928a8a7c6ebc6a6a28" alt=""
看起来我们可以拟合一条曲线。
#拟合一次多项式方程。
fit <- lm(y~x)
#二次
fit2 <- lm(y~poly(x,2)
#三次
......
#生成50个数字的范围,从30开始到160结束
xx <- seq(30,160, length=50)
lines(xx, predict(fit, xx)
data:image/s3,"s3://crabby-images/d695a/d695a864cfc99ece0c9034df25e43d66ddf8e657" alt=""
我们可以看到每条曲线的拟合程度。
我们可以使用summary()函数对拟合结果进行更详细的统计。
data:image/s3,"s3://crabby-images/6e48e/6e48ef03325716e767ec80cb81fa92610ea9427c" alt=""
data:image/s3,"s3://crabby-images/d25b5/d25b5d5d93956e268ba514c88235ad08c57a62b6" alt=""
使用不同多项式R平方的总结。
1st: 0.5759
2nd: 0.9474
3rd: 0.9924
4th: 0.9943
我们可以用 “方差分析 “来比较不同的模型。
data:image/s3,"s3://crabby-images/d2cde/d2cde4b5d049b6bb605345c56a43c4835a3de672" alt=""
Pr(>F)值是拒绝无效假设的概率,即一个模型不比另一个模型更适合。我们有非常显著的P值,所以我们可以拒绝无效假设,即fit2比fit提供了更好的拟合。
随时关注您喜欢的主题
data:image/s3,"s3://crabby-images/61539/61539cb0550bf8c77436025fb0445e97245693ed" alt=""
data:image/s3,"s3://crabby-images/d4d9d/d4d9da28115d2d0a6d075c01816bb116c6f2a34a" alt=""
我们还可以创建一个反映多项式方程的函数。
data:image/s3,"s3://crabby-images/6d901/6d9016cb7c5df816181525cdec62aa2afd0b5a90" alt=""
data:image/s3,"s3://crabby-images/36476/364767aa1a11e71ba763fcad844f7519d9960e05" alt=""
从三次多项式推算出来的数值与原始数值有很好的拟合,我们可以从R-squared值中得知。
结论
对于非线性曲线拟合,我们可以使用lm()和poly()函数,这也为多项式函数对数据集的拟合程度提供了有用的统计数据。我们还可以使用方差分析测试来评估不同模型之间的对比程度。从模型中可以定义一个反映多项式函数的函数,它可以用来推算因变量。
yy<-third(xx,fit)
plot(xx,yy)
data:image/s3,"s3://crabby-images/98c31/98c31bedef511534b7d4b3515fad205a0ecc7459" alt=""