R语言中的偏最小二乘PLS回归算法

我们试图识别客户对各种产品的偏好,传统的回归是不够的,因为数据集的高度分量以及变量的多重共线性。

由Kaizong Ye,Liao Bao撰写

PLS是处理这些有问题的数据集的强大而有效的方法。

偏最小二乘回归

我们将看看PLS回归和PLS路径分析。我不相信传统的回归在这一点上是有价值的,因为我们没有良好的感觉或理论来对潜在的结构做出假设。此外,由于数据集中的变量数量众多,我们正在将SEM技术扩展到极限。Haenlein,M&Kaplan,A.,2004年,“初步指南偏最小二乘分析”,Understanding Statistics,3(4),283-297中可以找到关于这个限制的有趣讨论。

这些数据有16个变量和30个观测值。

关于PLS回归的一个有趣的事情是你可以有多个响应变量,plsdepot可以适应这种类型的分析。在这种情况下,我只想分析一个Y变量,那就是价格。


课程

R语言数据分析挖掘必知必会

从数据获取和清理开始,有目的的进行探索性分析与可视化。让数据从生涩的资料,摇身成为有温度的故事。

立即参加

该包的一个特点是你需要将预测变量和响应分开,即将响应变量列放在数据帧的末尾。

>#相关图; 注意什么与价格高度相关

我们将不得不继续查看不同数量的成分以确定最佳模型,并从实际角度查看潜在变量是否有意义。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498