支持向量回归（SVR）是一种回归算法，它应用支持向量机（SVM）的类似技术进行回归分析。

由Kaizong Ye，Liao Bao撰写

正如我们所知，回归数据包含连续的实数。

为了拟合这种类型的数据，SVR模型在考虑到模型的复杂性和错误率的情况下，用一个叫做ε管（epsilon-tube，ε表示管子的宽度）的给定余量来接近最佳值。

回归和分类从某种意义上讲，本质上是一回事。SVM分类，就是找到一个平面，让两个分类集合的支持向量或者所有的数据（LSSVM）离分类平面最远；SVR回归，就是找到一个回归平面，让一个集合的所有数据到该平面的距离最近。

　　我们来推导一下SVR。根据支持向量机二分类博客所述，数据集合归一化后，某个元素到回归平面的距离为r=d(x)g(x)r=d(x)g(x)。另外，由于数据不可能都在回归平面上，距离之和还是挺大，因此所有数据到回归平面的距离可以给定一个容忍值ε防止过拟合。该参数是经验参数，需要人工给定。如果数据元素到回归平面的距离小于ε，则代价为0。SVR的代价函数可以表示为：

cost(x)=max(0,|d(x)g(x)|ε)

其中d是标准答案。考虑松弛变量 ξi,ξiξi,ξi，分别代表上下边界的松弛因子。有约束条件：

{d(xi)g(xi)<ε+ξi,ξi≥0g(xi)d(xi)<ε+ξi,ξi≥0

我们实际上是要最小化 ξi,ξiξi,ξi。我们为了获得w的稀疏解，且假设w的计算结果满足正态分布，根据贝叶斯线性回归模型，对w有L2范数约束。

　　SVR可以转变为最优化问题：

Φ(x)=∑i(ξi+ξi)+12C′wTw→Φ(x)=C∑i(ξi+ξi)+12wTw

其中C是惩罚因子，是人为给定的经验参数。考虑约束条件，引入拉格朗日算子 α,α,β,βα,α,β,β，将最优化问题转化为对偶问题：

J=12wTw+C∑i(ξi+ξi)+∑iαi[d(xi)g(xi)εξi]+∑iαi[g(xi)d(xi)εξi]∑iβiξi∑iβiξi

然后分别求导得到：

Jw=w(∑iαixi∑iαixi)=0Jb=∑i(αiαi)=0Jξi=Cαiβi=0Jξi=Cαiβi=0C=αi+βi=αi+βi

　　将上述式子代入J函数有：

J=12wTw∑i(αiαi)wxib∑i(αiαi)∑i(αi+αi)ε+∑i(αiαi)d(xi)+C∑i(ξi+ξi)∑iαiξi∑iαiξi∑i(Cαi)ξi∑i(Cαi)ξi=12(∑iαixi∑iαixi)(∑jαjxj∑jαjxj)(∑iαixi∑iαixi)(∑jαjxj∑jαjxj)∑i(αi+αi)ε+∑i(αiαi)d(xi)=12∑i∑j(αiαi)(αjαj)xixj∑i(αi+αi)ε+∑i(αiαi)d(xi)subject　to　0≤αi,αi≤C

其中 ξ,ξ,β,βξ,ξ,β,β都在计算过程中抵消了，非常神奇。 ε,Cε,C则是人为给定的参数，是常量。如果要使用核函数，可以将上式写成：

J=12∑i∑j(αiαi)(αjαj)k(xixj)∑i(αi+αi)ε+∑i(αiαi)d(xi)

　　SVR的代价函数和SVM的很相似，但是最优化的对象却不同，对偶式有很大不同，解法同样都是基于拉格朗日的最优化问题解法。求解这类问题的早期解法非常复杂，后来出来很多新的较为简单的解法，对数学和编程水平要求高，对大部分工程学人士来说还是颇为复杂和难以实现，因此大牛们推出了一些SVM库。比较出名的有libSVM，该库同时实现了SVM和SVR。

在本教程中，我们将通过在 Python 中使用 SVR ，简要了解如何使用 SVR 方法拟合和预测回归数据。教程涵盖：

准备数据
模型拟合和预测
准确性检查
源代码

我们将从在 Python 中加载所需的库开始。

import numpy as np

准备数据

我们将使用回归数据作为目标数据进行拟合。我们可以编写简单的函数来生成数据。

y = make(x)
x = np.array

plt.scatter
plt.show()

可下载资源

完整程序、数据和文档（word）

本文分析的智能体、数据、代码、报告分享至会员群

加入会员群

最受欢迎的见解

1.R语言多元Logistic逻辑回归应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI，NRI指标

视频

支持向量机SVM、支持向量回归SVR和R语言网格搜索超参数优化实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

模型拟合和预测

我们来定义模型。该模型可以与默认参数一起使用。我们将在 x 和 y 数据上拟合模型。

svr 
print(svr)

在这里，可以根据回归数据特征更改核、C 和 epsilon 参数。核识别算法中的核类型。可以使用“rbf”（默认内核）、“linear”、“poly”和“sigmoid”。

接下来，我们将使用 svr 模型预测 x 数据。

predict(x)

为了检查预测结果，我们将在图中可视化 y 和 yfit 数据。

plt.scatter
plt.plot
plt.legend
plt.show

Python用户流失数据挖掘：建立逻辑回归、XGboost、随机森林、决策树、支持向量机、朴素贝叶斯模型和Kmeans用户画像

阅读文章 ➜

随时关注您喜欢的主题

准确性检查

最后，我们将使用 R 平方和 MSE 指标检查模型和预测准确性。

score
print("R-squared:", score)
print("MSE:", measquaederor)

在本教程中，我们简要了解了如何使用 Python 中的 SVR 方法拟合回归数据。

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

Python支持向量回归SVR拟合、预测回归数据和可视化准确性检查实例