对于那些不熟悉“配对交易”概念的人来说几句话。

由Kaizong Ye，Sherry Deng撰写

首先，您应该了解，每只股票的走势不是由公司业绩主导，而是由总体市场走势主导。

可下载资源

这就是许多“因子模型”的由来，驱动每只股票的因素是 _市场因素_，在大多数情况下，它与标准普尔指数近似。

配对交易与传统股票交易最大的不同之处在于，它的投资标的是两只股票的价差，是一种相对价值而非绝对价值。由于它在股票多头和空头方同时建仓，对冲掉了绝大部分的市场风险，所以它是一种市场的中性策略。无论大盘上涨还是下跌，配对交易策略收益都是相对平稳的，与大盘走势的相关性很低。

因此，无论多么伟大的公司，它都经不起任何大规模的市场衰退。假设这样做，买入AMZN并卖出标准普尔指数（SPY），如果指数上涨，我就会亏损，因为我做空了它，但我希望AMZN会上涨，来补偿我在指数上的损失。

AMZN应该上涨，因为市场上涨了，而且它是一家好公司。反之，指数下跌，那么我就赢了，因为我做空了指数，我希望AMZN不会下跌那么多，吃掉我所有的利润。

自适应网页宽度的 Bilibili 视频

视频

时间序列分析模型 ARIMA-ARCH GARCH模型分析股票价格数据

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

AMZN没有因为市场而下降，但会上升，因为它是一家好公司。这样一来，我就表达了我对AMZN的看法，而没有承担因素/市场风险。所谓 “配对交易”，是因为我在做多和做空一对股票。这是对什么是配对交易的直白解释。

以下面这对黄金（GLD）和黄金矿工（GDX）为例，这是一个教科书式的例子，是一对 “一起走 “的组合。基本上，当黄金价格上涨时（GLD上涨），黄金矿工应该受益，所以GDX也应该上涨。请看一下。

for (i in 1:4){
  plot(na.omit(Tiesy = 1)    
  
  points(na.omit(Tcke
  
  legend('toprigh}

GLD 和 GDX 联动

该图显示相对于某个日期收益。现在，我们的计划是，当它们离得太远时，做多一个，做空另一个。那有什么问题呢？

右下方的图显示，在过去一年中，GLD的表现比GDX好得多。我想做空GLD，做多GDX，坐等收敛。我应该做多多少，做空多少？一比一？肯定是错的，因为GDX的价格是52.68，GLD的价格是155.23。也许把股票的数量相等，这样我在每个ETF中的多头和空头正好是10000元，所以做多188个GDX，做空64个GLD。然而，是不是其中一个增加1%，另一个就会增加1%？问题是，如果GLD上涨1%，GDX上涨1.5%，那么我需要持有1.5倍的GLD来保持我的价差不变，这很重要。举个例子，假设我持有相同的价值，做空GLD 10000，做多GDX 10000，但是这两者之间的关系是，当GDX上涨1%，GLD上涨1.5%。当它们共同上涨时，我的损益会发生什么？我的损失是0.5%，因为我做空GLD，而GLD的涨幅比GDX大…

为了解决这个问题，正在做的是估计这两个组成部分之间的关系。用回归法来做： $stock_a = \beta_0+\beta_1 stock_b+错误，\; \widehat{\beta_1} \;$ 是我需要从 stock_a 补偿 stock_b 移动的资金。我们运行。

尽管这种方法很有吸引力，但它远非“久经考验”。首先，我们应该使用收益还是实际价格？学院喜欢前者，实践者喜欢后者。如果您想知道，情况就不一样了：

最受欢迎的见解

1.R语言对S＆P500股票指数进行ARIMA + GARCH交易策略

2.R语言改进的股票配对交易策略分析SPY—TLT组合和中国股市投资组合

3.R语言时间序列：ARIMA GARCH模型的交易策略在外汇市场预测应用

4.TMA三均线期指高频交易策略的R语言实现

5.r语言多均线量化策略回测比较

6.用R语言实现神经网络预测股票实例

7.r语言预测波动率的实现：ARCH模型与HAR-RV模型

8.R语言如何做马尔科夫转换模型markov switching model

9.matlab使用Copula仿真优化市场风险

plot(Tc[,i,2]) ~ na.omit(Tkr[,i,1]lm )
     
abline(lm)

上图是基于价格的估计，它表明我应该为每 1 个GLD 做多 0.317个 GDX 。

使用R语言对S＆P500股票指数进行ARIMA + GARCH交易策略

阅读文章 ➜

下图显示了基于收益的相同估计，GDX 的每个百分比平均有 1.66 个GLD 中的百分比。

更重要的是，上述的回归受到了基本假设的影响，即右边的变量是常数，而左边的变量是随机的，它有一个误差项。事实上， stock_b 也是随机的，所以当我们切换回归中的变量时，在 “Y “插入GDX，我们得到不同的结果。

随时关注您喜欢的主题

可以看到结果有所变化，GLD不是一个给定的常数，而是它本身就是一个随机变量。

$\widehat{\beta_1}$ 随着时间的推移不是恒定的，所以我不知道要使用多少观察。看看：

如果您颠倒 LHS 和 RHS 变量的顺序，收益当然也是如此。

可能的解决方案是考虑您的投资时间范围，例如，如果您计划持有几个月，您可以使用 365 天测试。我还尝试对观察结果进行加权，来确定我应该从每个观察中保留多少。

在理论上，理论和实践之间有很强的联系，但在实践中却没有。我在这里展示了配对交易中的一些问题。首先，我们不知道应该用哪种方法来估计关系，是价格还是收益。其次，我们不知道使用哪个时间段，由于关系不是恒定的，所以这很重要。

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！