此示例演示了使用具有厚尾边缘分布的多变量copula模拟计算投资组合的风险价值和条件风险值（预期缺口）。

由Kaizong Ye，Sherry Deng撰写

使用Copula仿真优化市场风险， 然后使用模拟来计算最优风险收益组合。

可下载资源

内容

导入支持历史数据集
可视化标准化价格
边际分配
Copula校准
Copula模拟
计算单周期模拟VaR
组合优化
以给定的回报水平计算投资组合

常用的Copula函数

Copula分布作为一类连接函数，包含很多分布族，其中椭圆Copula函数族和Archimedean Copula函数族是最为常见的两个分布族。椭圆Copula函数族中主要有Gaussian Copula函数和t-Copula函数，而Archimedean Copula函数族中主要有Gumble Copula、Glayton Copula和Frank Copula函数，由于这些Copula具有厚尾的特征而在金融领域得到广泛应用。

二元Gaussian Copula的分布函数为

$C^{G a} (u, v; ρ) = \int_{- \infty}^{Φ^{- 1} (u)} \int_{- \infty}^{Φ^{- 1} (v)} \frac{1}{2 π \sqrt{1 - ρ^{2}}} \exp [- \frac{s^{2} + t^{2} - 2 ρ s t}{2 (1 - ρ^{2})}] d s d t,$ (2)

其中， $Φ^{- 1} (\cdot)$ 是标准正态分布函数的逆函数。

自由度为 $k$ 的二元t-Copula的分布函数为

$C^{t} (u, v; ρ, k) = \int_{- \infty}^{t_{k}^{- 1} (u)} \int_{- \infty}^{t_{k}^{- 1} (v)} \frac{1}{2 π \sqrt{1 - ρ^{2}}} {[1 + \frac{s^{2} + t^{2} - 2 ρ s t}{k (1 - ρ^{2})}]}^{- (k + 2) / 2} d s d t,$ (3)

其中， $t_{k}^{- 1} (\cdot)$ 是自由度为 $k$ 的标准 $t$ 分布函数 $t_{k} (\cdot)$ 的逆函数。

二元Gumble Copula、Clayton Copula、Frank Copula的分布函数分别为

$C^{G u} (u, v; α) = \exp {- {[{(- \ln u)}^{α} + {(- \ln v)}^{α}]}^{\frac{1}{α}}};$

$C^{C l} (u, v; α) = {(u^{- α} + v^{- α} - 1)}^{- \frac{1}{α}}, 0 \leq u, v \leq 1;$ (4)

$C^{F} (u, v; α) = - \frac{1}{α} \ln (1 + \frac{(1 - e^{- α u}) (1 - e^{- α v})}{1 - e^{- α}}), 0 \leq u, v \leq 1.$

基于Copula函数的相关性度量

Copula函数作为刻画变量间相依性结构的工具，在度量具有非线性关系的变量之间的相依性结构时具有明显的优势，因此产生了一系列基于Copula函数的相关性度量。基于Copula函数的度量包括Kendall’s $τ$ ，Spearman’s $ρ_{S}$ ，尾部相关系数 $λ$ 等。

1) Kendall秩相关系数

令 $(X, Y)$ 和 $(X^{'}, Y^{'})$ 是独立同分布的随机变量，若 $(X - X^{'}) (Y - Y^{'}) > 0$ ，称 $(X, Y)$ 和 $(X^{'}, Y^{'})$ 是一致的；若 $(X - X^{'}) (Y - Y^{'}) < 0$ 则称 $(X, Y)$ 和 $(X^{'}, Y^{'})$ 是不一致的。

Kendall’s秩相关系数 $τ$ 的一般形式为：

若随机变量 $X, Y$ 的边缘分布分别为 $F (x), G (y)$ ，相应的Copula函数为 $C (u, v)$ ，则Kendall’s秩相关系数 $τ$ 可由相应的Copula函数 $C (u, v)$ 给出：

$τ = 4 \int_{{[0, 1]}^{2}} C (u, v) d C (u, v) - 1 .$

2) Spearman’s秩相关系数 $ρ_{S}$

设 $(X_{1}, Y_{1}), (X_{2}, Y_{2}), (X_{3}, Y_{3})$ 独立同分布的随机变量，Spearman’s秩相关系数 $ρ_{S}$ 的一般形式为：

若随机变量 $X, Y$ 的边缘分布分别为 $F (x), G (y)$ ，相应的Copula函数为 $C (u, v)$ ，则Spearman’s秩相关系数 $ρ_{S}$ 可由相应的Copula函数 $C (u, v)$ 给出：

$ρ_{S} = 12 \int_{{[0, 1]}^{2}} C (u, v) d u d v - 3$

3) 尾部相关系数 $λ$

尾部相关性是人们在金融风险中比较关心的，包括上尾相关和下尾相关。令 $X, Y$ 为连续的随机变量，具有边缘分布 $F (x), G (y)$ 和Copula函数为 $C (u, v)$ ，如果

$\lim_{u \to 1^{-}} \bar{C} (u, u) / (1 - u) = λ_{U}$

存在， $λ_{U} \in (0, 1]$ ， $\bar{C} (u, v) = 1 - u - v + C (u, v)$ 为生存Copula函数，则称 $X, Y$ 上尾相关； $λ_{U} = 0$ 时，称 $X, Y$ 在分布上尾渐近独立。同样地，如果

$\lim_{u \to 0^{+}} C (u, u) / u = λ_{L}$

存在， $λ_{L} \in (0, 1]$ 时，则称 $X, Y$ 下尾相关； $λ_{L} = 0$ 时，称 $X, Y$ 在分布下尾渐近独立。我们把 $λ_{U}, λ_{L}$ 统称为尾部相关系数，且 $λ_{U}, λ_{L} \geq 0$ 。

导入支持历史数据集

使用API导入我们将在本练习中建模的不同资产类别的市场数据

SPY：标准普尔500指数
EEM：新兴市场股票
TLT：20年期国债（iShares Barclays）
COY：美国高收益债券
gsp：大宗商品（iPath S＆P GSCI总回报指数）
RWR：房地产（房地产投资信托指数）

names = { 'SPY'，'EEM'，'TLT'，'COY'，'GSP'，'RWR' };

startPeriod = '2009-10-01' ;

endPeriod = '2013-06-24' ;

视频

Copula算法原理和R语言股市收益率相依性可视化分析

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

可视化标准化价格

该图显示了每个指数的相对价格走势。每个指数的初始水平已经标准化为统一，以便于比较历史记录中的相对表现。

plot（date，normPrices），datetick（'x'），xlabel（'Date'），ylabel（'Index Value'）;
title（'Normalized Daily Index Closings'）;

边际分布

为准备copula建模，单独描述每个指数的回报分布。虽然每个回归序列的分布可以参数化地表征，但是使用具有广义Pareto尾部的分段分布来拟合半参数模型是有用的。这使用极值理论来更好地表征每个尾部的行为。

return = price2ret（ ）;

以下代码段为每个索引返回系列创建一个paretotails类型的对象。这些Pareto尾部对象封装参数Pareto下尾部，非参数内核平滑内部和参数Pareto上尾部的估计，以为每个索引构建复合半参数CDF。

tailFraction = 0.1;

marginal {i} = paretotails（return（：，i），tailFraction，1 - tailFraction，'kernel'）;

SPY的边际分布：

分段分布有3个部分

-Inf <x <-0.0125822（0 <p <0.1）：下尾，GPD（0.0380262,0.0084794）

-0.0125822 <x <0.01286（0.1 <p <0.9）：内插内核平滑cdf

0.01286 <x <Inf（0.9 <p <1）：上尾，GPD（0.0511828,0.00671413）

EEM的边际分布：

分段分布有3个部分

-Inf <x <-0.0186259（0 <p <0.1）：下尾，GPD（-0.00289033,0.0126097）

-0.0186259 <x <0.0185703（0.1 <p <0.9）：内插内核平滑cdf

0.0185703 <x <Inf（0.9 <p <1）：上尾，GPD（0.0326916,0.00981892）

TLT的边际分布：

分段分布有3个部分

-Inf <x <-0.0132814（0 <p <0.1）：下尾，GPD（0.137056,0.00414294）

-0.0132814 <x <0.0128738（0.1 <p <0.9）：内插内核平滑cdf

0.0128738 <x <Inf（0.9 <p <1）：上尾，GPD（0.027114,0.00583448）

COY的边际分布：

分段分布有3个部分

-Inf <x <-0.0105025（0 <p <0.1）：下尾，GPD（0.47441,0.00485515）

-0.0105025 <x <0.011195（0.1 <p <0.9）：内插内核平滑cdf

0.011195 <x <Inf（0.9 <p <1）：上尾，GPD（0.177151,0.00500233）

GSP的边际分布：

分段分布有3个部分

-Inf <x <-0.0161561（0 <p <0.1）：下尾，GPD（-0.0382412,0.0103328）

-0.0161561 <x <0.016506（0.1 <p <0.9）：内插内核平滑cdf

0.016506 <x <Inf（0.9 <p <1）：上尾，GPD（-0.134845,0.00778651）

RWR的边际分布：

分段分布有3个部分

-Inf <x <-0.0172097（0 <p <0.1）：下尾，GPD（-0.00540337,0.0114245）

-0.0172097 <x <0.0168041（0.1 <p <0.9）：内插内核平滑cdf

0.0168041 <x <Inf（0.9 <p <1）：上尾，GPD（0.0302092,0.0117143）

得到的分段分布对象允许在CDF内部进行插值并在每个尾部进行外推（函数评估）。外推允许估计历史记录之外的分位数，这对于风险管理应用是非常宝贵的。在这里，我们将paretoTail分布产生的拟合与正态分布的拟合进行比较。

index = 1;

dist = marginal {index};

CLF

h = probplot（gca，@ dist.cdf）;

set（h，'Color'，'r'）;

title（[ 'Semi-Parametric / Piecewise Probability Plot：' names {index}]）

Copula拟合

我们使用统计工具箱功能来校准和模拟数据。

使用每日索引返回，使用函数copulafit估计高斯和t copula的参数。由于在标量自由度参数（DoF）变得无限大时，copula变为高斯copula，因此两个copula实际上属于同一族，因此共享线性相关矩阵作为基本参数。

统计工具箱软件提供了两种在copula校准的技术：以下代码段首先通过上面导出的分段半参数CDF将每日居中的回报转换为均匀变量。然后它将Gaussian和t copula拟合到转换后的数据：

[〜，ax] = plotmatrix（U）; title（'拟合Copula之前的转换回报'）;

估算copula的参数。注意从t copula校准获得的相对较低的自由度参数，表明明显偏离高斯情况。

[rho，DoF] = copulafit（'t'，U，'ApproximateML'）

rhoT =

1 0.88229 -0.59693 0.40875 0.58027 0.81485

0.88229 1 -0.52371 0.38906 0.63175 0.73608

-0.59693 -0.52371 1 -0.28404 -0.37285 -0.43114

0.40875 0.38906 -0.28404 1 0.2953 0.36207

0.58027 0.63175 -0.37285 0.2953 1 0.47097

0.81485 0.73608 -0.43114 0.36207 0.47097 1

DoF =

9.5014

估计的相关矩阵与线性相关矩阵相似但不相同

corrcoef（return） 每日收益的％线性相关矩阵

ans =

1 0.89745 -0.61065 0.4677 0.59174 0.83717

0.89745 1 -0.54167 0.45612 0.63322 0.76712

-0.61065 -0.54167 1 -0.30377 -0.3918 -0.44429

0.4677 0.45612 -0.30377 1 0.33312 0.43525

0.59174 0.63322 -0.3918 0.33312 1 0.49161

0.83717 0.76712 -0.44429 0.43525 0.49161 1

Copula模拟

现在已经估计了copula参数，使用copularnd函数模拟联合依赖的均匀变量。

然后，通过外推Pareto尾部并对平滑后的内部进行插值，通过每个索引的逆CDF 将从copularnd导出的均匀变量转换为每日居中返回。这些模拟的居中回报与从历史数据集获得的回归一致。假设回报在时间上是独立的，但在任何时间点都具有由给定的copula引起的依赖性和等级相关性。

nPoints = 10000; ％＃模拟观测值

计算单周期模拟VaR

来自copula模型的多变量模拟可用于计算样本组合的风险值和预期不足（CVaR）。

％样本组合组件权重

wts = [.1 .2 .3 .2 .1 .1]';

％从模拟组件返回生成组合返回

portReturns = R * wts;

％计算VaR

var = -prctile（portReturns，1）;

cvar = -mean（portReturns（portReturns <-var））;

％与正态分布比较

R2 = mvnrnd（mean（returns），cov（returns），10000）;

normReturns = R2 * wts;

var2 = -prctile（normReturns，1）;

cvar2 = -mean（normReturns（normReturns <-var2））;

disp（'Copula Value-at-Risk ----------------------'）;

fprintf（'99 %% VaR：％0.2f %% \ n99 %% CVaR：％0.2f %% \ n \ n'，var * 100，cvar * 100）;

disp（'多变量正常风险值---------'）;

fprintf（'99 %% VaR：％0.2f %% \ n99 %% CVaR：％0.2f %% \ n \ n'，var2 * 100，cvar2 * 100）;

Copula风险价值----------------------

99％的风险价值：1.78％

99％CVaR：2.58％

多变量正常风险值---------

99％VaR：1.49％

99％CVaR：1.71％

组合优化

以前，我们使用模拟回报来计算样本组合的风险。相反，我们可以找到一个最佳投资组合（权重），为我们提供一定的回报风险。我们可以使用PortfolioCVaR框架来完成此任务。

p = PortfolioCVaR（'ProbabilityLevel'，。99，'AssetNames'，名称）;

p = p.setScenarios（R）;



portRet = p.estimatePortReturn（wts）;

CLF

visualizeFrontier（p，portRisk，portRet）;

以给定的回报水平计算投资组合

wt = p.estimateFrontierByReturn（.05 / 100）;

TOC;

pRisk = p.estimatePortRisk（wt）;

pRet = p.estimatePortReturn（wt）;

经过的时间是0.635017秒。

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

matlab使用Copula仿真优化市场风险

内容

导入支持历史数据集

可视化标准化价格

边际分布

SPY的边际分布：

EEM的边际分布：

Copula拟合

Copula模拟

计算单周期模拟VaR

组合优化

相关文章

matlab使用Copula仿真优化市场风险

内容

导入支持历史数据集

可视化标准化价格

边际分布

SPY的边际分布：

EEM的边际分布：

Copula拟合

Copula模拟

计算单周期模拟VaR

组合优化

相关文章

关注有关新文章的微信公众号