R语言使用马尔可夫链Markov Chain, MC来模拟抵押违约

这篇文章的目的是将我学习的材料与我的日常工作和R相结合。

如果我们有一些根据固定概率随时间在状态之间切换的对象,我们可以使用马尔可夫链 * 来模拟该对象的长期行为。

一个很好的例子是抵押贷款。在任何给定的时间点,贷款都有违约概率,保持最新付款或全额偿还。总的来说,我们将这些称为“转移概率”。假设这些概率在贷款期限内是固定的**。

MarkovDiagram

举个例子,我们将看一下传统的固定利率30年期抵押贷款。让我们假设每个当前贷款的时间T有75%的可能性保持最新,10%的违约机会,15%的机会在T + 1时间内获得回报。这些转换概率在上图中列出。显然,一旦贷款违约或获得偿还,它将保持默认或支付。我们称这些国家为“吸收国家”。

该系ç»çé¿æè¡ä¸ºæ¯ç¨³å®çï¼å¹¶ä¸è¾¾å°äºâ稳å®ç¶æâã

由于我们知道转移概率,我们所需要的只是贷款的初始分配,我们可以预测在30年期间任何给定点的每个州的贷款百分比。假设我们从T = 0开始,有100个当前贷款,0个违约和已付清贷款。在时间T + 1,我们知道(根据我们的转换概率),这100个中的75个将保持最新的付款。但是,15笔贷款将被清偿,10笔贷款将被违约。由于我们假设转移概率在贷款期限内是不变的,我们可以用它们来查找当前贷款的时间t = 2。在目前T + 1的75笔贷款中,56.25笔贷款将保持在T + 2(75 * .75 = 56.25)。

ç¨äºè®¡ç®åç»å¾çR代ç ã

如果我们重复这个过程28次(在代码中完成)并绘制点,我们得到上面绘制的时间序列。30年后,目前没有贷款(因为它们都是30年期贷款)。他们都得到了回报或违约,更多的贷款得到了支付而不是违约。


*使用马尔可夫链来模拟抵押贷款有许多缺点。这个模型假设我在我的例子中使用的所有100个贷款的转移概率是相同的。实际上,贷款并不相同(例如,借入一笔贷款的信用评分可能比另一笔贷款高得多。这种差异会使前者的违约机会低很多),而且转移概率在贷款的整个生命周期中并不是一成不变的(例如如果利率在贷款期限中途暴跌,那么自借款人以较低的利率再融资以来,贷款将会大幅减少的可能性。简而言之,没有人真正使用这个模型,因为它太原始了。然而,有趣的是,我确实将我的情节曲线与我在工作中的经验数据进行了比较,结果非常相似。

在工业中,生存分析  最常用于模拟贷款(通常使用逻辑回归  与面板数据或比例风险模型实施)。这是生物统计学和经济学的有趣结合。当人们将生物统计学术语应用于抵押贷款来讨论单月死亡率(每月预付概率),危险或生存函数(即我的图表中的蓝线)时,这一点尤其有趣。

在这种情况下,这些概率可以是“危险率”。例如,违约的危险是贷款违约时间T + 1的概率,因为它在时间T中存活了。这是不同的从违约概率。前者是条件概率而后者不是。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds