R语言离散时间马尔可夫链(Markov chain)模型分类案例可视化分析

有许多用于马尔可夫链的复杂应用。

由Kaizong Ye,Liao Bao撰写

这些包括用于将多态模型拟合为面板数据的msm和SemiMarkov,用于生存分析应用的mstate,用于估计3状态进行性疾病模型的转移概率的TPmsm,用于将马尔科夫模型应用于健康护理经济应用的hemod,用于拟合隐马尔可夫模型和mcmc与蒙特Carlo马尔科夫链使用。

在本文中,我们将探索离散时间Markov链的一些基本属性。

使用离散时间马尔科夫链的大部分涉及操纵与链相关联的转移概率的矩阵。第一部分代码复制了Oz转移概率矩阵。

然后,来自expm包的有效算符%^%用于将Oz矩阵提高到三次方。最后,OZ ^ 3的左矩阵乘以分布向量u =(1/3,1/3,1/3)给出三天前的天气预报。 stteNs <- c("Rain","Nice","Snow") Oz <- mtrx(c(.5,.25,.25,.5,0,.5,.25,.25,.5),              nrw=3, brw=TRUE)

image.png

pta(Oz,pos = c(1,2),         lwd = 1, box.lwd = 2,               self.shiftx = .13,         main = "")

QQ截图20231128144503.png

Oz3 <- Oz %^% 3 rnd(Oz3,3)
image.png

视频

马尔可夫链原理可视化解释与R语言区制转换Markov regime switching实例

探索见解

去bilibili观看

探索更多视频

rud(u %*% Oz3,3)
image.png


下一个代码块再现了5状态Drunkward的步行示例,其给出了吸收马尔可夫链的基本原理。 首先,描述链的转移矩阵被实例化为S4类makrovchain的对象。 然后,来自马尔可夫链包的函数用于识别链的吸收和瞬变状态,并将转换矩阵P置于规范形式中。


DW <- matrix(dw,5,5,byrow=TRUE)  
  
Dmc


image.png

醉酒的步行问题

一个具有以下状态的5维离散马尔科夫链 0 1 2 3 4 ,转换矩阵(按行)定义如下:

#0 1 2 3 4 
#0 1.0 0.0 0.0 0.0 0.0 
#1 0.5 0.0 0.5 0.0 0.0 
#2 0.0 0.5 0.0 0.5 0.0 
#3 0.0 0.0 0.5 0.0 0.5 
#4 0.0 0.0 0.0 0.0 1.0



图片

R语言使用马尔可夫链对营销中的渠道归因建模

阅读文章


确定瞬时状态

trnieSttes(Dmc)

image.png
#确定吸收状态

absrngtates(DWmc)
image.png


随时关注您喜欢的主题


规范形式

在规范形式中,转换矩阵P被分割成恒等矩阵I,一个0的矩阵,矩阵Q包含瞬态的概率,矩阵R包含吸收的概率状态。

接下来,我们通过反转(I-Q)找到基本矩阵N. 对于每个瞬态状态,j,nij给出了处于状态j的过程的预期次数,假定它在瞬态i开始。 ui是给定处理在状态i开始的吸收的预期时间。 最后,我们计算矩阵B,其中bij是在状态j中处理将被吸收的概率,假设它在状态i开始。

查找矩阵Q

gRQ <- funton(M,type="Q"){  
tm <- M@trasitnatrix  
d <- diag(tm)  
m <- ax(whch(d == 1))  
n <- lngh(d)  
ifese(te=="Q",  
A <- tm[(m+1):n,(m+1):n],  

}


将DWmc放入规范表单

P <- cniorm(Wmc)  
P

image.png
Q <- geRQ(P)

查找基本矩阵


I <- dag(im(Q)[2]) N <- sle(I - Q) N
image.png

计算吸收时间

c <- rp(1im(N)[2])  
u <- N %*% c  
u
image.png
R <- gtQ(P,"R")  
B <- N %*% R  
B
image.png

对于处理正则和遍历马尔科夫链,我们返回到Oz,并且提供用于计算稳态的四个选项,或者限定该规则转移矩阵的概率分布。 前三个选项涉及在R中容易获得的标准方法。方法1使用%^%来将矩阵O z提高到足够高的值。 方法2计算特征向量1的特征值,方法3计算空间或与矩阵相关联的线性变换的核。 要使用此函数,我们首先将Oz转换为markovchain对象。

Ergodic Markov链

四种获得稳定状态的方法 :

方法1:计算Matrix上的权重

rud(Oz %^% 6,2
image.png

方法2:计算特征值1的特征向量

eieOz <- en(t(Oz))  
ev <- egOz$vcors[,1] / sum(eienz$vcrs[,1])  
ev
image.png

方法3:计算(P-I)

I <- dag(3)  
ns <- npae(t(Oz - I))  
ns <- rund(ns / sum(ns),2)  
ns
image.png

方法4:使用函数

OC<-nw("akovhain",  
staes=statNams,  
transtinMarix=  
nrow=3,  
bo=TRUE,  
dimnaes=ist(staeNas,satNames)))  
  
sedSte(Oz)

image.png

对于相当大的马可夫链,函数似乎是相当有效的。 以下代码创建一个5,000行乘以5000列常规马尔可夫矩阵。 创建markovchain对象和计算稳态分布。

创建一个大的随机规则矩阵

radeg <- uion(N){  rowS <- rowSums(M)  
regM <- M/rowS  
return(regM)  
}  
  

.tim(reMC <- new("mrkvchai", sttes = ascharcer(1:N),  
trastinMatrix= M,  
name = "M"))
image.png
stm.time(ss <- staytts(eMC))


image.png

我们通过使用rarkovhain函数来模拟这个大随机矩阵表示的过程的轨迹并绘制结果来结束这个小马尔可夫链偏移。 看来这是一种用于模拟静态时间序列的合理方法。

样品来自regMC


rgMCts <- rmrkocin(n=1000,object=regMC)  
reMCtDf <- as.daa.rame(regCts,stingssFaors = FALSE)  
rgMCsDf$idex <- 1:1000  
reMCtsf$rMts <- as.umrc(rCtDf$reMCts)  
  

p <- got(egCtfs(indx,egMCts))  
p + g_lie(colur="dark red") +  


image.png


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds