本文聚焦于利用马尔可夫递归神经网络（MarkovRNN）结合树库展开建模工作。

由Kaizong Ye，Weilong Zhang撰写

MarkovRNN 通过整合马尔可夫特性与离散随机变量来深入探索递归神经网络中的随机转换机制，旨在高效处理具有复杂潜在信息的高度结构化序列数据。

在该模型中，每个时间步的离散样本均源自参数化的分类分布，且潜在信息的编码取决于所选状态对应的不同状态编码器。

一、引言

语言建模在自然语言处理领域至关重要，它对于理解和生成自然语言文本起着关键作用。

可下载资源

完整程序、数据和文档（word）

本文分析的智能体、数据、代码、报告分享至会员群

加入会员群

传统方法在处理复杂数据结构和潜在信息时存在一定局限性，而 MarkovRNN 模型为解决这些问题提供了新的思路。

× 马尔可夫性质的引入：Markov RNN 将马尔可夫性质引入到 RNN 中。马尔可夫性质是指在给定当前状态的情况下，未来状态只与当前状态有关，而与过去的状态无关。在 Markov RNN 中，每个时间步的隐藏状态的更新不仅依赖于当前输入和上一个时间步的隐藏状态，还与一个离散的马尔可夫状态相关。模型架构的改变：在 Markov RNN 中，通常会增加一个马尔可夫状态转移机制。例如，在每个时间步，模型会根据当前的输入和隐藏状态计算出一个马尔可夫状态的概率分布，然后从这个分布中采样出一个马尔可夫状态，这个状态会影响下一个时间步隐藏状态的计算。这种架构使得模型能够更好地捕捉序列数据中的局部和全局依赖关系。

二、实验设置

软件环境
采用 Tensorflow 1.4.1 构建和运行模型。

数据集
选用树库作为实验数据集。以下是部分关键的数据导入代码：

from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tfimport tensorflow.contrib.slim as slim  import numpy as npimport reader

三、模型构建

视频

马尔可夫链原理可视化解释与R语言区制转换Markov regime switching实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

R语言中的隐马尔可夫HMM模型实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

线下+线上课程

R语言隐马尔可夫模型（HMM）预测股市状况

视频

Python、R时间卷积神经网络TCN与CNN、RNN预测时间序列实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

（一）配置参数
定义了一个配置类（Config），其中涵盖了模型训练和运行的关键参数，如初始化规模（init_scale）、最大训练轮数（max_epoch）、批量大小（batch_size）等。


    init_scale = 0.2    max_epoch = 50    max_max_epoch = 50    batch_size = 50    display_step = 50    lr = 20.0    lr_decay = 0.3    embed_drop = 0.2    input_drop = 0.4

（二）数据处理
Input 类负责处理输入数据，对数据的批量大小、时间步数、轮次大小等进行了定义，并实现了输入数据和目标数据的生成。

class Input(object):    def __init__(self, config, data, name=None):        self.batch_size = config.batch_size        self.num_steps = config.num_steps        self.epoch_size = ((len(data) // self.batch_size) - 1) // self.num_steps        self.input_data, self.targets = reader.ptb_producer(data, self.batch_size, self.num_steps, name=name)

（三）模型架构
Model 类构建了核心的 MRNN 模型。在模型初始化过程中，定义了如嵌入层（embedding）、输入（inputs）等变量。例如：

class Model(object):    def __init__(self, is_training, config, data):        with tf.device("/cpu:0"):            self.embedding = tf.get_variable("embedding", [config.vocab_size, config.input_size], dtype=tf.float32)            self.inputs = tf.nn.embedding_lookup(self.embedding, self.data.input_data)

在不同的作用域（scope）下构建了 MRNN 的复杂结构，同时计算了交叉熵（cross – entropy）、负对数似然（NLL）、熵（entropy）、成本（cost）等重要指标，并定义了训练操作（train_op）等。

四、实验过程与结果

（一）数据准备
读取原始数据（raw_data），并根据配置（config）和评估配置（eval_config）创建训练、验证和测试的输入数据（train_input、valid_input、test_input）以及对应的模型（m、mvalid、mtest）。

import osraw_data = reader.ptb_raw_data('./data/')train_data, valid_data, test_data, w2id, id2w = raw_dataconfig = Config()

（二）模型训练与评估
利用 TensorFlow 的 Supervisor 管理会话（session）进行模型训练。在每个训练轮次中，根据特定规则调整学习率和温度。训练完成后，进行模型验证与测试。实验结果表明，模型在处理语言建模任务方面表现出一定的性能，最终得到了相应的困惑度（perplexity）值，并绘制了训练和验证的困惑度曲线。

initializer = tf.random_uniform_initializer(-config.init_scale,config.init_scale)st_input)

plt.figure()plt.plot(range(1,len(ppl_train)+1),ppl_train,'b')plt.show()plt.figure()plt.plot(range(1,len(ppl_valid)+1),ppl_valid,'r')plt.show()

h = np.array(h)print(h.shape)h = np.array(np.split(h,2,3))print(h.shape)z = np.squeeze(np.array(z),[1,2])print(z.shape)qz = np.squeeze(np.array(qz),[1,2])print(qz.shape)x = np.array(x)print(x.shape)y = np.array(y)print(y.shape)logits = np.squeeze(np.array(logits),[1,2])print(logits.shape)

（三）数据可视化
为了进一步分析模型的数据特征，进行了数据可视化操作。

这些可视化操作包括使用t - SNE算法对数据进行降维处理，并将处理后的数据绘制成散点图进行展示，同时还对部分数据的分布进行了图像展示和统计图表展示。

最受欢迎的见解

1.R语言基于ARMA-GARCH-VaR模型拟合和预测实证研究

2.R语言时变参数VAR随机模型

3.R语言估计时变VAR模型时间序列的实证研究

4.R语言基于ARMA-GARCH过程的VAR拟合和预测

5.GARCH（1,1），MA以及历史模拟法的VaR比较

6.R语言用向量自回归（VAR）进行经济数据脉冲响应

7.R语言实现向量自动回归VAR模型

8.R语言随机搜索变量选择SSVS估计贝叶斯向量自回归（BVAR）模型

9.R语言VAR模型的不同类型的脉冲响应分析

from sklearn.manifold import TSNEstart_time = time.time()N = 10000# h_tsne = TSNE(n_components=2).fit_transform(h[:N,1,:])h_tsne = TSNE(n_components=2).fit_transform(h[0,:N,0,0,:])print("time: %f" % (time.time()-start_time))

【视频讲解】Python、R时间卷积神经网络TCN与CNN、RNN预测时间序列3实例

阅读文章 ➜

N1 = 0N2 = 20step=1000N=10000for i in range(0,N,step):    fig = plt.figure(figsize=[5,5])    plt.subplot(2,1,1)    plt.imshow(z[N1+i:N2+i,:].T)    plt.subplot(2,1,2)    plt.imshow(qz[N1+i:N2+i,:].T)    plt.savefig(URL+'/traj_'+str(i)+'.png')    plt.show()

随时关注您喜欢的主题

plt.bar(np.arange(config.K), np.sum(z,0)/np.sum(z), alpha=0.8)plt.savefig(URL+'/stat.png')plt.show()

每日分享最新报告和数据资料至会员群

加入会员群

关于会员群

会员群主要以数据研究、报告分享、数据工具讨论为主；
加入后免费阅读、下载相关数据内容，并同步海内外优质数据文档；
老用户可九折续费。
提供报告PDF代找服务

非常感谢您阅读本文，如需帮助请联系我们！

Python用Markov RNN马尔可夫递归神经网络建模序列数据t-SNE可视化研究

本文聚焦于利用马尔可夫递归神经网络（MarkovRNN）结合树库展开建模工作。

【视频讲解】Python、R时间卷积神经网络TCN与CNN、RNN预测时间序列3实例

随时关注您喜欢的主题

相关文章

Python用Markov RNN马尔可夫递归神经网络建模序列数据t-SNE可视化研究

本文聚焦于利用马尔可夫递归神经网络（MarkovRNN）结合树库展开建模工作。

【视频讲解】Python、R时间卷积神经网络TCN与CNN、RNN预测时间序列3实例

随时关注您喜欢的主题

相关文章

关注有关新文章的微信公众号