简而言之，我们的问题如下：我们想探索几种灵长类动物的乳汁成分，假设来自大脑较大的灵长类动物的雌性产生更有营养的牛奶（这样做是为了*支持这种大大脑的发育）。对于进化生物学家来说，这是一个重要的问题，为了给出和回答，我们将使用3个变量，两个预测变量：新皮层的比例与总质量的比较大脑和母亲体重的对数。对于预测变量，每克牛奶的千卡。使用这些变量，我们将构建 3 个不同的线性模型：

仅使用新皮层变量的模型
仅使用质量变量对数的模型
使用两个变量的模型


d.iloc[:, 1:] = d.iloc[:, 1:] - d.iloc[:, 1:].mean()
d.head()

现在我们有了数据，我们将仅使用 neocortex。

with pm.Model() as model_0:
  
    trace_0 = pm.sample(2000, return_inferencedata=True)

第二个模型与第一个模型完全相同，只是我们现在使用质量的对数

with pm.Model() as model_1:
 

    trace_1 = pm.sample(2000, return_inferencedata=True)

最后是第三个模型使用 neocortex和变量log_mass

with pm.Model() as model_2:
   

    trace_2 = pm.sample(2000, return_inferencedata=True)

现在我们已经对 3 个模型的后验进行了采样，我们将对它们进行视觉比较。一种选择是使用forestplot支持绘制多个迹线的函数。

az.plot_fo

最受欢迎的见解

1.MATLAB贝叶斯估计MCMC分析药物对不同种群生物生理指标数据评估可视化

3.R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

4.R语言NIMBLE、Stan和INLA贝叶斯平滑及条件空间模型死亡率

5.R语言使用RJAGS R2JAGS建立贝叶斯模型

6.R语言贝叶斯线性回归和多元线性回归构建工资预测模型

7.R语言使用贝叶斯层次模型进行空间数据分析

8.R语言中贝叶斯网络（BN）、动态贝叶斯网络、线性模型分析错颌畸形数据

9.Python贝叶斯金融数据应用实例合集

另一种选择是在同一图中绘制多条迹线是使用densityplot 。

az.plot_d

现在我们已经对 3 个模型的后验进行了采样，我们将使用 WAIC（广泛适用的信息标准）来比较 3 个模型。我们可以使用 PyMC3 附带的compare功能来做到这一点。

R语言用贝叶斯线性回归、贝叶斯模型平均 (BMA)来预测工人工资

阅读文章 ➜


comp = az.compare(model_dict)
comp

我们可以看到最好的模型是，具有两个预测变量的模型。请注意，数据帧按从最低到最高 WAIC 的顺序（即从好到最差的模型）。

现在，我们将使用copmuted来生成预测，而不是基于单个模型，而是基于加权模型集。

随时关注您喜欢的主题


ppc_w = pm.sample_posterior_predictive_w(

请注意，我们正在传递按其索引排序的权重。

我们还将计算最低 WAIC 模型的 PPC


ppc_2 = pm.sample_posterior_predi

比较这两种预测的一种简单方法是绘制它们的平均值和 hpd 区间


plt.yticks([])
plt.ylim(-1, 2)
plt.legend();

正如我们所看到的，两个预测的平均值几乎相同，但加权模型中的不确定性更大。

我们已经有效地将我们应该选择哪个模型的不确定性传播到后验预测样本中。

结语：

还有其他方法可以平均模型，例如，显式构建一个包含我们拥有的所有模型的元模型。然后，我们在模型之间跳转时执行参数推理。这种方法的一个问题是，在模型之间跳跃可能会妨碍后验的正确采样。

版本信息

%load_ext watermark
%watermark -n -u -v -iv -w

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

Python用PyMC3贝叶斯模型平均BMA：采样、信息准则比较和预测可视化灵长类动物的乳汁成分数据

当面对多个模型时，我们有多种选择。

模型平均

伪贝叶斯模型平均

使用贝叶斯自举进行伪贝叶斯模型平均

堆叠

加权后验预测样本

R语言用贝叶斯线性回归、贝叶斯模型平均 (BMA)来预测工人工资

随时关注您喜欢的主题

我们已经有效地将我们应该选择哪个模型的不确定性传播到后验预测样本中。

结语：

版本信息

相关文章

Python用PyMC3贝叶斯模型平均BMA：采样、信息准则比较和预测可视化灵长类动物的乳汁成分数据

当面对多个模型时，我们有多种选择。

模型平均

伪贝叶斯模型平均

使用贝叶斯自举进行伪贝叶斯模型平均

堆叠

加权后验预测样本

R语言用贝叶斯线性回归、贝叶斯模型平均 (BMA)来预测工人工资

随时关注您喜欢的主题

我们已经有效地将我们应该选择哪个模型的不确定性传播到后验预测样本中。

结语：

版本信息

相关文章

关注我们，永远不要错过任何见解。