混合模型是另一种生成模型，它将数据点的分布建模为多个单独分布的组合（”混合”）。

由Kaizong Ye，Liao Bao撰写

客户常见的混合模型类型是高斯混合模型，其中数据生成分布被建模为多个高斯分布的组合。


import numpy as np import matplotlib.pyplot as plt

× 高斯混合模型是一种常见的聚类算法，与K均值算法类似，同样使用了EM算法进行迭代。高斯混合模型假设每个簇的数据都是符合高斯分布的，当前数据呈现的分布就是各个簇的高斯分布叠加在一起的效果，可用多个高斯分布函数的线性组合来对数据分布进行拟合。理论上，高斯混合模型可以拟合出任意类型的分布。、

下面是通过三个二维高斯分布的一些数据：

python


......

# 绘制数据
plt.plot(X[:, 0], X[:, 1], '.', alpha=0.2)

让我们使用贝叶斯高斯混合模型对这些数据进行建模。

数据点生成于混合成分的概率由分类分布进行建模，根据权重来决定：

然后，数据点观测值的似然性由混合成分的分布决定：

可下载资源

完整程序、数据和文档（word）

最受欢迎的见解

1.R语言k-Shape算法股票价格时间序列聚类

2.R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图

3.R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

4.r语言鸢尾花iris数据集的层次聚类

5.Python Monte Carlo K-Means聚类实战

6.用R进行网站评论文本挖掘聚类

7.R语言KMEANS均值聚类和层次聚类：亚洲国家地区生活幸福质量异同可视化

8.PYTHON用户流失数据挖掘：建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯模型和KMEANS聚类用户画像

9.R语言基于Keras的小数据集深度学习图像分类

让我们来构建这个模型。与相关模型一样，这是一个生成模型，而只是拟合数据生成分布 – 因此__call__方法没有输入参数。

视频

KMEANS均值聚类和层次聚类：R语言分析生活幸福质量系数可视化实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜


class GaussianMixtureModel(pf.Model):

 ......
        return pf.Mixture(dists, probs=self.theta())

构建上述模型的复杂性与使用“原始”TensorFlow和TensorFlow Probability构建模型的复杂性进行比较。

然后，我们可以实例化该模型并将其拟合到数据中！

......model.fit(X, lr=0.03, epochs=500, batch_size=1024)

要查看混合密度在可能的值范围上的拟合情况，我们可以计算并绘制模型在网格上的概率：


# 在网格上计算每个点的对数似然
Np = 100 # 网格点数量
......
# 显示拟合的混合密度
plt.imshow(probs,
......           origin='lower')

R语言：EM算法和高斯混合模型聚类的实现

阅读文章 ➜

混合密度线与用于拟合模型的数据点非常吻合！

随时关注您喜欢的主题


# 绘制密度和原始数据点 ......plt.contour(xx, xx, probs)

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！