R语言基于温度对城市层次聚类、kmean聚类、PCA主成分分析和Voronoi图可视化

为了说明层次聚类技术和k-均值,我使用了了城市温度数据集,其中包括几个城市的月平均气温。

由Kaizong Ye,Sherry Deng撰写

我们有15个城市,每月进行一次观测

由于方差看起来相当稳定,我们不会将这里的变量“标准化”,

为了得到一个层次聚类分析,使用实例


另一种选择是使用

在这里,我们用主成分分析将观察结果可视化。我们这里还有一个自动选择类的数目,这里是3个。我们可以得到组的描述

或直接


r语言鸢尾花iris数据集的层次聚类

阅读文章


我们也可以自己可视化这些类,

可以绘制出这些簇的中心点


随时关注您喜欢的主题


如果我们在这些中心周围添加Voronoi集,我们看到的是中间的点,恰好是三个区域的交点

要可视化这些区域,请使用Voronoi图,它又叫泰森多边形或Dirichlet图。

Voronoi图是由一组由连接两邻点直线的垂直平分线组成的连续多边形组成。

实际上,这三组(和这三个区域)也是我们用k-均值算法得到的,

由于我们有一些空间数据,我们可以在地图上把它们可视化

或者,为了可视化这些区域,使用


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498