通过SAS网络分析对人口迁移进行可视化分析

世界上超过3.5%的人口正在移动,被视为国际移民。

由Kaizong Ye,Coin Ge撰写

这是一个超过2.5亿人生活在一个不同于他们的出生国或国籍的国家。以另外一种方式,如果所有的移民生活在一个国家,其人口将是5 个最大的国家在世界上! 移民的流动,我们创建了一个可视化,让用户亲眼看看移民的移动情况。

移民迁移到哪些国家?在移居特定国家的所有移民中,他们来自哪里?

迁移可视化

我们希望允许用户轻松探索这些问题,因此我们使用SAS Visual Analytics创建了交互式可视化。我们分析了联合国(联合国经济和社会事务部 – 人口司)的移民数据,并开始编写报告。但是显示这些数据的最佳方法是什么?

×

目前,我们可以在市场上找到很多用于网络分析和数据可视化的开源工具,例如NetworkX,R和Gephi中的iGraph包等。在所有工具中,Gephi一直以来被认为是最值得推荐的,它可以帮助用户轻松实现超过十万个节点的可视化。但是,除了Gephi,还有很多免费开源工具可供选择,本文列出了顶级的七大数据可视化分析工具,可帮助企业分析并梳理数据之间的关系。

1、Gephi

Gephi是一个开放式的图形可视化平台,基本也是市场上公认的领先分析软件之一,也是最受欢迎的网络可视化分析软件包之一。使用者不需要具备任何编程知识,就可广泛使用Gephi生产高质量的可视化图表。它还可以处理相对较大的图形,实际大小取决于基础结构参数(特别是RAM),但应该能够毫无问题地运行多达十万个节点。它可以计算一些常见指标,比如度数,中心性等,重点关注可视化而非分析的强大工具。

2、Cytoscape

Cytoscape同样是一个开源可视化平台,有桌面版本和Javascript版本供开发人员选择。虽然,Cytoscape主要用于生物学领域,但它能够产生高质量的可视化图表且同样适用于其他领域,Cytoscape还有一系列用于网络操作和可视化的算法。

3、Ucinet

Ucinet主要用于学术界,提供广泛的分析功能并可计算大量指标,但它的重点并不是可视化而是分析,Ucinet擅长计算并分析各种类型的指标,但并不擅长将这些结果转化为精致的可视化报表。Ucinet只能在Windows上运行,因此Mac用户必须通过安装虚拟机来使用。

4、NodeXL

该工具在高质量可视化方面可能无法提供Gephi具备的灵活性,但该软件可接口SNAP库并进行分析,使其可以访问一组用于度量计算的高效算法。NodeXL的主要优点是其可视化、分析和数据收集功能比较强大,可与TwitterAPI良好接口,研究人员曾利用NodeXL对社交媒体数据进行可视化和分析。据报道,NodeXL接下来会有一个商业版本,它将具有比开源版本更多的功能。

5、NetMiner

NetMiner是一种商用SNA软件,可用于对大型社交网络数据进行探索性分析和可视化,主要用于社交网络的一般研究和教学,它允许科学家和研究人员以可视化和交互方式分析数据,并了解网络的基本模式和结构。它的主要功能是网络分析、数据转换、统计、网络数据可视化和绘制图表等。

6、Pajek

Pajek是由研究人员VladamirBatagelj开发的高级免费软件,广泛用于大型网络分析和可视化。Pajek也被称为Ucinet的免费替代品,并提供强大的分析工具和免费文档,以帮助研究人员快速开始使用。

7、SocialNetworksVisualizer

SocialNetworksVisualizer是一个用户友好的开源工具,被定义为一个跨平台的图形应用程序,用于社交网络分析和可视化。它让开发人员能够创建和修改社交网络并更改节点属性,其包括分析社会和数学属性以及有效地应用可视化布局以更好得呈现结果。对于数据分析家来说,这是一个非常有用的工具,可以与随机网络一起应用于社交数据集。利用这个工具,研究人员可以计算基本的图形属性,比如密度、直径、连通性、偏心率以及网络分析需要的其他指标。

数据中有许多变量,但关键变量是年份,国家,国家目的地和移民数量(见下面的例子)。由于空间考虑,分析中的其他变量(如性别和区域)在以下屏幕截图中被省略。


热门课程

R语言数据分析挖掘必知必会

面对扑面而来的数据浪潮,包含Google、Facebook等国际企业,都已采用R语言进行数据分析

探索课程

可视化地图上的移动

由于我们正在处理地理数据,因此我们希望在地图上显示可视化。我们将地图过滤为一个原始国家/地区。不确定哪种方式可能表现最佳,我们尝试了两种标准方式来显示地理地图(如下所示)。

泡泡图 – 泡沫越大,移动到目的地国家的移民就越多。

地区 – 国家阴影越黑,移民越多。


一目了然,您可以看到哪个目的地国家有更多的移民。

您可以在一个您可能不会想到的地方找到答案:网络分析。如果你以前没有使用过这个对象,你首先想到的可能是它们看起来像蜘蛛网(很多都是这样)。以下对象是对上述地图上显示的相同联合国数据的网络分析,过滤到单个来源国家。节点的大小表示到目的地国家的移民数量。

以下地图反映了这些变化。它包含与之前地图相同的信息,但它讲述了一个更加动态的故事。网络分析显示了移民的起源,线条的粗细比较了体积,颜色代表了目的地区域。您可以一眼就看出移民的移动地点和移动地点!


为了实现这一切,我们根据移民目的地添加了一个词云。现在,当您按移民来源过滤时,您可以在地图和文字云中快速查看移民卷。


可下载资源

​非常感谢您阅读本文,如需帮助请联系我们!


关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。


 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498