
Tableau 数据可视化:探索性图形分析新生儿死亡率数据
今天,我们将与Tableau Public合作,使用该工具, 可以创建各种交互式图表,地图和表格,并将它们组织成仪表板和故事,然后可以将其保存到云中并嵌入到Web中。
介绍Tableau Public
我们今天将使用的数据
nations.csv
来自世界银行指标门户的数据。包含以下字段:iso2c
iso3c
由国际标准化组织分配的每个国家的两个字母和三个字母的代码。country
国家的名字。year
population
估计年中总人口,包括难民以外的所有居民。gdp_percap
按当前国际美元计算的人均国内生产总值,已根据不同地区的购买力进行了校正。life_expect
出生时的预期寿命,以年为单位。population
估计年中总人口,包括难民以外的所有居民。birth_rate
根据年中人口估计数,每千人中该年中的活产数。neonat_mortal_rate
新生儿死亡率:在给定年份中,每千名活产婴儿中28岁之前死亡的婴儿。region
income
世界银行的地区和收入群体在这里解释。
可视化新生儿死亡率数据
连接到数据
启动Tableau Public,您将看到以下屏幕:


根据Connect
在左上角,选择标题Text File
,浏览文件nations.csv
和Open
。此时,您可以查看数据,其标签如下:
- 文本:
Abc
- 号码:
#
- 日期:日历符号
- 地理:全球符号
创建新的计算变量
数据包含给出出生和新生儿死亡率的变量,但没有给出必须计算的出生和死亡总数的变量。在顶部菜单中,选择Analysis>Create Calculated Field
。如下所示填写对话框(只需开始输入变量名以选择要在公式中使用的变量名):


现在创建第二个计算字段,以给出新生儿死亡总数:


了解Tableau的默认行为是汇总/汇总数据
请注意,Tableau例行汇总或汇总了落入Columns
和的度量,例如Rows
,计算SUM
或AVG
(平均值或均值)。
可以通过Analysis
从顶部菜单中选择并取消选中来关闭此行为Aggregate Measures
。但是,我不建议您这样做,因为它将禁用某些Tableau功能。
制作折线图,显示不同国家/地区随时间推移的新生儿死亡率
为了解决我们的第二个问题,并按国家/地区探索随时间推移的新生儿死亡率,我们可以使用折线图。
首先,Neonat Mortal Rate
在Measures
面板中选择,然后单击右侧的向下小三角形以显示其菜单。选择Rename
并更改为Neonatal death rate (per 1,000 births)
。
然后这个变量拖到Rows
并Year
到Columns
。该图表现在应如下所示:


Tableau通过使用函数将每年每个国家的费率相加来汇总数据SUM
。您可以通过打开中的变量菜单来更改摘要功能Rows
,如下所示:


跨国家加价是没有道理的。而且,我们对各个国家的新生儿平均死亡率或中位数没有兴趣。相反,我们希望每个国家/地区有一条线。所以拖动Country
到Detail
在Marks
货架:


我们可以使用颜色来区分不同的区域,因此将区域拖动到Color
:


Region
是类别变量,Tableau选择了其默认的定性调色板。要获得更精细的配色方案,请单击Color
,选择,Edit Colors...
然后在对话框中选择Tableau Classic Medium
定性配色方案,然后单击Assign Palette
和OK
。
Tableau的定性调色板设计合理,因此无需采用ColorBrewer方案


Color
再次单击并将透明度设置为75%。
现在,右键单击X轴,选择Edit Axis
,如下所示编辑对话框,然后将其关闭:
再次右键单击X轴,选择Format
,更改Alignment
为,Up
然后使用下拉菜单将设置Font
为粗体。关闭Format
面板,图表现在应如下所示:


Sheet 1
选择文本,打开下拉菜单,然后选择,以删除图表上的标题Hide Title
。
Income group
过滤器将按字母顺序列出选项,而不是按收入顺序列出,这样更有意义。要解决此问题,请Income group
在Data
面板中右键单击并选择Default Properties>Sort
。在下面的对话框中,选择Manual
排序,如下编辑顺序,然后单击OK
:


过滤的替代方法:突出显示要与颜色进行比较的国家
要获得与图表相似的效果,请打开工作表菜单,然后选择Duplicate
复制图表。
现在,需要使用要突出显示的那些国家/地区的名称以及其他具有相同标签的国家/地区创建一个新的计算变量,例如Other
。
选择Analysis>Create Calculated Field...
,调用新变量Country2
并按如下所示填写公式:
现在将其拖动Country2
到Color
该图表上,如下所示:


Color>Edit Colors...
手动选择和更改颜色,为以下项选择浅灰色Other
:
该图表现在应如下所示:


该图表现在应如下所示:


可下载资源
关于作者
Kaizong Ye是拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。
本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。
非常感谢您阅读本文,如需帮助请联系我们!