R语言ggplot2 对Facebook用户数据可视化分析

读取Facebook的用户数据 

getwd()## [1]“C:/ Users / HH / Desktop / R Data analystlist.files()## [1]“07-tidy-data.pdf”“demystifying.R”## [3 ]“demystifyingR2_v3.html”“demystifyingR2_v3.Rmd”## [5]“EDA_Course_Materials.zip”“lesson3_student.html”## [7]“lesson3_student.rmd”“pseudo_facebook.tsv”## [9]“reddit.csv “”stateData.csv“## [11]”tidy-data.pdfpf <-read.delim'pseudo_facebook.tsv'namepf)## [1]”userid“”age“## [3 ]“dob_day”“dob_year”## [5]“dob_month”“gender”## [7]“tenure”“friend_count”## [9]“friendships_initiated”“likes”## [11]“likes_received”“mobile_likes “## [13]”mobile_likes_received“”www_likes“## [15]”www_likes_received

用户生日直方图 

libraryggplot2qplotx = dob_daydata = pf)+ scale_x_continuousbreaks = 1:31)##`stat_bin()`using`bins = 30`。用`binwidth`选择更好的价值。

 ​

qplotx = dob_daydata = pf)+ scale_x_continuousbreaks = 1:31)+ facet_wrap(~dob_monthncol = 3)##`stat_bin()`使用`bins = 30`。用`binwidth`选择更好的价值。

  ​

朋友数

qplotfriend_countdata = pf)##`stat_bin()`使用`bins = 30`。用`binwidth`选择更好的价值。

  ​

qplotfriend_countdata = pf)+ scale_x_continuouslimits = c0,1000))##`stat_bin()`使用`bins = 30`。用`binwidth`选择更好的值。##警告:删除了包含非有限值(stat_bin)的2951行。

  ​

面对朋友数量

#你会添加什么代码来按性别创​​建直方图?#将它添加到下面的代码中.qplotx = friend_countdata = pfbinwidth = 10)+ scale_x_continuouslimits = c0,1000 ),break = seq0,1000,50))+ facet_wrap(〜sex性)##警告:删除了包含非有限值(stat_bin)的2951行。

 ​

qplotfriend_countdata = subsetpf,!is.nagender)),binwidth = 25)+ scale_x_continuouslimits = c0,1000),breaks = seq0,1000,50))+ facet_wrap(〜性别)##警告:删除了包含非有限值(stat_bin)的2949行。
tablepf $ gender)## ## female male ## 40254 58574by(pf $ friend_count,pf $ gender,summary)## pf $ gender:female ## Min。第一曲。中位数第3曲。最大。## 0 37 96 242 244 4923 ## --------------------------------------- - ---------------- ## pf $性别:男## Min。第一曲。中位数第3曲。最大。## 0 27 74 165 182 4917

谁有更多的朋友:男人还是女人? 

qplotx = tenuredata = pfbinwidth = 30color = I'black'),fill = I'#099DD9'))##警告:删除了包含非有限值(stat_bin)的2行。

qplotx = tenure / 365data = pfbinwidth = .25color = I'black'),fill = I'#F79420'))+ scale_x_continuousbreaks = seq1,7,1), limits = c0,7))##警告:删除了包含非有限值(stat_bin)的26行。

笔记:

qplotx = tenure / 365data = pfxlab ='使用FB的年数'ylab ='样本中的用户数'binwidth = .25color = I'black'),fill = I' #F79420'))+ scale_x_continuousbreaks = seq1,7,1),limits = c0,7))##警告:删除了包含非有限值(stat_bin)的26行。

 用户年龄

qplotx =年龄,数据= pfxlab ='用户年龄'ylab ='用户数'binwidth = 1color = I'black'),fill = I'#5760AB'))+ scale_x_continuous(断裂= SEQ1,113,5))

方块图

 ​

 调整代码以关注朋友数在0到1000之间的用户。




​非常感谢您阅读本文,有任何问题请在下面留言!

点击这里给我发消息

1

1


关于作者

Kaizong Ye是拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。



 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds