R语言逐步回归、方差anova分析电影市场调查问卷数据可视化

这是一份有关消费者对电影市场看法及建议的调查报告

由Kaizong Ye,Weilong Zhang撰写

我们采取了问卷调查法,其中发放问卷256份,回收有效问卷200份。

本次调查采用问卷调查法,共发放问卷256份,回收有效问卷200份,回收率为78.13%。问卷内容涵盖了消费者对电影市场的整体满意度、观影频率、电影类型偏好、票价接受度、影院服务评价等方面。


随着电影产业的快速发展,消费者对电影市场的需求和期望也在不断变化。为了深入了解消费者对当前电影市场的看法,以及他们对电影市场未来发展的建议,我们进行了本次问卷调查。我们对数据进行了基本分析,比如:相关性。还有基本图形、回归方差分析。最后模型比较。


image.png

读入数据

head(data)
image.png

视频

逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例

探索见解

去bilibili观看

探索更多视频

数据的描述

str(data)

数据一共有200个样本,25个属性。具体属性和取值及其含义如下:

image.png

 

数据展示

绘制各个变量的饼图可以看到基本人口信息的各个取值的所占的百分比。

QQ截图202211071216502.png
image.png

数据视角可视化分析豆瓣电影评分爬虫数据

阅读文章


数据准备

数据的清理

#数据清理

对缺失值(NA)的处理

data=na.omit(data)

 

#变量筛选

 colnames(data)

 

data=data[, -which(colnames(data) %in% c("填写时间","是否星标","提交后随机码" , "是否已


随时关注您喜欢的主题


数据分析

基本数据分析,比如:相关性。还有基本图形、回归方差分析。 最后模型比较。

数据检验

相关性

查看您对中国电影产业的发展建议和请问您看电影的主要目的是什么变量之间是否具有相关关系

image.png

检验的结果是,由于P =0.016<0.05,因此在0.05的显署性水平下,拒绝原假设,认为两者之间具有相关关系。

下面进行方差分析

m1<-aov(Q12.您一般通过什么途径购买电影票~Q9.请问您看电影的主要目的是什么,data=datacor)

image.png 

由于p值大于0.05,从这个结果可以看出看电影的不同目下购买电影股票的差别不显著。

image.png 由于p值小于0.05,从这个结果可以看出看电影的不同目下购买电影股票的差别不显著。

回归分析

image.png

从回归模型的结果来看,可以看到接受电影票价格区间对被调查对象考虑的电影外在因素有比较大的影响,p值小于0.05,因此该变量对被调查者选择去看电影有显著的影响 。

其次被调查者的年龄也有较明显的影响,可以年龄和被调查者去看电影有较大的负相关关系,因此可以认为年龄大的人会倾向于考虑的看电影各种外在因素。

plot(model)
image.png

从回归模型的残差结果图来看,残差比较均匀地分布在0线周围,和qq图周围,说明残差随机服从正态分布,因此,回归模型具有较好的效果。

模型的比较和讨论

模型筛选与比较,使用逐步回归进行模型筛选最优模型,然后和传统的回归模型进行比较。 删去不显著的变量.

image.png

进行变量删减后的回归模型,我们得到最优变量是被调查者接受的电影票价格区间,p值小于0.05,说明该变量对被调查者考虑的外在因素有显著的影响。

QQ截图202211071216503.png


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds