SPSS、Python员工满意度问卷调查激励保健理论研究:决策树、随机森林和AdaBoost|附代码数据

在深入了解公司当前的实际情况和员工内心真实想法的基础上,我们旨在从专业视角出发,为企业在组织管理方面的不足进行诊断,并进行全面审视。

由Kaizong Ye,Weilong Zhang撰写

为了更好地规划公司未来的发展方向,综合管理部特别组织了这次员工满意度调查。通过分析结果帮助我们通过图表直观展示了不同岗位、年龄段的员工满意度,并探究了影响满意度的多种因素。此外,我们还进行了信度检验,确保了问卷结果的可靠性,并应用了统计学方法对不同工龄和岗位的满意度进行了差异性分析。我们还基于激励保健理论,使用决策树、随机森林和AdaBoost模型对员工满意度进行了深入分析,并可视化了模型的结果和误差。

本研究在方法的运用、数据的处理以及结论的得出等方面,都进行了全面且深入的探讨。期望这一研究成果不仅能够为当前的学术讨论增添新的视角,也能够为那些在相似研究方向上摸索的人士提供有价值的思路和指引。

1.问卷概况 

问卷采用现场随机抽样方式发放,现场回收,问卷发放对象为有网上购物经历的受访者。问卷发放135份,回收135份,回收率100%。回收问卷中有效问卷135分,有效回收率100%

满意度问卷:



可下载资源


作者


本文分析的数据、代码、报告分享至会员群


问卷数据用手工录入,用Excel和SPSS工具进行分析。本分析报告是在分析结果的基础上撰写而成的。


探索性可视化

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 读取Excel文件
file_path = '/mnt/data/data.xlsx'
df = pd.read_excel(file_path)
# 检查数据的前几行以了解其结构
df.head()
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.font_manager import FontProperties
# 设置中文字体

视频

Boosting集成学习原理与R语言提升回归树BRT预测短鳍鳗分布生态学实例

探索见解

去bilibili观看

探索更多视频


视频

【视频讲解】CatBoost、LightGBM和随机森林的海域气田开发分类研究

探索见解

去bilibili观看

探索更多视频


视频

Python比赛讲解LightGBM、XGBoost+GPU和CatBoost预测学生在游戏学习过程表现

探索见解

去bilibili观看

探索更多视频


视频

从决策树到随机森林:R语言信用卡违约分析信贷数据实例

探索见解

去bilibili观看

探索更多视频


视频

决策树模型原理和R语言预测心脏病实例

探索见解

去bilibili观看

探索更多视频


视频

【讲解】ARIMA、XGBOOST、PROPHET和LSTM预测比特币价格

探索见解

去bilibili观看

探索更多视频


plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 准备数据
df.head()
# 基本可视化:条形图、饼图、散点图
# 条形图:展示不同岗位的平均满意度
plt.figure(figsize=(10, 6))
sns.barplot(x='岗位', y='满意度公式:\nsum(F2:O2)/50', data=df)
plt.title('不同岗位的平均满意度')
plt.xlabel('岗位')
plt.ylabel('平均满意度')
plt.show()
# 饼图:展示不同年龄组的比例
age_counts = df['年龄'].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(age_counts, labels=age_counts.index, autopct='%1.1f%%')
plt.title('不同年龄组的比例')
plt.show()
# 散点图:展示年龄与满意度的关系
plt.figure(figsize=(10, 6))
sns.scatterplot(x='年龄', y='满意度公式:\nsum(F2:O2)/50', data=df)
plt.title('年龄与满意度的关系')
plt.xlabel('年龄')
plt.ylabel('满意度')
plt.show()
# 将工龄转换为类别型数据,以便在散点图中使用不同的颜色
df['本企业工龄'] = df['本企业工龄'].astype('category')
# 绘制散点图,使用不同的颜色表示不同的工龄
plt.figure(figsize=(10, 6))
palette = {category: color for category, color in zip(df['本企业工龄'].cat.categories, colors)}
sns.scatterplot(x='年龄', y='满意度公式:\nsum(F2:O2)/50', hue='本企业工龄', data=df, palette=palette)
plt.title('年龄、工龄与满意度的关系')
plt.xlabel('年龄')
plt.ylabel('满意度')
plt.legend(title='工龄')
plt.show()
  1. 条形图:展示了不同岗位的平均满意度,每个岗位使用了不同的颜色。
  2. 饼图:显示了不同年龄组的比例,每个年龄组使用了不同的颜色。
  3. 散点图:揭示了年龄与满意度之间的关系,不同年龄组使用了不同的颜色。

2. 受访人群社会属性统计分析

2.1 年龄分析

              表2.1年龄构成

年龄平均值项:满意度年龄平均值项:满意度年龄
35-50岁76.00%35-50岁76.00%35-50岁
35岁-50岁81.21%35岁-50岁81.21%35岁-50岁
35岁以下77.48%35岁以下77.48%35岁以下
50岁以上90.00%50岁以上90.00%50岁以上
年龄平均值项:满意度年龄平均值项:满意度年龄
35-50岁76.00%35-50岁76.00%35-50岁

图2.1 年龄构成

 

受访者的年龄在35岁以下的占69%,35-50岁以下占21% 。由此可见,受访员工主要以中青年为主。

受访者的年龄在35岁以下的占69%,35-50岁以下占21% 。由此可见,受访员工主要以中青年为主。


3. 受访员工指标单因素分析

3.1 职位分析

                     表3.1 职位构成

行标签计数项:人数
员工70
主管41
助理经理及以上23
总计134

按职位统计,人数最多的是“员工”占52%,其次为“主管”占31% 。


过采样SMOTE逻辑回归、SVM、随机森林、AdaBoost和XGBoost对不平衡数据分析预测

阅读文章



3.3 工龄分析

              表3.3工龄构成

行标签计数项:人数
1-3年48
1年以下58
3年以上27

按工龄统计,受访人群人数最多的是“15-20万元”组,其次为“10-15万元”组。这两组人数合计占总人数的51.7%。说明岗位满意度人群以收入偏高人群为主。


随时关注您喜欢的主题



3.4 职位分析

              表3.4工龄构成

行标签计数项:人数
1-3年48
1年以下58
3年以上27

按工龄统计,受访人群人数最多的是“15-20万元”组,其次为“10-15万元”组。这两组人数合计占总人数的51.7%。说明岗位满意度人群以收入偏高人群为主。

3.5 问卷的信度检验

以上分析的问题1-9都属于问卷的客观性问题,下面开始对问卷的主观性问题10-15进行分析。在分析主观性问题以前,需要对问卷的主观性问题用Cronbach’s α信度系数进行信度检验。

1. 首先介绍用手工方式计算Cronbach’s α信度系数。用Excel“数据分析”中的“协方差”工具或者用Excel协方差函数COVAR(var1,var2) 计算问题10-问题15数据的协方差,计算结果如下表:

案例处理汇总
N%
案例有效13299.2
已排除a1.8
总计133100.0
a. 在此程序中基于所有变量的列表方式删除。
可靠性统计量
Cronbach’s Alpha项数
.73611

其中对角线上的数值是每个问题数据的方差。

6 满意度认知分析

       表3.6 满意度认知频数

年龄平均值项:满意度
35-50岁76.00%
35岁-50岁81.21%
35岁以下77.48%
50岁以上90.00%

图3.6 满意度认知频数

 35-50岁员工认为工作满意的占76%。  50岁以上员工认为工作满意的占90%。 。说明大部分网满意员工是老员工,因此选择留在公司。

3.7 满意度岗位分析

       表3.7 岗位满意度最大风险来源均值统计

年龄平均值项:满意度
员工76.34%
主管78.98%
助理经理及以上82.61%

图3.7岗位满意度 条形图

助理经理及以上员工认为工作满意的占82.61%。员工认为工作满意的占76.34%%。 。说明大部分网满意员工是高级别职位的员工,同时他们有较高的权利,因此职位满意感也较高。

4. 受访员工多因素交叉分析

4.1 不同年龄人群岗位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的岗位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.1 不同年龄人群岗位满意度比较

岗位年龄交叉制表
百分比
年龄合计
35-50岁35岁-50岁35岁以下50岁以上
岗位保洁1.43.311.1.116.0
工程1.12.58.3.112.0
管理2.15.016.7.224.0
客服6.815.952.7.676.0
绿化.1.2.7.01.0
秩序.41.03.5.05.0
合计12.028.093.01.0134.0

图4.1 不同年龄受访员工次数百分比柱形图

不同年龄受访员工次数百分比柱形图更能说明两者满意度的差异。从结果来看,客服中满意度最高的是35岁以下员工。而工程岗位中,满意度最高的是35-50岁员工,说明不同岗位和不同年龄段的员工的满意度是有差异的。

4.2 不同年龄人群职位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的职位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.2 不同年龄人群职位满意度比较

年龄交叉制表
年龄合计
35-50岁35岁-50岁35岁以下50岁以上
职  位员工期望的计数6.314.648.6.570.0
职  位 中的 %1.4%1.4%97.1%.0%100.0%
主管期望的计数3.78.628.5.341.0
职  位 中的 %22.0%39.0%36.6%2.4%100.0%
助理经理及以上期望的计数2.14.816.0.223.0
职  位 中的 %8.7%47.8%43.5%.0%100.0%
合计期望的计数12.028.093.01.0134.0
职  位 中的 %9.0%20.9%69.4%.7%100.0%

图4.2 不同年龄受访员工次数百分比柱形图

不同年龄受访员工次数百分比柱形图更能说明两者满意度的差异。从结果来看, 满意度最高的是35岁以下员工。而主管职位中,满意度最高的是35-50岁员工,说明不同职位和不同年龄段的员工的满意度是有差异的。

4.3 不同工龄人群职位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的职位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.3 不同工龄人群职位满意度比较

本企业工龄交叉制表
本企业工龄合计
1-3年1年以下3年以上
职  位员工期望的计数25.630.314.170.0
职  位 中的 %30.0%70.0%.0%100.0%
主管期望的计数15.017.78.341.0
职  位 中的 %43.9%14.6%41.5%100.0%
助理经理及以上期望的计数8.410.04.623.0
职  位 中的 %43.5%13.0%43.5%100.0%
合计期望的计数49.058.027.0134.0
职  位 中的 %36.6%43.3%20.1%100.0%

图4.3 不同工龄人群职位满意度百分比柱形图

不同工龄人群职位满意度百分比柱形图更能说明两者满意度的差异。从结果来看, 满意度最高的是1年以下员工。而主管职位中,满意度最高的是1-3年员工,说明不同职位和不同年龄段的员工的满意度是有差异的。

4.4 不同工龄人群岗位满意度比较分析

由于不同工龄的人数不同,分析不同年龄人群的职位满意度,以每一种年龄人数总数为100%进行统计比较合适。

       表4.4 不同工龄人群岗位满意度比较

岗位本企业工龄交叉制表
本企业工龄合计
1-3年1年以下3年以上
岗位保洁期望的计数5.96.93.216.0
岗位 中的 %50.0%12.5%37.5%100.0%
工程期望的计数4.45.22.412.0
岗位 中的 %41.7%8.3%50.0%100.0%
管理期望的计数8.810.44.824.0
岗位 中的 %29.2%25.0%45.8%100.0%
客服期望的计数27.832.915.376.0
岗位 中的 %32.9%64.5%2.6%100.0%
绿化期望的计数.4.4.21.0
岗位 中的 %.0%.0%100.0%100.0%
秩序期望的计数1.82.21.05.0
岗位 中的 %80.0%.0%20.0%100.0%
合计期望的计数49.058.027.0134.0
岗位 中的 %36.6%43.3%20.1%100.0%

图4.4 不同工龄人群岗位满意度比较 百分比柱形图

不不同工龄人群岗位满意度比较百分比柱形图更能说明两者满意度的差异。从结果来看, 满意度最高的是1年以下的客服员工。而管理职位中,满意度最高的是3年以上工龄员工,说明不同职位和不同年龄段的员工的满意度是有差异的。

5. 不同人群满意度差异分析

不同工龄满意度是否有显著性差异,不同收入的人群满意度是否有显著性差异,这些都是值得研究的问题。根据本次问卷调查的数据,采用统计学假设检验的方法,分别对不同工龄满意度做以下假设检验。

利用以上数据,分别对不同工龄满意度次数进行以下假设检验:

5.1 不同工龄满意度次数的假设检验。

利用数据透视表工具,可以得到不同年龄满意度次数的以下统计数据:

案例处理摘要
案例
已包含已排除总计
N百分比N百分比N百分比
满意度公式:sum(F2:O2)/50  * 本企业工龄13575.4%4424.6%179100.0%
报告
满意度公式:sum(F2:O2)/50
本企业工龄均值N标准差
18:46:25.4331.
1-3年18:24:58.776492:54:03.886
1年以下18:40:13.241583:12:31.892
3年以上19:38:40.000273:14:20.193
总计18:46:25.4331353:06:14.139
ANOVA a
平方和df均方F显著性
满意度公式:sum(F2:O2)/50 * 本企业工龄组间(组合)3.544E831.181E8.945.421
组内1.638E101311.250E8
总计1.673E10134
a. 分组变量 本企业工龄 是字符串,因此无法计算线性检验。
相关性度量
EtaEta 方
满意度公式:sum(F2:O2)/50 * 本企业工龄.146.021

原假设H0:不同工龄满意度无差别

备选假设H1:不同工龄满意度有差别

这是一个两样本均值左尾t检验。

  由于t>左临界值,没有落入拒绝域,因此接受原假设,接受备选假设。即不同工龄满意度是没有显著性差别的。

5.2 不同工龄人群满意度的方差分析

利用spss进行方差分析:

ANOVA
满意度公式:sum(F2:O2)/50
平方和df均方F显著性
组间5.849E951.170E913.865.000
组内1.088E101298.436E7
总数1.673E10134

由于F>F crit,五个不同工龄组的受访员工的满意度有显著性差异。

5.3 不同岗位人群满意度的方差分析

利用spss进行方差分析:

ANOVA
满意度公式:
sum(F2:O2)/50
平方和df均方F显著性
组间1.064E1042.659E956.287.000
组内6.094E91294.724E7
总数1.673E10133

由于F>F crit,五个不同岗位组的受访员工的满意度有显著性差异。

6.激励保健理论分析 

首先,我将基于激励保健理论分析该公司员工的满意度数据。激励保健理论主要关注两个方面:激励因素和保健因素。激励因素是促使员工满意和激励的工作因素,如成就、认可和工作本身的挑战性。保健因素是防止员工不满意的工作因素,如公司政策和管理、薪酬、工作条件和同事关系。

我将使用数据分析方法来探索这些因素与员工满意度之间的关系。然后,我将可视化模型的结果和误差,并输出模型参数。

尝试使用数据中的其他相关列来分析员工满意度。例如,我可以探索员工的年龄、工龄、岗位等因素与满意度之间的关系。 

可视化了结果:

  1. PCA结果:展示了数据的主成分分析结果。每个点代表一个样本,其在图中的位置由两个主成分决定。颜色表示满意度得分。
  2. 模型误差:展示了决策树模型的预测误差。每个点代表一个样本,其在图中的位置由实际满意度得分和预测误差决定。

随机森林、决策树和AdaBoost模型

使用随机森林、决策树和AdaBoost模型对数据进行分析。然后,我将可视化这些模型的结果和误差,并输出模型参数。

树状图和变量重要度

现在,我已经成功地训练了随机森林、决策树和AdaBoost模型,并生成了所需的图表:

  1. 第一个图表展示了决策树模型的树状图。
  2. 第二个图表展示了特征的重要性,这里仅展示了前10个特征的重要性。

根据提供的两个图像:

  1. 特征重要性图表(随机森林模型):
    • 这个图表展示了在随机森林模型中,不同特征对预测员工满意度的重要性。特征重要性是通过评估每个特征在模型中的预测能力来确定的,通常通过减少模型精度来衡量特征的缺失对预测结果的影响。
    • 图表中的条形可能表示了不同特征的重要性得分。得分越高,特征在预测满意度时的重要性越大。
    • 例如,如果“岗位”特征在图表中具有较高的重要性得分,这表明它在决定员工满意度方面起着关键作用。
  2. 决策树模型:
    • 决策树模型通过一系列的问题将数据分割成不同的组,以便预测员工的满意度。每个节点代表一个特征的分割点,而每个叶节点代表最终的预测结果。
    • 根据提供的图像,我们可以看到“岗位_客服”、“职位_主管”和“职位_助理经理及以上”是决策树中用于预测满意度的关键特征。
    • 例如,“岗位_客服”的Gini指数为0.499,表示在这个节点上,数据集的不纯度较高,意味着客服岗位的员工满意度可能比较混合。而“职位_主管”和“职位_助理经理及以上”的Gini指数较低,表明这些特征能够提供更清晰的分割,使得预测结果更为准确。

结合两个模型的分析,我们可以得出以下结论:

  • 岗位类型(如客服、管理、技术等)对员工满意度有显著影响。特别是客服岗位,可能需要更多的关注来提高员工满意度。
  • 职位级别(如主管、助理经理及以上)也是影响满意度的一个重要因素。高级职位的员工可能因为更多的职责和权力而感到更满意。
  • 随机森林模型可能揭示了多个特征的相对重要性,而决策树则展示了如何通过这些特征的特定阈值来做出预测。

最终,这些分析结果可以帮助公司了解哪些因素对员工满意度最为关键,并据此制定相应的人力资源策略和改善措施。

7. 本次受访员工问卷调查的总结和回顾

本次受访员工问卷调查获取了受访人群基本信息、受访人群受访员工的主要指标,分析了年龄因素、岗位因素、岗位级别因素对岗位满意度行为的影响,并重点测试了这些因素的变化如何影响他们对满意度的认识,得到了一系列有意义的结论。本次问卷调查基本上实现了预定的目标。

本次问卷调查也有一些问题,需要进一步改进。

1. 问卷数量只有135份,数量还不够大,导致交叉分析时每一种组合的样本数比较少,结论带有偶然性。如果需要进一步分析,需要进行更大规模的问卷调查,使得结论更加具有科学性和稳定性。

2. 根据本次问卷调查获取的数据,还可以进行更多的统计分析,例如不同年龄满意度的差异和比较分析等,由于时间关系没有进一步展开。

3. 问卷的设计还有不足。如果在问卷中设计更多的定比变量,以便对这些变量进行求和、平均值等交叉统计,调查的统计方法会更多样,结论会更丰富。

参考文献

[1]潘思宇,杨丽君.中小企业员工信任关系如何改善[J].人力资源.2020,(16).
[2]梁青青.弹性福利优化与员工满意度提升研究[J].技术经济与管理研究.2019,(2).DOI:10.3969/j.issn.1004-292X.2019.02.020 .
[3]马云骁,汪泽宇,余丽霞.宏观审慎政策背景下商业银行防范风险的对策研究[J].现代经济信息.2019,(22).
[4]刘进,冼灿玲,刘承恺,等.产业升级背景下制造企业员工离职倾向的影响因素分析[J].当代经济.2019,(7).DOI:1


每日分享最新报告和数据资料至会员群

关于会员群

  • 会员群主要以数据研究、报告分享、数据工具讨论为主;
  • 加入后免费阅读、下载相关数据内容,并同步海内外优质数据文档;
  • 老用户可九折续费。
  • 提供报告PDF代找服务

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498