数据代码分享|R语言主成分(PCA)、主轴因子分析(PA)员工满意度调查数据可视化

在现代组织管理中,员工的满意度对于组织的运行和绩效起着至关重要的作用。

由Kaizong Ye,Weilong Zhang撰写

了解员工的满意度水平以及影响满意度的因素对于提高员工工作动力、维护组织稳定与发展具有重要意义。


为了深入探究员工满意度的内在结构和影响因素,本研究帮助客户采用了R语言中的主成分分析(PCA)和主轴因子分析(PA)对员工满意度调查数据进行了全面的统计分析。

本文所使用的数据集是一个包含多个变量的员工满意度调查数据,涵盖了员工对工作环境、薪酬福利、晋升机会、团队合作等方面的评价。


可下载资源


本文分析的数据和代码分享至会员群


我们将利用R语言中的PCA和PA方法,通过降维和因子分析技术,从大量的满意度变量中提取出主要的满意度维度和影响因素,以揭示员工满意度背后的结构和关联性。

× 1.原理不同 主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。 因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。就是要从数据中提取对变量起解释作用的少数公共因子(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系) 2.线性表示方向不同 主成分分析中则是把主成分表示成各变量的线性组合。因子分析是把变量表示成各公因子的线性组合3.假设条件不同 主成分分析:不需要有假设(assumptions), 因子分析:需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specificfactor)之间也不相关,共同因子和特殊因子之间也不相关。4.求解方法不同 求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法。 求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。5.主成分和因子的变化不同 主成分分析:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的; 因子分析:因子不是固定的,可以旋转得到不同的因子。6.因子数量与主成分的数量 主成分分析:主成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等),实际应用时会根据碎石图提取前几个主要的主成分。 因子分析:因子个数需要分析者指定(SPSS和sas根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同; 7.解释重点不同主成分分析:重点在于解释个变量的总方差, 因子分析:则把重点放在解释各变量之间的协方差。 8.算法上的不同主成分分析:协方差矩阵的对角元素是变量的方差; 因子分析:所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)9.优点不同主成分分析: 第一:如果仅仅想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析,不过一般情况下也可以使用因子分析; 第二:通过计算综合主成分函数得分,对客观经济现象进行科学评价; 第三:它在应用上侧重于信息贡献影响力综合评价。 第四:应用范围广,主成分分析不要求数据来自正态分布总体,其技术来源是矩阵运算的技术以及矩阵对角化和矩阵的谱分解技术,因而凡是涉及多维度问题,都可以应用主成分降维; 因子分析:对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据; 10.应用场景不同(几个常用组合)主成分分析:主成分分析+判别分析,适用于变量多而记录数不多的情况; 主成分分析+多元回归分析,主成分分析可以帮助判断是否存在共线性,并用于处理共线性问题; 主成分分析+聚类分析,不过这种组合因子分析可以更好的发挥优势。 因子分析: 首先,因子分析+多元回归分析,可以利用因子分析解决共线性问题; 其次,可以利用因子分析,寻找变量之间的潜在结构; 再次,因子分析+聚类分析,可以通过因子分析寻找聚类变量,从而简化聚类变量; 此外,因子分析还可以用于内在结构证实

通过PCA分析,我们将寻找能够最大程度解释满意度方差的主成分,并将其解释为新的维度,以帮助我们更好地理解员工满意度构成的要素。而通过PA分析,我们将识别关联性较高的满意度因子,进一步揭示不同满意度变量之间的内在关系。

本研究旨在对员工满意度调查数据进行全面分析,以提供有针对性的管理建议和决策支持。通过深入探索员工满意度的核心因素和相互作用,我们可以为组织管理者提供关于如何改善工作环境、提升员工福利待遇、优化晋升机制等方面的策略建议。


视频

因子分析简介及R语言应用实例

探索见解

去bilibili观看

探索更多视频


视频

主成分分析PCA降维方法和R语言分析葡萄酒可视化实例

探索见解

去bilibili观看

探索更多视频

员工满意度调查数据

每个变量代表的调查问卷问题和取值:

image.png

因子模型

先使用主成分模型确定因子数量

主成分模型princomp analysis

scores <- X %*% loadings[,1:2]
image.png

 

选择7个主成分后方差变化减小,因此选择7个因子进行分析

ctanal(x , factors = 7,scores = "Bartlett"
m1$loadings

主成分载荷

image.png
image.png

图片

R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标

阅读文章


主成分得分






an=m1$scores
image.png


随时关注您喜欢的主题


因子分析





print(fit, digits=2, cutoff=.3, sort=TRUE)
image.png

因子载荷





image.png
image.png

因子载荷图





load <- fit$loadings[,1:2]
image.png

主成分轴因子分析Principal Axis Factor Analysis

Principal Axis Factor Analysis(主成分轴因子分析)是一种统计方法,用于探索和解释观测数据中的潜在变量结构。

它是因子分析的一种变体。

在Principal Axis Factor Analysis中,我们通过将观测变量与潜在因子之间的相关性作为分析的基础来确定潜在因子。与传统的主成分分析不同,Principal Axis Factor Analysis不仅考虑了变量之间的共同方差,还考虑了变量之间的共同异质性。

在进行Principal Axis Factor Analysis时,我们首先计算出变量之间的相关矩阵。然后,我们使用特征值分解方法,将相关矩阵分解为特征值和特征向量。特征值表示了每个因子解释的方差比例,而特征向量表示了每个变量与因子之间的关系。

通过选择特征值大于1的因子,我们可以确定潜在因子的数量。然后,我们可以使用因子载荷矩阵来解释每个变量与每个因子之间的关系。

载荷值表示了变量与因子之间的相关性强度。

Principal Axis Factor Analysis可以帮助我们理解和解释数据中的潜在结构,并可以用于数据降维、变量选择和构建复合指标等应用。

fit <- faca(x, nfactors=7 )
image.png

image.png
image.png
image.png

使用eigen值来决定因子数量

ap <- parallel(subject=nrow(x),var=ncol(x),
1111.png
print(fit, digits=2, cutoff=.3, sort=TRUE)
image.png
image.png
image.png
plot(load ,type="n") # set up plot
image.png

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds