R语言稀疏主成分分析SparsePCA、因子分析、KMO和Bartlett球度检验分析上市公司财务指标数据

R中的主成分分析(PCA)和因子分析是统计分析技术,也称为多元分析技术。

由Kaizong Ye,Liao Bao撰写

当可用的数据有太多的变量无法进行分析时,主成分分析(PCA)和因子分析在R中最有用,它们在不损害他们所传达的信息的情况下减少了需要分析的变量的数量。

我们和一位客户讨论过如何在R软件中实现稀疏主成分分析。

稀疏主成分分析会把主成分系数(构成主成分时每个变量前面的系数)变的稀疏,也即是把大多数系数都变成零,通过这样一种方式,我们就可以把主成分的主要的部分凸现出来,这样主成分就会变得较为容易解释。

上市公司财务分析指标数据

image.png

KMO检验和Bartlett球度检验

KMO检验

kmo = function( data ){
  
  library(MASS)
  X <- cor(as.matrix(data))
  iX <- ginv(X)
  S2 <- diag(diag((iX^-1)))
  AIS <- S2%*%iX%*%S2                   
image.png

视频

主成分分析PCA降维方法和R语言分析葡萄酒可视化实例

探索见解

去bilibili观看

探索更多视频

Bartlett球形检验:

bartlett(cor(data[,3:(ncol(data)-1)]
image.png

相关性检验

输出相关系数矩阵

cor(data[,3:(ncol(data) )])
image.png

R语言泊松Poisson回归模型分析案例

阅读文章


绘制变量两两相关散点图

image.png


随时关注您喜欢的主题


稀疏主成分分析

 
library(MASS)
set.seed(1)
 #稀疏主成分分析建模
 
nspc <- nsprc(data[,3:
image.png

主成分载荷

image.png

绘制前两个主成分的载荷图

plot(load ) # set up plot 
text(load,labels=names(mydata),ce
image.png

因子分析

library(psych)
parallel
image.png

并行分析表明,因子数=8。

fit <- fa(r=cor
image.png

因子载荷

image.png

绘制前两个因子载荷

image.png

绘制因子载荷矩阵

因子分析或主成分分析的结果用每个因子上的主要载荷来初步解释。这些结构可以用载荷表表示,也可以用图形表示,其中所有具有绝对值>某个切点的载荷都表示为边(路径)。

以chat为基地.png


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds