R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验

随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。

由Kaizong Ye,Coin Ge撰写

本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行了因子分析与聚类分析。


在研究中,我们首先对数据进行了处理和清洁,以确保数据的准确性和可靠性。然后,我们使用图示方法对数据进行了可视化,以便更好地理解数据的分布和关系。

本研究的结果将有助于客户更好地理解上市公司的财务状况和经营绩效,并为投资决策和风险管理提供有价值的参考。

分析脉络如下:

  • 数据预处理(包括缺失值,异常值,标准化这些)
  • 数据图示
  • 相关性检验正态性检验
  • 做因子分析和聚类分析
× 上市公司的绩效水平可以起到引导投资方向的作用,因此,对于上市企业经营绩效的研究显得尤为重要。国内外的学者从不同的角度对绩效评价的方法做了许多深入的研究,这些研究方法大致可以分为三种:第一种比较重视评价指标体系的构建,其中,朱华琳(2015)利用因子分析对指标进行降维处理,提炼评价因子来对公司能力进行评价 [1] 。徐占东(2015)把逐步回归和聚类分析结合在一起,将水平相近的银行归类,从而构建银行效率评价模型 [2] 。张若钦(2008)利用Malmquist指数分析法,对反映企业全要素生产力的指标变动情况进行分析,以此来评价企业的绩效水平 [3] 。胡燕京、冯琦(2006)根据企业多方面投入与产出的特点来构建数据包络分析(DEA)模型,测算出公司规模效益等指标来对公司绩效做出评价 [4] 。第二种比较注重指标的权重设置,徐蔼婷(2006)介绍了德尔菲(Delphi)方法在综合评价当中的应用以及指标体系归并的难点 [5] 。王伟(2016)利用熵权法和CRITIC法根据各个指标所给出的信息进行自动赋权,来消除指标体系的主观赋权影响 [6] 。第三种比较注重评价模型的构建,张先治、李琦(2012)验证了经济增加值(EVA)评价体系对与抑制企业过度投资行为的治理效应 [7] 。孙丽华(2013)用聚类分析和复相关分析对财务指标进行二次筛选,然后建立灰色关联模型进行绩效评价 [8] 。 参考文献: [1] 朱华琳. 我国寿险公司偿付能力监管指标的因子分析[J]. 统计与决策, 2015(2): 186-188. [2] 徐占东. 基于聚类分析的商业银行效率评价模型研究[J]. 统计与决策, 2015(4): 158-163. [3] 张若钦. 基于Malmquist指数的白酒类上市公司效率分析[J]. 时代经贸, 2008, 6(8): 21-22. [4] 胡燕京, 冯琦. 基于DEA的我国上市旅游企业经营绩效评价[J]. 华东经济管理, 2006, 20(9): 62-65. [5] 徐蔼婷. 德尔菲法的应用及其难点[J]. 中国统计, 2006(9): 57-59. [6] 王伟. 我国P2P网络借贷平台风险评价——基于熵权法和CRITIC法[J]. 金融理论与实践, 2016(12). [7] 张先治, 李琦. 基于EVA的业绩评价对央企过度投资行为影响的实证分析[J]. 当代财经, 2012(5): 119-128. [8] 孙丽华. 基于灰色关联模型的中国林业上市公司绩效评价研究[J]. 林业经济问题, 2013, 33(4): 283-288.

查看数据

image.png

视频

因子分析简介及R语言应用实例

探索见解

去bilibili观看

探索更多视频


视频

KMEANS均值聚类和层次聚类:R语言分析生活幸福质量系数可视化实例

探索见解

去bilibili观看

探索更多视频

读取到r软件中:

image.png

数据预处理(包括缺失值,异常值,标准化

首先,在进行数据分析前,需要对数据进行预处理。数据预处理包括缺失值的处理、异常值的排除、标准化处理等。另外,为了减少数据误差,需要对数据进行标准化处理。

data=na.omit(data)

标准化和可视化

其次,在数据处理完成后,需要对数据进行图示。通过绘制散点图等图示,可以直观地了解各项指标的数值分布和趋势变化。同时,图示也有助于发现数据中的异常点和趋势漂移等问题。

image.png
image.png

数据的标准化及适用性检验

然后,进行相关性检验和正态性检验等统计方法。相关性检验可以通过计算相关系数的方法来判断各项指标之间的联系程度。而正态性检验则可以通过绘制概率图、矩阵图等方法,来判断数据是否符合正态分布。通过这些检验方法,可以更准确地分析数据,并确定适当的分析方法。

相关性检验

image.png

图片

R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标

阅读文章


image.png


随时关注您喜欢的主题


正态性检验

shapiro.test(data[,2])
image.png

信度检验结果

信度检验结果是指对某种测量工具(例如问卷、测试等)进行信度检验后得到的结果。信度检验是一种评估测量工具稳定性和一致性的方法,通常使用统计学方法来计算测量工具的内部一致性或者重测信度。通过信度检验,可以确定测量工具的可靠性和准确性,从而确定测量结果的可信度。

信度检验结果可以帮助研究者评估测量工具的质量,以确保研究结果的可靠性和有效性。

image.png
image.png

KMO检验:

KMO检验是一种用于评估数据是否适合进行因子分析的统计方法。KMO(Kaiser-Meyer-Olkin)检验的主要目的是测量数据集中各个变量之间的相关性,以确定是否存在足够的共性方差,从而确定是否适合进行因子分析。KMO值介于0和1之间,通常认为KMO值大于0.6表示数据适合进行因子分析。如果KMO值低于0.6,则表明数据不适合进行因子分析,需要重新考虑数据收集和分析方法。


kmores=kmo(data\[,2:17])\ kmores\$overall
## [1] 0.5985173

因子分析和聚类分析

接下来,进行因子分析和聚类分析。因子分析旨在寻找出反映上市公司经营绩效的主要因素,并通过统计方法进行因素提取和旋转。而聚类分析则是将样本进行分类,以便于对不同类别的上市公司进行比较分析。

因子分析

因子分析是一种统计方法,用于确定多个变量之间的关系。它将一组相关变量分解为更少的未观察到的变量,称为因子,这些因子可以解释原始变量的方差。

因子分析可用于数据降维、变量选择和构建模型等应用。它在社会科学、市场研究和心理学等领域得到广泛应用。 image.png

image.png

旋转成份矩阵

image.png

因子得分排名

image.png

K-means聚类分析上市公司经营绩效

K-means聚类分析是一种常用的无监督学习方法,用于将一组数据分成K个不同的类别。该算法通过迭代的方式将数据点分配到不同的类别中,并且通过计算每个类别的中心点来更新类别的位置。K-means聚类分析的目标是最小化每个数据点到其所属类别中心点的距离平方和,从而使得每个类别内部的数据点尽可能的相似,不同类别之间的数据点尽可能的不同。该算法的优点是简单易懂,计算速度快,适用于大规模数据集的聚类分析。

在上市公司经营绩效的分析中,可以将公司的各项经营指标作为输入数据,通过K-means聚类算法将公司分成若干类别,同一类别内的公司具有相似的经营绩效表现。这样可以帮助投资者或经营者更好地了解市场上不同公司的经营状况,从而做出更明智的投资或经营决策。

memb <- hmod\$cluster

image.png

群集成员

cludata

image.png
image.png
plot(data[,2:17],mem

1111.png 综上所述,我国上市公司经营绩效实证研究涉及到数据预处理、图示、检验和分析等多个方面。其中,数据预处理和图示为分析提供了基础和依据,检验和分析则为研究提供了科学性和可靠性保障。通过本文的研究,可以更深入地了解上市公司经营绩效的相关因素,为政府部门和企业提供决策参考。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds