在R语言中实现sem进行结构方程建模和路径图可视化

结构方程模型是一个线性模型框架,它对潜变量同时进行回归方程建模。

 

由Kaizong Ye,Liao Bao撰写

诸如线性回归、多元回归、路径分析、确认性因子分析和结构回归等模型都可以被认为是SEM的特例。在SEM中可能存在以下关系。

引言

 

  • 观察到的变量与观察到的变量之间的关系(γ,如回归)。
  • 潜变量与观察变量(λ,如确认性因子分析)。
  • 潜变量与潜变量(γ,β,如结构回归)。
×

结构方程模型的初衷在于针对潜变量之间关系进行建模。例如,智商,情商,成功这三个潜变量之间到底是何种关系?但是它们三个本身不可直接测量,于是需要通过一定手段对它们进行测量。你当然可以先通过量表各自“估计”这三个潜变量,再建立三者间的模型。结构方程模型实现了这两步的一体化,优势在于,估计的过程中充分考虑了潜变量间的关系。而分开两步是不能做到的。当然这是否真的是优势有待商榷。

结构方程模型的估计方法主要有三类:第一种是协方差分析法,第二种是偏最小二乘法,第三种是贝叶斯法。

协方差分析认为,潜变量间的关系反映在可测变量的协方差关系中,由模型产生的协方差结构和真实协方差结构应一致(理想情况)。于是以协方差矩阵的差异作为优化准则。偏最小二乘的想法为:考虑潜变量结构的前提下,“最好”的潜变量应该与对应可测变量“最接近”。于是,其优化准则本质是OLS。贝叶斯也是对潜变量假定先验,然后用MCMC直接对潜变量进行抽样,既然潜变量的样本都有了,结构方程模型也就退化为了一堆回归。

国内很多文献把结构方程模型等同于上述第一种估计方法,这是一种误区。每一种方法都有各自的检验和评价手段。三种方法孰优孰劣?难以确定,只能说,各有各的优势和不足。另外,结构方程模型定位是验证性分析,这需要大量背景知识支撑,否则建模必然失败。


SEM独特地包含了测量和结构模型。测量模型将观测变量与潜变量联系起来,结构模型将潜变量与潜变量联系起来。

目前有多种软件处理SEM模型,包括Mplus、EQS、SAS PROC CALIS、Stata的sem和最近的R的lavaan。R的好处是它是开源的,可以免费使用,而且相对容易使用。

本文将介绍属于SEM框架的最常见的模型,包括

  • 简单回归
  • 多元回归
  • 多变量回归
  • 路径分析
  • 确认性因素分析
  • 结构回归

目的是在每个模型中介绍其

  • 矩阵表述
  • 路径图
  • lavaan语法
  • 参数和输出

在这次训练结束时,你应该能够理解这些概念,足以正确识别模型,认识矩阵表述中的每个参数,并解释每个模型的输出。

语法简介

语法一:f3~f1+f2(路径模型)

结构方程模型的路径部分可以看作是一个回归方程。而在R中,回归方程可以表示为y~ax1+bx2+c,“~”的左边的因变量,右边是自变量,“+”把多个自变量组合在一起。那么把y看作是内生潜变量,把x看作是外生潜变量,略去截距,就构成了语法一。

语法二:f1 =~ item1 + item2 + item3(测量模型)

“=~”的左边是潜变量,右边是观测变量,整句理解为潜变量f1由观测变量item1、item2和item3表现。

语法三:item1 item1 , item1 item2

“~~”的两边相同,表示该变量的方差,不同的话表示两者的协方差

语法四:f1 ~ 1

表示截距

基础知识

加载数据

在这种情况下,我们将模拟数据。


R语言:结构方程模型、潜变量分析

阅读文章


指定模型

拟合模型


随时关注您喜欢的主题


路径分析

与上述步骤相同,但主要侧重于回归路径。值得注意的是这种方法对调节分析的效用。

指定模型

拟合模型

间接效应的Bootstrapping置信区间

除了指定对5000个样本的标准误差进行bootstrapping外,下面的语法还指出标准误差应进行偏差校正(但不是accelearted)。

这种方法将产生与SPSS中的PROCESS宏程序类似的结果,即对标准误差进行偏差修正。

确认性因素分析

加载数据

我们将使用例子中的相同数据

指定模型

拟合模型

正如各模型的LRT所示,sem()和cfa()是具有相同默认值的软件包。CFA可以很容易地使用cfa()或sem()完成 结构方程模型

加载数据

在这种情况下,我将模拟数据。

  

指定模型

测试正确的模型

测试不正确的模型。假设我们错误地认为X4和X5负载于因子2。

拟合模型

正确的模型

不正确的模型

比较模型

正确模型

 不正确模型

除了不正确模型的整体拟合指数较差–如CFI<0.95,RMSEA>0.06,SRMR>0.08和Chi-square test<0.05所示,正确模型也优于不正确模型,如正确模型的AIC和BIC低得多所示。


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498