结构方程模型是一个线性模型框架，它对潜变量同时进行回归方程建模。

由Kaizong Ye，Liao Bao撰写

诸如线性回归、多元回归、路径分析、确认性因子分析和结构回归等模型都可以被认为是SEM的特例。在SEM中可能存在以下关系。

引言

观察到的变量与观察到的变量之间的关系（γ，如回归）。
潜变量与观察变量（λ，如确认性因子分析）。
潜变量与潜变量（γ,β，如结构回归）。

结构方程模型的初衷在于针对潜变量之间关系进行建模。例如，智商，情商，成功这三个潜变量之间到底是何种关系？但是它们三个本身不可直接测量，于是需要通过一定手段对它们进行测量。你当然可以先通过量表各自“估计”这三个潜变量，再建立三者间的模型。结构方程模型实现了这两步的一体化，优势在于，估计的过程中充分考虑了潜变量间的关系。而分开两步是不能做到的。当然这是否真的是优势有待商榷。

结构方程模型的估计方法主要有三类：第一种是协方差分析法，第二种是偏最小二乘法，第三种是贝叶斯法。

协方差分析认为，潜变量间的关系反映在可测变量的协方差关系中，由模型产生的协方差结构和真实协方差结构应一致（理想情况）。于是以协方差矩阵的差异作为优化准则。偏最小二乘的想法为：考虑潜变量结构的前提下，“最好”的潜变量应该与对应可测变量“最接近”。于是，其优化准则本质是OLS。贝叶斯也是对潜变量假定先验，然后用MCMC直接对潜变量进行抽样，既然潜变量的样本都有了，结构方程模型也就退化为了一堆回归。

国内很多文献把结构方程模型等同于上述第一种估计方法，这是一种误区。每一种方法都有各自的检验和评价手段。三种方法孰优孰劣？难以确定，只能说，各有各的优势和不足。另外，结构方程模型定位是验证性分析，这需要大量背景知识支撑，否则建模必然失败。

SEM独特地包含了测量和结构模型。测量模型将观测变量与潜变量联系起来，结构模型将潜变量与潜变量联系起来。

目前有多种软件处理SEM模型，包括Mplus、EQS、SAS PROC CALIS、Stata的sem和最近的R的lavaan。R的好处是它是开源的，可以免费使用，而且相对容易使用。

本文将介绍属于SEM框架的最常见的模型，包括

简单回归
多元回归
多变量回归
路径分析
确认性因素分析
结构回归

目的是在每个模型中介绍其

矩阵表述
路径图
lavaan语法
参数和输出

在这次训练结束时，你应该能够理解这些概念，足以正确识别模型，认识矩阵表述中的每个参数，并解释每个模型的输出。

可下载资源

完整程序、数据和文档（word）

成为新会员获取本文分析的智能体、数据、代码、报告

加入会员群

作者

Kaizong Ye
✉ 联系我们

最受欢迎的见解

1.R语言多元Logistic逻辑回归应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型分析案例

5.R语言混合效应逻辑回归Logistic模型分析肺癌

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

8.python用线性回归预测股票价格

9.R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

语法简介

语法一：f3~f1+f2（路径模型）

结构方程模型的路径部分可以看作是一个回归方程。而在R中，回归方程可以表示为y~ax1+bx2+c，“~”的左边的因变量，右边是自变量，“+”把多个自变量组合在一起。那么把y看作是内生潜变量，把x看作是外生潜变量，略去截距，就构成了语法一。

视频

偏最小二乘结构方程模型PLS-SEM分析白茶产业数字化对共同富裕的影响

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

视频

什么是结构方程建模SEM和R语言心理学和营销研究数据路径图可视化

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

语法二：f1 =~ item1 + item2 + item3（测量模型）

“=~”的左边是潜变量，右边是观测变量，整句理解为潜变量f1由观测变量item1、item2和item3表现。

语法三：item1 item1 , item1 item2

“~~”的两边相同，表示该变量的方差，不同的话表示两者的协方差

语法四：f1 ~ 1

表示截距

基础知识

加载数据

在这种情况下，我们将模拟数据。

y ~ .5*f  #有外部标准的回归强度


f =~ .8\*x1 + .8\*x2 + .8\*x3 + .8\*x4 + .8*x5  #定义因子f，在5个项目上的载荷。


x1 ~~ (1-.8^2)*x1 #残差。请注意，通过使用1平方的载荷，我们在每个指标中实现了1.0的总变异性（标准化的）。
......

#产生数据；注意，标准化的lv是默认的
simData 

#看一下数据
describe(simData)\[,1:4\]

R语言:结构方程模型、潜变量分析

阅读文章 ➜

指定模型

y ~ f # "~回归"
f =~ x1+ x2 + x3 + x4 + x5 # "=~被测量的是"
x1 ~~ x1 # 方差
x2 ~~ x2 #方差
x3~~x3 #变量
x4~~x4 #变量
x5~~x5 #变量
#x4~~x5将是协方差的一个例子

拟合模型

summary(model_m)

inspect(model_m)

Paths

随时关注您喜欢的主题

路径分析

与上述步骤相同，但主要侧重于回归路径。值得注意的是这种方法对调节分析的效用。

##加载数据
set.seed(1234)

Data <- data.frame(X = X, Y = Y, M = M)

指定模型

 # 直接效应
             Y ~ c*X #使用字符来命名回归路径
           # 调节变量
             M ~ a*X
             Y ~ b*M
           # 间接效应(a*b)
             ab := a*b #定义新参数
           # 总效应
             total := c + (a*b) #使用":="定义新参数

拟合模型

summary(model_m)

Paths(model)

间接效应的Bootstrapping置信区间

除了指定对5000个样本的标准误差进行bootstrapping外，下面的语法还指出标准误差应进行偏差校正（但不是accelearted）。

这种方法将产生与SPSS中的PROCESS宏程序类似的结果，即对标准误差进行偏差修正。

sem(medmodel,se = "bootstrap")

确认性因素分析

加载数据

我们将使用例子中的相同数据

指定模型

'
f =~ x1 + x2 + x3 +x4 + x5
x1~~x1
x2~~x2
x3~~x3
x4~~x4
x5~~x5
'

拟合模型

sem(fit, simData)

Paths(fit)

正如各模型的LRT所示，sem()和cfa()是具有相同默认值的软件包。CFA可以很容易地使用cfa()或sem()完成结构方程模型

anova

加载数据

在这种情况下，我将模拟数据。#结构成分y ~ .5*f1 + .7*f2 #用外部标准回归的强度#测量部分f1 =~ .8*x1 + .6*x2 + .7*x3 + .8*x4 + .75*x5 #定义因子f，在5个项目上的载荷。x1 ~~ (1-.8^2)*x1 #残差。注意，通过使用1平方的载荷，我们实现了每个指标的总变异性为1.0（标准化）。...#生成数据；注意，标准化的lv是默认的sim <- sim(tosim)#看一下数据describe(sim )

指定模型

测试正确的模型

#结构性y ~ f1+ f2#测量f1 =~ x1 + x2 + x3 + x4 + x5 f2 =~ x6 + x7

测试不正确的模型。假设我们错误地认为X4和X5负载于因子2。

incorrect#结构性y ~ f1+ f2#测量f1 =~ x1 + x2 + x3 f2 =~ x6 + x7 + x4 + x5

拟合模型

正确的模型

summary(model_m)

不正确的模型

summary(incorrectmodel_m, fit.measures = TRUE)

比较模型

正确模型

不正确模型

Paths(incorrec)

anova

除了不正确模型的整体拟合指数较差–如CFI<0.95，RMSEA>0.06，SRMR>0.08和Chi-square test<0.05所示，正确模型也优于不正确模型，如正确模型的AIC和BIC低得多所示。

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

在R语言中实现sem进行结构方程建模和路径图可视化

结构方程模型是一个线性模型框架，它对潜变量同时进行回归方程建模。

引言

语法简介

语法一：f3~f1+f2（路径模型）

语法二：f1 =~ item1 + item2 + item3（测量模型）

语法三：item1 item1 , item1 item2

语法四：f1 ~ 1

基础知识

加载数据

R语言:结构方程模型、潜变量分析

指定模型

拟合模型

随时关注您喜欢的主题

路径分析

指定模型

拟合模型

间接效应的Bootstrapping置信区间

这种方法将产生与SPSS中的PROCESS宏程序类似的结果，即对标准误差进行偏差修正。

确认性因素分析

加载数据

指定模型

拟合模型

正如各模型的LRT所示，sem()和cfa()是具有相同默认值的软件包。CFA可以很容易地使用cfa()或sem()完成结构方程模型

加载数据

指定模型

拟合模型

正确的模型

不正确的模型

比较模型

正确模型

不正确模型

相关文章

在R语言中实现sem进行结构方程建模和路径图可视化

结构方程模型是一个线性模型框架，它对潜变量同时进行回归方程建模。

引言

语法简介

语法一：f3~f1+f2（路径模型）

语法二：f1 =~ item1 + item2 + item3（测量模型）

语法三：item1 item1 , item1 item2

语法四：f1 ~ 1

基础知识

加载数据

R语言:结构方程模型、潜变量分析

指定模型

拟合模型

随时关注您喜欢的主题

路径分析

指定模型

拟合模型

间接效应的Bootstrapping置信区间

这种方法将产生与SPSS中的PROCESS宏程序类似的结果，即对标准误差进行偏差修正。

确认性因素分析

加载数据

指定模型

拟合模型

正如各模型的LRT所示，sem()和cfa()是具有相同默认值的软件包。CFA可以很容易地使用cfa()或sem()完成 结构方程模型

加载数据

指定模型

拟合模型

正确的模型

不正确的模型

比较模型

正确模型

不正确模型

相关文章

关注我们，永远不要错过任何见解。

正如各模型的LRT所示，sem()和cfa()是具有相同默认值的软件包。CFA可以很容易地使用cfa()或sem()完成结构方程模型