最近我们被客户要求撰写关于Rasch的研究报告。几个月以来，我一直对序数回归与项目响应理论（IRT）之间的关系感兴趣。

由Kaizong Ye，Liao Bao撰写

在教育测量与评估的前沿领域，精准评估学生的能力水平始终是核心目标之一。这不仅关乎对学生个体学习成果的客观评价，更对教学策略的优化、课程体系的完善起着关键的导向作用。传统的教育评估方法，如基于总分的排名或简单的等级划分，往往忽略了试题难度的异质性以及学生能力的潜在分布特征，难以全面、准确地刻画学生的真实能力。

Rasch 模型，作为项目反应理论（IRT）中的经典模型，为解决这一难题提供了强有力的工具。它基于坚实的数学理论基础，通过构建学生能力与试题难度之间的概率关系模型，能够将学生的能力和试题的难度置于同一度量尺度上进行分析。这使得我们可以在考虑试题难度的情况下，更精确地估计学生的能力水平，同时也能对试题的质量进行科学评估。

最近，我花了点时间尝试理解不同的估算方法。三种最常见的估算方法是：

可下载资源

完整程序、数据和文档（word）

本文分析的智能体、数据、代码、报告分享至会员群

加入会员群

作者

Kaizong Ye
✉ 联系我们

联合最大似然（JML）
条件逻辑回归，在文献中称为条件最大似然（CML）。
标准多级模型，在测量文献中称为边际最大似然（MML）。

阅读后，我决定尝试进行Rasch分析，产生多个Rasch输出。

范例

需要ggplot2和dplyr才能创建图表。

library(Epi) # 用于带对比的条件逻辑回归
library(lme4) # glmer
library(ggplot2) # 用于绘图
 
library(dplyr) # 用于数据操作

× IRT理论即项目反应理论(Item Response Theory, IRT)，又称题目反应理论、潜在特质理论（Item Response Theory）是一系列心理统计学模型的总称。IRT是用来分析考试成绩或者问卷调查数据的数学模型。这些模型的目标是来确定潜在的心理特征(latent trait）是否可以通过测试题被反应出来，以及测试题和被测试者之间的互动关系。广泛应用在心理和教育测量领域。

数据。

raschdat1 <- as.data.frame(raschdat)

CML估算

res.rasch <- RM(raschdat1)

系数。

coef(res.rasch)
 
beta V1      beta V2      beta V3      beta V4      beta V5
1.565269700  0.051171719  0.782190094 -0.650231958 -1.300578876
beta V6      beta V7      beta V8      beta V9     beta V10
0.099296282  0.681696827  0.731734160  0.533662275 -1.107727126
beta V11     beta V12     beta V13     beta V14     beta V15
-0.650231959  0.387903893 -1.511191830 -2.116116897  0.339649394
beta V16     beta V17     beta V18     beta V19     beta V20
-0.597111141  0.339649397 -0.093927362 -0.758721132  0.681696827
beta V21     beta V22     beta V23     beta V24     beta V25
0.936549373  0.989173502  0.681696830  0.002949605 -0.814227487
beta V26     beta V27     beta V28     beta V29     beta V30
1.207133468 -0.093927362 -0.290443234 -0.758721133  0.731734150

视频

逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

使用回归

raschdat1.long$tot <- rowSums(raschdat1.long) # 创建总分
c(min(raschdat1.long$tot), max(raschdat1.long$tot)) #最小和最大分数
 
[1]  1 26
 
raschdat1.long$ID <- 1:nrow(raschdat1.long) #创建ID
raschdat1.long <- tidyr::gather(raschdat1.long, item, value, V1:V30) # 宽数据转换为长数据
# 转换因子类型
raschdat1.long$item <- factor(
  raschdat1.long$item, levels = p

条件最大似然


 
# 回归系数
 
 
item1        item2        item3        item4        item5
0.051193209  0.782190560 -0.650241362 -1.300616876  0.099314453
item6        item7        item8        item9       item10
0.681691285  0.731731557  0.533651426 -1.107743224 -0.650241362
item11       item12       item13       item14       item15
0.387896763 -1.511178125 -2.116137610  0.339645555 -0.597120333
item16       item17       item18       item19       item20
0.339645555 -0.093902568 -0.758728000  0.681691285  0.936556599
item21       item22       item23       item24       item25
0.989181510  0.681691285  0.002973418 -0.814232531  1.207139323
item26       item27       item28       item29        
-0.093902568 -0.290430680 -0.758728000  0.731731557

请注意，item1是V2而不是V1，item29是V30。要获得第一个题目V1的难易程度，只需将题目1到题目29的系数求和，然后乘以-1。

res.clogis$n
 
[1] 3000

显然，所有数据（30 * 100）都用于估算。这是因为没有一个参与者在所有问题上都得分为零，在所有问题上都得分为1（最低为1，最高为30分中的26分）。所有数据都有助于估计，因此本示例中的方差估计是有效的。

联合极大似然估计

# 标准逻辑回归，请注意使用对比
res.jml 
# 前三十个系数
 
 
(Intercept)        item1        item2        item3        item4
-3.688301292  0.052618523  0.811203577 -0.674538589 -1.348580496
      item5        item6        item7        item8        item9
0.102524596  0.706839644  0.758800752  0.553154545 -1.148683041
     item10       item11       item12       item13       item14
-0.674538589  0.401891360 -1.566821260 -2.193640539  0.351826379
     item15       item16       item17       item18       item19
-0.619482689  0.351826379 -0.097839229 -0.786973625  0.706839644
     item20       item21       item22       item23       item24
0.971562267  1.026247034  0.706839644  0.002613624 -0.844497142
     item25       item26       item27       item28       item29
1.252837340 -0.097839229 -0.301589647 -0.786973625  0.758800752

item29与V30相同。差异是由估算方法的差异引起的。要获得第一个问题V1的难易程度，只需将问题1到问题29的系数求和，然后乘以-1。

sum(coef(res.j
 
[1] 1.625572

多层次逻辑回归或MML

我希望回归系数是问题到达时的难易程度，glmmTMB()不提供对比选项。我要做的是运行glmer()两次，将第一次运行的固定效果和随机效果作为第二次运行的起始值。

使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM

阅读文章 >

使用多层次模型复制Rasch结果

提供个体-问题映射：

plotPImap(res.rasch)

想了解更多关于模型定制、咨询辅导的信息？

✉

联系我们

要创建此图，我们需要问题难度（回归系数* -1）和个体能力（随机截距）。

极端的分数是不同的。这归因于MML的差异。由于CML不提供人为因素，因此必须使用两步排序过程。

问题特征曲线

问题特征曲线：

plotjointICC(res.rasch)

在这里，我们需要能够根据学生的潜能来预测学生正确答题的概率。我所做的是使用逻辑方程式预测概率。获得该数值，就很容易计算预测概率。由于我使用循环来执行此操作，因此我还要计算问题信息，该信息是预测概率乘以1-预测概率。

随时关注您喜欢的主题

 
## GGPLOT可视化
ggplot(test.info.df, aes(x = theta, y = prob, colour = reorder(item, diff, mean))) +
  geom_line() +ct response", colour = "Item",

下面将逐项绘制

ggplot(test.info.df, aes(x = theta, y = prob)) + geom_line() +
  scale_x_continuous(breaks = seq(-6, 6, 2), limits = c(-4, 4)) +
  scale_y_continuous(labels = percent, breaks = seq(0, 1, .

个体参数图

plot(person.parameter(res.rasch))

我们需要估计的个体能力：

ggplot(raschdat1.long, aes(x = tot, y = ability)) +
  geom_point(shap
  scale_y_continuous(breaks = round(c(long$ability)), 2)) +
  labs(x = "Raw s+
  theme_classic()

问题均方拟合

对于infit MSQ，执行相同的计算。

eRm：


ggplot(item.fit.df, aes(x = mml, y = cml)) +us(breaks = seq(0, 2, .1)) +
  geom_point(shape = 1) + geom_abline(slope = 1) + theme_classic() od, ncol = 2) +
  labs(x = "glmer (MML)