最近我们被客户要求撰写关于IDI，NRI指标的研究报告。

由Kaizong Ye，Qing Li撰写

本文展示了R语言如何在生存分析与Cox回归中计算IDI，NRI指标的例子。

生存分析是一种统计学方法，用于研究特定事件发生的时间。

它主要用于分析生存时间数据，即从某个起始事件到特定终点事件发生所经历的时间。

例如，在医学研究中，生存分析可以用来研究患者从确诊某种疾病到死亡、复发或病情缓解等事件所经历的时间；在工程领域，可用于分析设备从开始使用到出现故障的时间。

生存分析中常用的方法包括 Kaplan-Meier 估计、Cox 比例风险模型等。

可下载资源

完整程序、数据和文档（word）

本文分析的智能体、数据、代码、报告分享至会员群

加入会员群

作者

Qing Li
✉ 联系我们

IDI（Integrated Discrimination Improvement）即综合判别改善指数，用于衡量新模型相比旧模型在区分不同风险人群方面的改善程度。

NRI（Net Reclassification Improvement）即净重新分类改善指数，用于评估新模型对个体重新分类的准确性改善情况。

读取样本数据

D=subset(pbc, select=c("time","status","age","albumin","edema","protime","bili"))
D$status=as.numeric(D$status==2)
D=D[!is.na(apply(D,1,mean)),] ; dim(D)

在诊断试验中，我们比较两个模型的优劣时，除了可以比较两个模型ROC曲线下面积外，还可以用定量的指标来比较一个模型比另外一个模型诊断准确率改进的程度。NRI（Net Reclassification Improvement，重分类改善指标），NRI定量地表示一个指标在某界值下的诊断准确率比另一指标准确率提高多少，容易理解，也比较容易计算。缺点是只考虑了界值时的情况，同时另外一个指标可以弥补这个不足，即IDI。

IDI（Integrated Discrimination Improvement，综合判别改善指数）也是Pencina等人于2008年提出的，它使用模型（或指标）对每个个体的预测概率计算得到，计算方法为：

P1,events和P2,events为金标准阳性的所有研究对象在模型1和模型2中诊断为阳性的平均概率，P1,noevents和P2,noevents为金标准阴性的所有研究对象在模型1和模型2中诊断为阳性的平均概率。公式前半部分为金标准阳性（患者）中，计算每个个体的模型1的预测概率与模型2的预测概率之差，再计算所有差的平均数，此平均值越大，认为模型1较好；公式后半部分为金标准阴性（非患者）中，计算每个个体的模型1的预测概率与模型2的预测概率之差，再计算所有差的平均数，此平均值越小，认为模型1较好；因此总体来说，IDI越大，认为模型1越好。IDI的检验思想与AUC类似，分别考虑了不同界值下指标的整体情况，可以代表指标（模型）的整体改善情况。

NRI和IDI的应用定量地解决了两个模型诊断效能比较的问题，可以定量评价一个指标比另外一个指标诊断效能改善情况。NRI和IDI两个指标可以形象地展示研究对象被正确重新分类（判别）的比例，易于理解，也逐渐被研究者接受。在卫生经济学评价中两个指标的应用价值更高，NRI和IDI可以比较容易计算成本效益，是传统指标不具备的功能，预计将会广泛用于卫生经济学研究中。

参考文献

[1] Pencina M J, D’Agostino R S, D’Agostino RJ, et al. Evaluating the added predictive ability of a new marker: from areaunder the ROC curve to reclassificationand beyond.

[2] Kerr K F, Mcclelland R L, Brown E R, etal. Evaluating the incremental value of new biomarkers with integrateddiscrimination improvement.

## [1] 416   7

查询部分数据（结果和预测因子）

head(D)

视频

R语言生存分析Survival analysis原理与晚期肺癌患者分析案例

探索见解 ➜

去bilibili观看 ➜

探索更多视频 ➜

##   time status      age albumin edema protime bili
## 1  400      1 58.76523    2.60   1.0    12.2 14.5
## 2 4500      0 56.44627    4.14   0.0    10.6  1.1
## 3 1012      1 70.07255    3.48   0.5    12.0  1.4
## 4 1925      1 54.74059    2.54   0.5    10.3  1.8
## 5 1504      0 38.10541    3.53   0.0    10.9  3.4
## 6 2503      1 66.25873    3.98   0.0    11.0  0.8

模型0和模型1的结果数据和预测变量集

outcome=D[,c(1,2)]
covs1<-as.matrix(D[,c(-1,-2)])
covs0<-as.matrix(D[,c(-1,-2, -7)])

head(outcome)

##   time status
## 1  400      1
## 2 4500      0
## 3 1012      1
## 4 1925      1
## 5 1504      0
## 6 2503      1

head(covs0)

##        age albumin edema protime
## 1 58.76523    2.60   1.0    12.2
## 2 56.44627    4.14   0.0    10.6
## 3 70.07255    3.48   0.5    12.0
## 4 54.74059    2.54   0.5    10.3
## 5 38.10541    3.53   0.0    10.9
## 6 66.25873    3.98   0.0    11.0

head(covs1)

##        age albumin edema protime bili
## 1 58.76523    2.60   1.0    12.2 14.5
## 2 56.44627    4.14   0.0    10.6  1.1
## 3 70.07255    3.48   0.5    12.0  1.4
## 4 54.74059    2.54   0.5    10.3  1.8
## 5 38.10541    3.53   0.0    10.9  3.4
## 6 66.25873    3.98   0.0    11.0  0.8

推理

 t0 = 365 *5
x<-<IDI.INF(outcome, covs0, covs1, t0, npert=200) ;

最受欢迎的见解

1.R语言绘制生存曲线估计|生存分析|如何R作生存曲线图

2.R语言生存分析可视化分析

3.R语言如何在生存分析与Cox回归中计算IDI，NRI指标

4.r语言中使用Bioconductor 分析芯片数据

5.R语言生存分析数据分析可视化案例

6.r语言ggplot2误差棒图快速指南

7.R 语言绘制功能富集泡泡图

8.R语言如何找到患者数据中具有差异的指标？（PLS—DA分析）

9.R语言中的生存分析Survival analysis晚期肺癌患者4例

输出

想了解更多关于模型定制、咨询辅导的信息？

✉

联系我们

##     Est. Lower Upper p-value
## M1 0.090 0.052 0.119       0
## M2 0.457 0.340 0.566       0
## M3 0.041 0.025 0.062       0

M1表示IDI

M2表示NRI

M3表示中位数差异

R语言生存分析数据分析可视化案例

阅读文章 ➜

图形演示

可下载资源

关于作者

Kaizong Ye是拓端研究室（TRL）的研究员。在此对他对本文所作的贡献表示诚挚感谢，他在上海财经大学完成了统计学专业的硕士学位，专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

非常感谢您阅读本文，如需帮助请联系我们！

R语言如何在生存分析与Cox回归中计算IDI，NRI指标