Matlab建立逻辑回归，决策树，SVM，KNN和朴素贝叶斯模型分类绘制ROC曲线

视频

逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例

mdl = fitglm(pred,resp,'Distribution','binomial','Link','logit');

计算ROC曲线。使用逻辑回归模型中的概率估计值作为得分。

perfcurve 将阈值存储在数组中。

显示曲线下的面积。

AUC
AUC = 0.7918

曲线下的面积为0.7918。最大AUC为1，对应于理想分类器。较大的AUC值表示更好的分类器性能。

绘制ROC曲线

plot(X,Y)
xlabel('False positive rate') 
ylabel('True positive rate')
title('ROC for Classification by Logistic Regression')

视频

从决策树到随机森林：R语言信用卡违约分析信贷数据实例

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

使用ROC曲线比较分类方法

加载样本数据

load ionosphere

X 是351×34预测变量的矩阵。 Y 是类别标签的字符数组： 'b' 不良雷达回波和 'g' 良好雷达回波。

重新格式化因变量以适合逻辑回归。

拟合一个逻辑回归模型来估计雷达返回的后验概率是一个不好的概率。

mdl = fitglm(pred,resp,'Distribution','binomial','Link','logit');
score_log = mdl.Fitted.Probability; % Probability estimates

使用得分的概率计算标准ROC曲线。

在相同的样本数据上训练SVM分类器标准化数据。

mdlSVM = fitcsvm(pred,resp,'Standardize',true);

计算后验概率。

第二列 score_svm 包含不良雷达收益的后验概率。

使用SVM模型的分数计算标准ROC曲线。

在同一样本数据上拟合朴素贝叶斯分类器。

计算后验概率（分数）

[~,score_nb] = resubPredict(mdlNB);

使用朴素贝叶斯分类的分数计算标准ROC曲线。

将ROC曲线绘制在同一张图上。

最受欢迎的见解

1.R语言多元Logistic逻辑回归应用案例

2.面板平滑转移回归(PSTR)分析案例实现

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI，NRI指标

尽管对于较高的阈值，SVM可以产生更好的ROC值，但逻辑回归通常更擅长区分不良雷达收益与良好雷达。朴素贝叶斯的ROC曲线通常低于其他两个ROC曲线，这表明样本内性能比其他两个分类器方法差。

视频

支持向量机SVM、支持向量回归SVR和R语言网格搜索超参数优化实例

比较所有三个分类器的曲线下面积。

AUClog
AUClog = 0.9659
AUCsvm
AUCsvm = 0.9489
AUCnb
AUCnb = 0.9393

Logistic回归的AUC度量最高，而朴素的贝叶斯则最低。该结果表明，逻辑回归对此样本数据具有更好的样本内平均性能。

确定自定义核功能的参数值

本示例说明如何使用ROC曲线为分类器中的自定义内核函数确定更好的参数值。

在单位圆内生成随机的一组点。

定义预测变量。将第一象限和第三象限中的点标记为属于正类别，而将第二象限和第二象限中的点标记为负类。

pred = [X1; X2];
resp = ones(4*n,1);
resp(2*n + 1:end) = -1; % Labels

创建函数mysigmoid.m ，该函数接受要素空间中的两个矩阵作为输入，并使用S形内核将其转换为Gram矩阵。

使用Sigmoid内核函数训练SVM分类器。使用标准化数据。

设置 gamma = 0.5 ，使用调整后的S形核训练SVM分类器。



SVMModel2 = fitPosterior(SVMModel2);
[~,scores2] = resubPredict(SVMModel2);

计算两个模型的ROC曲线和曲线下面积（AUC）。

绘制ROC曲线。

plot(x1,y1)
hold on
plot(x2,y2)
hold off

title('ROC for classification by SVM');

将gamma参数设置为0.5的内核函数可提供更好的样本内结果。

比较AUC度量。

auc1
auc2
auc1 =

    0.9518


auc2 =

    0.9985

伽玛设置为0.5时曲线下的面积大于伽玛设置为1时曲线下的面积。这也证实了伽玛参数值为0.5会产生更好的结果。为了直观比较这两个伽玛参数值的分类性能。

视频

Boosting集成学习原理与R语言提升回归树BRT预测短鳍鳗分布生态学实例