R语言随机森林模型中具有相关特征的变量重要性
变量重要性图是查看模型中哪些变量有趣的好工具。
变量重要性图是查看模型中哪些变量有趣的好工具。
从动态的角度看,负利率效应也可以被描述为银行利率变化的速度小于价格指数变化的速度,这是一种违反经济规律的特殊状态。
在课程中进行案例研究(使用真实数据)时,学生都会惊讶地发现很难获得“好”模型
当我们要可视化事故数量时,其想法是根据部门的人员进行标准化。
我们将使用整容手术数据说明两种中心化类型,并对其进行等级线性模型分析。
在本教程中,我们将讨论一种非常强大的优化(或自动化)算法,即网格搜索算法。
拨号音信号的变模分解,首先创建一个以4 kHz采样的信号
本文简要介绍了一种简单的状态切换模型,该模型构成了隐马尔可夫模型(HMM)的特例。
使用ARIMA模型,您可以使用序列过去的值预测时间序列。
ARIMA模型是一种流行的且广泛使用的用于时间序列预测的统计方法。
本文描述了R语言中马尔克夫转换模型的分析过程。首先,对模拟数据集进行详细建模。接下来,将马尔可夫转换模型拟合到具有离散响应变量的真实数据集。用于验证对这些数据集建模的不同方法。
对于许多模型,例如逻辑模型,没有共轭先验分布。因此,吉布斯采样不适用。
本文比较了几个时间序列模型,以预测SP 500指数的每日实际波动率。
在本文中,我将向您展示如何模拟股票价格的Heston随机波动率模型。
R2WinBUGS软件包提供了从R调用WinBUGS的便捷功能。
本教程的主要目的是找到模型和检验关于这些特征与学生受欢迎程度(根据其同学)之间的关系的假设。
概率编程使我们能够实现统计模型,而不必担心技术细节。
对于分类问题,通常根据与分类器关联的混淆矩阵来定义分类器性能。
在本文中,我描述了如何在CRAN中搜索用于绘制ROC曲线的包,并重点介绍了六个有用的包。
在本节中,我将重点介绍使用集成嵌套 拉普拉斯近似方法的贝叶斯推理。
本文档用于比较六个不同统计软件程序(SAS,Stata,HLM,R,SPSS和Mplus)的两级多层(也称分层或层次)线性模型的过程和输出。
在评估结构方程模型的拟合,很常见的应用是研究χ2进行测试
本教程介绍了生存分析,以及如何在R中进行生存分析
几个月以来,我一直对序数回归与项目响应理论(IRT)之间的关系感兴趣。 在这篇文章中,我重点介绍Rasch分析。
在实践中, 因子负载较低(或测量质量较差)的模型的拟合指数要好于因子负载较高的模型。
R语言在不同样本量下的Little’s MCAR检验
本教程将介绍如何使用SAS进行单因素方差分析。
第一估计模型在每个时间聚合级别的拟合度,还提供已识别ETS的可视化。
本文是有关 基于树的 回归和分类方法的。
样条线是拟合非线性模型并从数据中学习非线性相互作用的一种方法。
假设检验的基本原理是小概率原理,即我们认为小概率事件在一次试验中实际上不可能发生。
本文展示了r语言中如何进行Spearman等级相关分析的例子。
经济时间序列的分析通常需要提取其周期性成分。
最近我们被客户要求撰写关于决策树分类的研究报告。将使用著名的iris数据集,该数据集对各种不同的iris类型进行各种测量。
R语言在BRFSS数据中可视化分析探索糖尿病的影响因素
在绘制的时间序列中可以看到两个主要的季节性:每日和每周。我们在一天中有48个测量值,在一周中有7天,因此这将是我们用来对响应变量进行建模的自变量–电力负荷。
最近我们被客户要求撰写关于开发具有多个输出的文本分类模型的研究报告。
在本文中,您将看到如何在Python中执行对象检测。
分类问题属于机器学习问题的类别,其中给定一组特征,任务是预测离散值。
缺失值被认为是预测建模的首要障碍。因此,掌握克服这些问题的方法很重要。
此示例说明如何将贝叶斯优化应用于深度学习,以及如何为卷积神经网络找到最佳网络超参数和训练选项。
为了在SAS中运行随机森林,我们必须使用PROC HPFOREST指定目标变量,并概述天气变量是“类别”还是“定量”。
R语言中的prophet预测时间序列数据模型
在本文中,我想向您展示如何应用S&P500股票市场指数的交易策略。
R语言rjags使用随机效应进行臭氧数据分析
诸如核密度估计(KDE)的平滑方法被用于控制用于计算每种疾病率的空间支持的群体基础。
ARIMA等传统模型有一个主要缺点 – 它们通常不会解释“冲击”或时间序列的突然变化。
神经网络一直是迷人的机器学习模型之一
Python Monte Carlo K-Means聚类实战研究
我将建立道琼斯工业平均指数(DJIA)日交易量对数比的ARMA-GARCH模型。
在本文中,我将向您介绍集成建模的基础知识。 另外,为了向您提供有关集合建模的实践经验。
R语言有RStan的多维验证性因子分析(CFA)
Stata估算观测数据的风险比
R语言使用倾向评分提高RCT(随机对照试验)的效率
R语言在RCT中调整基线时对错误指定的稳健性
R语言利用基线协变量提高随机对照试验的效率
R语言调整随机对照试验中的基线协变量
R语言分析协变量之间的非线性关系
stata对包含协变量的模型进行缺失值多重插补分析
stata如何处理结构方程模型(SEM)中具有缺失值的协变量
2014年9月18日,苏格兰居民将进行公民投票决定是否独立于英国。
R平方/相关性取决于预测变量的方差
copula是将多变量分布函数与其边际分布函数耦合的函数,通常称为边缘。
根据生存曲线的估计,可以推断出相比组之间存活时间的差异,因此生存曲线非常有用,几乎可以在每个生存分析中看到。
这场灾难以拯救“妇女和儿童第一”而闻名,所以让我们来看看性别和年龄变量。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds