R语言逻辑回归Logisitc逐步回归训练与验证样本估计分析心脏病数据参数可视化
在进行交叉验证之前,很自然地说“我会预烧 50%(比如说)我的数据来训练一个模型,然后用剩下的来拟合模型”。
在进行交叉验证之前,很自然地说“我会预烧 50%(比如说)我的数据来训练一个模型,然后用剩下的来拟合模型”。
零膨胀泊松回归用于对超过零计数的计数数据进行建模。
风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量,也被投资组合经理等从业者用来解释未来市场风险。
在本教程中,我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法。
对于模拟股票价格,几何布朗运动 (GBM) 是 事实上的首选 模型。
本文是在 R 中使用 Keras 的LSTM神经网络分类简单介绍。
在本笔记本中,我们向读者介绍了基本的随机波动率模型,并通过连续顺序重要性重采样讨论了它们的估计。我们使用收益率数据集来讨论 CSIR 在随机波动率模型估计中的实现和性能。
在这个项目中,我讨论了如何使用主成分分析 (PCA) 进行简单的预测。
理解世界,我们可以从相关性的角度去描述,统计,机器学习,很多问题都是从相关的角度去描述的。
指数分布是泊松过程中事件之间时间的概率分布,因此它用于预测到下一个事件的等待时间。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
Metropolis Hastings 算法是一种非常简单的算法,用于从难以采样的分布中生成样本。
线性模型是统计学的基础,但它的意义远不止用尺子在几个点上画一条线。
极值理论对样本尾部分布的极值指数的估计方法主要有两类:半参数方法和全 参数方法,前者主要是基于分布尾部的 Hill 估计量,后者则主要基于广义帕累托分布。
Box 等人的开创性工作(1994) 在自回归移动平均模型领域的相关工作为波动率建模领域的相关工作铺平了道路,分别由 Engle (1982) 和 Bollerslev (1986) 引入了 ARCH 和 GARCH 模型。
结构方程建模 (SEM) 是一种全面而灵活的方法,包括在假设模型中研究变量之间的关系。
弹性网络正则化同时应用 L1 范数和 L2 范数正则化来惩罚回归模型中的系数。
本文使用的数据集记录了 1236 名新生婴儿的体重,以及他们母亲的其他协变量。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法,用于描述生命过程中的暴露,它将异质人群简化为同质模式或类别。
我们首先介绍扩展 Rasch 模型的方法论,然后是一般程序描述和应用主题,包括简单的 Rasch 模型、评级量表模型、部分信用模型及其线性扩展。
当您处理金融时间序列时,我们通常可以获得相对高频的观察结果。
假设调查人员有兴趣检查减肥干预方法的三个组成部分。 WeChat Tencent QQ email print
. 您想知道它是否与(例如)零显着不同。一般来说,人们会查看他们选择的软件报告的统计数据或 p.value。问题是,这个 p.value 计算依赖于因变量的分布。如果没有不同的说明,您的软件假定为正态分布,那是怎么回事?
对于那些不熟悉“配对交易”概念的人来说几句话。
本文描述了一个模型,该模型解释了交易的聚集到达,并展示了如何将其应用于比特币交易数据。
从广义上讲,复杂的模型可以实现很高的预测准确性。
这篇文章是关于 copulas 和重尾的。
最近我们被客户要求撰写关于股票收益率时间序列的研究报告,包括一些图形和统计输出。在本文中,我们展示了 copula GARCH 方法拟合模拟数据和股票数据并进行可视化。
VARs的结构也允许联合检验多个方程的限制。
在多变量波动率预测中,我们有时会看到对少数主成分驱动的协方差矩阵建模,而不是完整的股票。
一只 股票的_beta_值通常意味着它与市场的关系,当市场变动 1%时,我们期望股票会发生多少百分比的变动。
配对交易提出的问题之一是股票的贝塔值相对于市场的不稳定估计。
在投资组合管理、风险管理和衍生品定价中,波动性起着重要作用。
冗余分析(redundancy analysis,RDA)是一种回归分析结合主成分分析的排序方法,也是多因变量(multiresponse)回归分析的拓展。
“分位数自回归”,它是对时间序列域的重要扩展。
从广义上讲,我们可以将金融市场状况分为两类:牛市和熊市。
现在有了对贝叶斯方法的概念理解,我们将实际研究使用它的回归模型。
你们可能知道,实际极值分析有两种常用方法:分块极大值Blockmaxima、阈值超额法threshold excess。
当ARIMA模型包括其它时间序列作为输入变量时,被称为传递函数模型(transfer function model)、多变量时间序列模型(multivariate time series model)、ARIMAX模型或Box-Tiao模型。
对“NCI60”(癌细胞系微阵列)数据使用聚类方法
对于时间序列分析,有两种数据格式: ts (时间序列)和 xts (可扩展时间序列)。
本文介绍具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。
当一个序列遵循随机游走模型时,就说它是非平稳的。
今年的收益是否真的与典型年份的预期不同?
本文显示如何填充 图表中两条交叉线之间的区域。
本文描述了如何 使用内置 R 执行主成分分析 ( PCA )。
在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型。
在事物的发展过程中,常表现出复杂的波动情况,即时而波动的幅度较缓,而又时常出现波动集聚性(VolatilitY clustering),在风险研究中经常遇到这种情况。
我们一直在寻找一种直观的方法来绘制流程中状态之间的流程或连接。
FF 模型通过回归除市场收益之外的几个变量的投资组合收益来扩展 CAPM。
世界卫生组织估计全世界每年有 1200 万人死于心脏病。
绘制分类或回归树的基本方法的 rpart() 函数只是调用 plot。
Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。
漂亮的圆形图。我不确定对数据分析师本身是否有额外的好处,但如果能吸引决策者的注意,那对我来说就是额外的价值。
在网络上进行社区检测时,有时我们不仅拥有实体之间的联系。
最近我们被客户要求撰写关于计算 lme 4 包中广义线性混合模型的功效的研究报告。
“获胜概率”的实时计算(或估计)很困难。
本文档通过一些探索性数据分析来制定河流的评级曲线和流量预测。
在这项工作中,我通过创建一个包含四只基金的模型来探索 copula,这些基金跟踪股票、债券、美元和商品的市场指数。
有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。
本文,我通过两个种群生态学家可能感兴趣的例子来说明使用“JAGS”来模拟数据:首先是线性回归,其次是估计动物存活率(公式化为状态空间模型)。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
Beta 假设反映了一种工具对例如市场的风险。但是,您可以通过各种方式估算此度量。
在本文中,我解释了基本回归,并介绍了主成分分析 (PCA) 使用回归来预测城市中观察到的犯罪率。
已经开发了大量确定性和随机性的圆填充算法。
最近我们被客户要求撰写关于LCMM的研究报告。相比之下,潜在类别混合模型在于假设人口是异质的,并且由 G 潜在类别的受试者组成,其特征是 G 平均轨迹曲线。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds