SAS分类决策树预测贷款申请评分剪枝和结果可视化
分类树的一个常见用途是预测抵押贷款申请人是否会拖欠贷款。
分类树的一个常见用途是预测抵押贷款申请人是否会拖欠贷款。
今年的收益是否真的与典型年份的预期不同?
本文描述了如何 使用内置 R 执行主成分分析 ( PCA )。
在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型。
在事物的发展过程中,常表现出复杂的波动情况,即时而波动的幅度较缓,而又时常出现波动集聚性(VolatilitY clustering),在风险研究中经常遇到这种情况。
FF 模型通过回归除市场收益之外的几个变量的投资组合收益来扩展 CAPM。
世界卫生组织估计全世界每年有 1200 万人死于心脏病。
绘制分类或回归树的基本方法的 rpart() 函数只是调用 plot。
WeChat Tencent QQ email print 由Kaizong Ye,Coin Ge撰写 考虑稳
变量选择是高维统计建模的重要组成部分。
Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。
漂亮的圆形图。我不确定对数据分析师本身是否有额外的好处,但如果能吸引决策者的注意,那对我来说就是额外的价值。
在网络上进行社区检测时,有时我们不仅拥有实体之间的联系。
支持向量回归(SVR)是一种回归算法,它应用支持向量机(SVM)的类似技术进行回归分析。
最近我们被客户要求撰写关于计算 lme 4 包中广义线性混合模型的功效的研究报告。
“获胜概率”的实时计算(或估计)很困难。
谱聚类是一种将数据的相似矩阵的谱应用于降维的技术。
最近我们被客户要求撰写关于量化交易的研究报告。
WeChat Tencent QQ email print 由Kaizong Ye,Coin Ge撰写 使用l
本文档通过一些探索性数据分析来制定河流的评级曲线和流量预测。
在这项工作中,我通过创建一个包含四只基金的模型来探索 copula,这些基金跟踪股票、债券、美元和商品的市场指数。
有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。
本文,我通过两个种群生态学家可能感兴趣的例子来说明使用“JAGS”来模拟数据:首先是线性回归,其次是估计动物存活率(公式化为状态空间模型)。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
Beta 假设反映了一种工具对例如市场的风险。但是,您可以通过各种方式估算此度量。
在本文中,我解释了基本回归,并介绍了主成分分析 (PCA) 使用回归来预测城市中观察到的犯罪率。
已经开发了大量确定性和随机性的圆填充算法。
最近我们被客户要求撰写关于LCMM的研究报告。相比之下,潜在类别混合模型在于假设人口是异质的,并且由 G 潜在类别的受试者组成,其特征是 G 平均轨迹曲线。
我们在心理学网络论文中看到的一个问题是,作者有时会对其数据的可视化进行过度解释。
最近,copula 在仿真模型中变得流行起来。
本文通过一些指数对散点图矩阵和平行坐标显示中的面板进行排序,并根据其数值水平对面板进行着色。
在这个例子中,我们考虑马尔可夫转换随机波动率模型。
此分析的目的是构建一个过程,以在给定时变波动性的情况下正确估计风险价值。 WeChat Tenc
此示例说明如何使用三种方法估计风险价值 (VaR) 并执行 VaR 回测分析。
如果你正在进行统计分析:想要加一些先验信息,最终你想要的是预测。
我们研究波动聚集,以及使用单变量 GARCH(1,1) 模型对其进行建模。
配置神经网络很困难,因为没有关于如何去做的好的理论。
Boosting指的是机器学习元算法系列,它将许多 “弱 “分类器的输出合并成一个强大的 “集合”,其中每个弱分类器单独的错误率可能只比随机猜测好一点。
这篇文章讨论了自回归综合移动平均模型 (ARIMA) 和自回归条件异方差模型 (GARCH) 及其在股票市场预测中的应用。
本文演示了训练一个简单的卷积神经网络 (CNN) 来对 CIFAR 图像进行分类。
在这篇文章中,我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术 。
var对象指定了p阶平稳的多变量向量自回归模型(VAR(p))模型的函数形式并存储了参数值。
本文介绍简化模型构建和评估过程。
在今天产品高度同质化的品牌营销阶段,企业与企业之间的竞争集中地体现在对客户的争夺上。
像任何统计建模一样,贝叶斯建模可能需要为你的研究问题设计合适的模型,然后开发该模型,使其符合你的数据假设并运行。
Boosting 是一类集成机器学习算法,涉及结合许多弱学习器的预测。
使用 garch 指定一个单变量GARCH(广义自回归条件异方差)模型。
本教程使用R介绍了具有非信息先验的贝叶斯 GLM(广义线性模型)。
《世界幸福报告》是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。
在这篇文章中,我将集中讨论一个给定一个短数据序列的推断概率的例子。
本文用 R 编程语言极值理论 (EVT) 以确定 10 只股票指数的风险价值(和条件 VaR)。
每个动态现象都可以用一个潜过程(Λ(t))来表征,这个潜过程在连续的时间t中演化。
在这个例子中,我们考虑马尔可夫转换随机波动率模型。
什么是PCR?(PCR = PCA + MLR)
特别是在经济学/计量经济学中,建模者不相信他们的模型能反映现实。
贝叶斯模型提供了变量选择技术,确保变量选择的可靠性。
因子实验在农业中非常普遍,它们通常用于测试实验因素之间相互作用的重要性。
铁和泛酸的极好来源,是澳大利亚、美国和东亚的营养食品资源和农业。100 克鲍鱼可提供超过 20% 的每日推荐摄入量。鲍鱼的经济价值与其年龄呈正相关。因此,准确检测鲍鱼的年龄对于养殖者和消费者确定其价格非常重要。
此示例说明如何使用从传感器获得的数据分析共享单车交通模式, 来预处理带时间戳的数据。数据来自传感器。
此示例说明如何使用逻辑回归模型进行贝叶斯推断。
在量化金融中,我们学习了各种时间序列分析技术以及如何使用它们。
在这篇文章中,我将扩展从数据推断概率的示例,考虑 0 和 1之间的所有(连续)值,而不是考虑一组离散的候选概率。
最近我们被客户要求撰写关于抗哮喘药物茶碱动力学研究的报告。茶碱数据文件报告来自抗哮喘药物茶碱动力学研究。
此示例基于电视节目的在线收视率。我们将从抓取数据开始。
本文的目标是使用各种预测模型预测Google的未来股价,然后分析各种模型。
面板向量自回归(VAR)模型在应用研究中的应用越来越多。
T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds