R语言生存分析可视化分析
生存分析对应于一组统计方法,用于调查感兴趣事件发生所花费的时间。
生存分析对应于一组统计方法,用于调查感兴趣事件发生所花费的时间。
本文是我们通过时间序列和ARIMA模型预测拖拉机销售的制造案例研究示例。
R语言markov switching model马尔可夫转换分析研究水资源
对商业周期的分析需要提取时间序列的周期性成分,该时间序列通常也受到诸如潜在趋势或噪声等其他因素的影响。
最近我们被客户要求撰写关于2SLS的研究报告。
R语言通过WinBUGS对MGARCH和MSV模型进行贝叶斯估计和比较
维度规约(降维)算法在WEKA中应用
已有大量关于预测高频波动的文献,但大多数仅根据统计误差评估预测。
R语言聚类算法的应用实例
Iris鸢尾花数据集,内容摘自百度百科:Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。
在本文中,我们将以Scikit-learn的决策树和随机森林预测NBA获胜者。
时间序列建模三部曲
机器学习中需要把数据分为训练集和测试集,因此如何划分训练集和测试集就成为影响模型效果的重要因素。本文介绍一种常用的划分最优训练集和测试集的方法——k折交叉验证。”
此示例演示了使用具有胖尾边缘分布的多变量copula模拟计算投资组合的风险价值和条件风险值(预期缺口)。
r语言中使用Bioconductor 分析芯片数据
从海量数据中发现潜在标志指标, 需要借助多变量模式识别方法。
R 语言绘制功能富集泡泡图
如果我们对所有这些模型的结果进行平均,我们有时可以从它们的组合中找到比任何单个部分更好的模型。这就是集成模型的工作方式。
阈值模型用于几个不同的统计领域,而不仅仅是时间序列。
尽管航空业强劲,但为了保持持续增长以及作为跨地区行业领导者的持续地位,必须时刻保持警惕,以跟上客户需求。
状态转换模型,尤其是马尔可夫转换(MS)模型,被认为是识别时间序列非线性的不错的方法。
当时间序列数据的频率高于季度或月度时,许多预测程序在分析季节性影响方面遇到了障碍。
数据来自国际足联的视频游戏FIFA 。游戏的特点是在游戏的各个方面评价每个球员的能力。
每当你发现一个与时间对应的趋势时,你就会看到一个时间序列。
在传统的金融理论中,理性和同质的投资者是核心假设之一,表明每个投资者都有相同的信息,从而做出同样的决定。
金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量。然而,资产波动率的类型有多种。
波动率是众多定价和风险模型中的关键参数,例如BS定价方法或风险价值的计算。
有许多分层数据的例子。例如,地理数据通常按层次分组,可能是全球数据,然后按国家和地区分组 。一个生物学的例子是按物种分组的动物或植物的属性,或者属于一个级别的属性,然后是家族。一个商业例子可能是业务部门和细分的员工满意度。
这次,我们将使用k-Shape时间序列聚类方法检查与我们有业务关系的公司的股票收益率的时间序列。
使用基于分类的递归分区算法来拟合基于树的模型得到的模型类似于推荐的ř包rpart包产生的模型支持分类型树和回归型树。
最近我们被客户要求撰写关于时间序列的研究报告。分析时间序列数据的第一件事就是将其读入R,并绘制时间序列。
R语言使用马尔可夫链Markov Chain, MC来模拟抵押违约
本文考虑R语言的EM算法和高斯混合模型实现。
R语言用Backfitting MCMC抽样算法进行贝叶斯推理案例
R语言离群值处理分析
R语言估计时变VAR模型时间序列的实证研究分析案例
数据预处理之异常值处理
信用记分卡一直是信用评分的标准模型,因为它们易于理解,使您能够轻松评分新数据-即计算新客户的信用评分。
概率编程使我们能够实现统计模型,而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用。
多层线性模型(Hierarchical Linear Model,HLM),也叫多水平模型(Multilevel Model,MLM),是社会科学常用的高级统计方法之一。
时变参数VAR随机模型是一种新的计量经济学方法
最近我们被客户要求撰写关于混合模型的研究报告。由于我们发现自己在工作中越来越多地使用这些模型,我们开发了一套R shiny工具来简化和加速与对象交互的lme4常见任务。
对于熟悉线性回归拟合结构方程模型的分析师来说,在R环境中,拟合结构方程模型涉及学习新的建模语法,新的绘图语法以及通常是新的数据输入方法。
在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。
处理分组数据和复杂层次结构的分析师,从嵌入在参与者中的测量,嵌套在州内的县或嵌套在教室内的学生,经常发现他们需要建模工具来反映他们数据的这种结构。
R语言 线性混合效应模型实战案例
风险价值是衡量与投资组合相关的风险水平的统计方法。
本文的目的是对如何在R中进行生存分析进行简短而全面的评估。
本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响。
我已经准备了一个文件,其中包含四个用电时间序列来进行分析。数据操作将由data.table程序包完成。
此示例显示MATLAB如何从复合条件均值和方差模型预测 和条件差异。
“预测非常困难,特别是关于未来”。-丹麦物理学家尼尔斯·波尔(Neils Bohr)
有正必有反,在个人信贷业务规模不断扩大的同时,信贷的违约等风险问题也日益突出,一定程度上制约着我国的信贷市场的健康发展。
和宏观经济数据不同,金融市场上多为高频数据,比如股票收益率序列。
本文考虑由具有明显频率变化的正弦波组成的非平稳连续信号。
豆瓣高分影视数据洞察:热门影视十年演变
了解不同的股市状况,改变交易策略,对股市收益有很大的影响。
在信息爆炸时代,“信用”已成为越来越重要的无形财产。
对于零售行业来说,预测几乎是商业智能(BI)研究的终极问题,单纯从机器学习的角度来说,做到精准预测很容易,但是结合业务提高企业利润却很难。预测精确性是核心痛点。
拓端数据使用数据挖掘技术对海量的在线医院药物复方历史数据进行智能分析,并从中找出药物配伍的规律,帮助客户解决独特的业务问题。
我已经准备了一个文件,其中包含四个用电时间序列来进行分析。数据操作将由data.table程序包完成。
风险价值是衡量与投资组合相关的风险水平的统计方法。
多元Copula GARCH 模型时间序列预测
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds