R语言用AR,MA,ARIMA 模型进行时间序列预测
本文讨论用ARIMA模型进行预测。考虑一些简单的平稳的AR(1)模拟时间序列
本文讨论用ARIMA模型进行预测。考虑一些简单的平稳的AR(1)模拟时间序列
扩散的意思是过程可以包含布朗运动的成份,甚至写成布朗运动的积分形式。同时,这样的过程可以包含跳跃。
最近我们被客户要求撰写关于使用长短期记忆网络(LSTM)来拟合一个不稳定的时间序列的研究报告。
肝脏病在早期可能没有任何症状,不容易被察觉,或者症状是模糊的。肝脏病的症状和肝脏病的类型和程度高度相关,肝脏病的一般是通过肝功能测试诊断。
在本文中,我想向你展示如何使用R的Metropolis采样从贝叶斯Poisson回归模型中采样。
项目背景:银行的主要盈利业务靠的是贷款,这些客户中的大多数是存款大小不等的责任客户(存款人)。
我们在研究工作中使用广义加性模型(GAMs)。mgcv软件包是一套优秀的软件,可以为非常大的数据集指定、拟合和可视化GAMs。
本文介绍了冲积/桑基图,以及
定义了命名方案和冲积/桑基图的基本组成部分(轴、冲积层、流)。
描述了所识别的冲积/桑基图数据结构。
展示了一些流行的主题。
用于R语言的多层感知器(MLP)和极限学习机(ELM)进行时间序列预测。
WeChat Tencent QQ email print 由Enzo Li撰写 开发一个预测模型,根据一
本文回答了关于逻辑回归的问题:它与线性回归有什么不同,如何在R中用glm()函数拟合和评估这些模型等等?
你知道吗,你可以把普通的静态ggplot图转换成动画图?
本文中我们用(非)线性混合模型分析藻类数据。这个问题的参数是:已知截距(0日值)在各组和样本之间是相同的。
某制药公司每年要花费大量的资金在电费上,由于电力公司的业务改革,该药企可以在一年或月开始时向电力公司预购一定数量的电力,如果实际消耗大于该值,则每多消耗一度电要付比以前更多的电费,如果实际上没有消耗这么多,也不会退还多余的电费,因此该公司打算预测未来的电力消耗以节省资金消耗。
在本文中,我们将使用基因表达数据。这个数据集包含120个样本的200个基因的基因表达数据。
在许多网站上都可以找到一个流行的德国信贷数据集_german_credit_,其中包含了银行贷款申请人的信息。
饼图把一个圆分成多个部分,这些部分的弧长(以及面积)代表一个整体的比例。
结构方程模型是一个线性模型框架,它对潜变量同时进行回归方程建模。
在这篇文章中,我将展示如何使用R语言来进行支持向量回归SVR。
当从单变量波动率预测跳到多变量波动率预测时,我们需要明白,现在不仅要预测单变量波动率元素,还要预测协方差元素。
有些问题是线性的,但有些问题是非线性的。
录取情况反映了公众对一所大学水平和实力的认知,是评价一所大学及其专业 “知名度 “的重要指标。
本文将谈论Stan以及如何在R中使用rstan创建Stan模型。
回归数据可以用Keras深度学习API轻松拟合。
标准化发病率(SIR)或死亡率(SMR)是观察病例和期望病例的比率。
在频率学派中,观察样本是随机的,而参数是固定的、未知的数量。
自回归条件异方差(ARCH)模型涉及具有时变异方差的时间序列,其中方差是以特定时间点的现有信息为条件的。
在本文中,我们将学习如何使用keras,用手写数字图像数据集(即MNIST)进行深度学习。
回归算法最小角回归(LARS)通过高维数据的线性组合提供变量。
本文与以下两个问题有关。你应该如何在回归中添加虚拟变量?你应该如何解释结果?
对于不熟悉的人来说,围绕混合模型的术语,特别是跨学科的术语,可能有点令人困惑。你可能遇到的关于这些类型的模型的一些术语包括。
这个例子展示了如何使用深度学习长短期记忆(LSTM)网络对文本数据进行分类。
定量战术资产配置策略(QATAA)模型是使用10个月的移动平均线作为过滤器。
本文目标是创建合成波动率指数
在这个文章中,我们演示了copula GARCH方法(一般情况下)。
多项式回归是独立x变量和因果y变量之间的非线性关系。
我们介绍贝叶斯分析,这个例子是关于职业足球比赛的进球数。
数学模型的统计评价通常是通过考虑测试统计量来进行的,测试统计量表示观察数据和拟合模型的数据之间的差异。
这个例子展示了如何用Matlab实现贝叶斯优化,使用分位数误差调整回归树随机森林的超参数。
Rasch 分析是获得客观的、最基本的累加型测量值(兼顾分析模型中的标准误和质量控制如拟合统计值)的一种分析方法,适用于通过随机观测有序、分级类反应获得的数据分析。
这个数据集可以追溯到1988年,由四个数据库组成。
在本文中,我们将用R语言对数据进行线性混合效应模型的拟合,然后可视化你的结果。
假设我们需要设计一个抽样调查,有一个完整的框架,包含目标人群的信息(识别信息和辅助信息)。
蒙特卡洛方法利用随机数从概率分布P(x)中生成样本,并从该分布中评估期望值,该期望值通常很复杂,不能用精确方法评估。
跳跃扩散过程为连续演化过程中的偏差提供了一种建模手段。
最近我们被客户要求撰写关于时间序列的研究报告。我们做的第一件事是清除当前环境中的所有变量。这可以通过以下命令进行。
一旦我们清理了我们的文本并进行了一些基本的词频分析,下一步就是了解文本中的观点或情感。这被认为是情感分析,本教程将引导你通过一个简单的方法来进行情感分析。
逻辑回归是一种拟合回归曲线的方法,y=f(x),当y是一个分类变量时。
贝叶斯网络(BN)是一种基于有向无环图的概率模型,它描述了一组变量及其相互之间的条件依赖性。
动态时间规整(DTW,Dynamic time warping,动态时间归整/规整/弯曲)是一种衡量两个序列之间最佳排列的算法。
使用glmnet软件包中的相关函数对岭回归和lasso套索回归进行分析。
随着社会经济的发展,饮食生活已经逐渐融入了我们的日常生活世界,每天都不可避免地在 “吃 “的问题上有更多的考虑,吃好、吃多已经不再是我们的烦恼。
这个数据集常用于数据概述、可视化和聚类模型。
VaR是 “风险价值 “的缩写,是许多公司和银行用来确定其公司内部金融风险水平的工具。风险值是为公司的投资而计算的,也可能是为检查银行或公司所管理的投资组合的风险水平。
本文将介绍R中可用于投资组合优化的不同求解器。
当需要为数据选择最合适的预测模型或方法时,预测者通常将可用的样本分成两部分:内样本(又称 “训练集”)和保留样本(或外样本,或 “测试集”)。
(a)部分:k-means聚类
使用k-means聚类法将数据集聚成2组。
画一个图来显示聚类的情况
使用k-means聚类法将数据集聚成3组。
画一个图来显示聚类的情况
(b)部分:层次聚类
使用全连接法对观察值进行聚类。
使用平均和单连接对观测值进行聚类。
绘制上述聚类方法的树状图。
Nelder-Mead方法是最著名的无导数方法之一,它只使用f的值来搜索最小值。过程:
最近我们被客户要求撰写关于GLM模型的研究报告。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法。
然而,诸如性别、季节、地点等变量则不能用数字来衡量。相反,我们使用虚拟变量来衡量它们。
Python计算获得多资产投资组合的风险度量。
我们经常使用的一个关系性指标是相关性。通过可以利用数据框架和绘图来帮助探索相关关系。
主成分分析法是数据挖掘中常用的一种降维算法。
对于庞大的公交地铁路线信息的数据挖掘,一般软件遇到的问题主要有两点:1.对于文本信息的挖掘,特别是中文词汇的挖掘,缺乏成熟的工具或者软件包,2.对于大数据量,一般软件的读取和处理会遇到问题。
这个例子说明了一个函数拟合的神经网络如何根据测量结果来估计脂肪百分比。
关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。
Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds