R语言计量经济学:工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
两阶段最小二乘法(2SLS)回归拟合的线性模型是一种常用的工具变量估计方法。
两阶段最小二乘法(2SLS)回归拟合的线性模型是一种常用的工具变量估计方法。
Logistic回归,也称为Logit模型,用于对二元结果变量进行建模。
在经济学中,技术效率是指在既定的投入下产出可增加的能力或在既定的产出下投入可减少的能力。
我们被客户要求使用R库mgcv,用广义加性模型(GAMs)对环境数据进行建模。 WeChat Tencent
本文探索Python中的长短期记忆(LSTM)网络,以及如何使用它们来进行股市预测。
最近我们被客户要求撰写关于线性混合效应模型的研究报告,包括一些图形和统计输出。线性混合效应模型与我们已经知道的线性模型有什么不同?
“随着社会的进步,人们在改善物质生活的同时开始追求精神生活。
简单地说,copulas是具有均匀边际的联合分布函数。
在这篇文章中,我们将回顾三种提高循环神经网络的性能和泛化能力的高级方法。
降维是在我们处理包含过多特征数据的大型数据集时使用的,提高计算速度,减少模型大小,并以更好的方式将巨大的数据集可视化。这种方法的目的是保留最重要的数据,同时删除大部分的特征数据。
本文以上海市无印良品为例,运用定性分析与定量研究相结合的方法,分析了无印良品宏观和微观空间分布特征、区位分析和选址策略,讨论了无印良品对于城市的影响和意义。
我们可以很容易地用Keras序列模型拟合回归数据并预测测试数据。
环境应激源往往表现出时间上的延迟效应,这就要求使用足够灵活的统计模型来描述暴露-反应关系的时间维度。
本文讨论用ARIMA模型进行预测。考虑一些简单的平稳的AR(1)模拟时间序列
扩散的意思是过程可以包含布朗运动的成份,甚至写成布朗运动的积分形式。同时,这样的过程可以包含跳跃。
最近我们被客户要求撰写关于使用长短期记忆网络(LSTM)来拟合一个不稳定的时间序列的研究报告。
肝脏病在早期可能没有任何症状,不容易被察觉,或者症状是模糊的。肝脏病的症状和肝脏病的类型和程度高度相关,肝脏病的一般是通过肝功能测试诊断。
在本文中,我想向你展示如何使用R的Metropolis采样从贝叶斯Poisson回归模型中采样。
项目背景:银行的主要盈利业务靠的是贷款,这些客户中的大多数是存款大小不等的责任客户(存款人)。
我们在研究工作中使用广义加性模型(GAMs)。mgcv软件包是一套优秀的软件,可以为非常大的数据集指定、拟合和可视化GAMs。
用于R语言的多层感知器(MLP)和极限学习机(ELM)进行时间序列预测。
WeChat Tencent QQ email print 由Enzo Li撰写 开发一个预测模型,根据一
本文回答了关于逻辑回归的问题:它与线性回归有什么不同,如何在R中用glm()函数拟合和评估这些模型等等?
你知道吗,你可以把普通的静态ggplot图转换成动画图?
本文中我们用(非)线性混合模型分析藻类数据。这个问题的参数是:已知截距(0日值)在各组和样本之间是相同的。
某制药公司每年要花费大量的资金在电费上,由于电力公司的业务改革,该药企可以在一年或月开始时向电力公司预购一定数量的电力,如果实际消耗大于该值,则每多消耗一度电要付比以前更多的电费,如果实际上没有消耗这么多,也不会退还多余的电费,因此该公司打算预测未来的电力消耗以节省资金消耗。
在本文中,我们将使用基因表达数据。这个数据集包含120个样本的200个基因的基因表达数据。
在许多网站上都可以找到一个流行的德国信贷数据集_german_credit_,其中包含了银行贷款申请人的信息。
结构方程模型是一个线性模型框架,它对潜变量同时进行回归方程建模。
在这篇文章中,我将展示如何使用R语言来进行支持向量回归SVR。
有些问题是线性的,但有些问题是非线性的。
本文将谈论Stan以及如何在R中使用rstan创建Stan模型。
回归数据可以用Keras深度学习API轻松拟合。
标准化发病率(SIR)或死亡率(SMR)是观察病例和期望病例的比率。
在频率学派中,观察样本是随机的,而参数是固定的、未知的数量。
自回归条件异方差(ARCH)模型涉及具有时变异方差的时间序列,其中方差是以特定时间点的现有信息为条件的。
在本文中,我们将学习如何使用keras,用手写数字图像数据集(即MNIST)进行深度学习。
回归算法最小角回归(LARS)通过高维数据的线性组合提供变量。
本文与以下两个问题有关。你应该如何在回归中添加虚拟变量?你应该如何解释结果?
对于不熟悉的人来说,围绕混合模型的术语,特别是跨学科的术语,可能有点令人困惑。你可能遇到的关于这些类型的模型的一些术语包括。
这个例子展示了如何使用深度学习长短期记忆(LSTM)网络对文本数据进行分类。
多项式回归是独立x变量和因果y变量之间的非线性关系。
我们介绍贝叶斯分析,这个例子是关于职业足球比赛的进球数。
这个例子展示了如何用Matlab实现贝叶斯优化,使用分位数误差调整回归树随机森林的超参数。
Rasch 分析是获得客观的、最基本的累加型测量值(兼顾分析模型中的标准误和质量控制如拟合统计值)的一种分析方法,适用于通过随机观测有序、分级类反应获得的数据分析。
这个数据集可以追溯到1988年,由四个数据库组成。
在本文中,我们将用R语言对数据进行线性混合效应模型的拟合,然后可视化你的结果。
假设我们需要设计一个抽样调查,有一个完整的框架,包含目标人群的信息(识别信息和辅助信息)。
蒙特卡洛方法利用随机数从概率分布P(x)中生成样本,并从该分布中评估期望值,该期望值通常很复杂,不能用精确方法评估。
跳跃扩散过程为连续演化过程中的偏差提供了一种建模手段。
一旦我们清理了我们的文本并进行了一些基本的词频分析,下一步就是了解文本中的观点或情感。这被认为是情感分析,本教程将引导你通过一个简单的方法来进行情感分析。
逻辑回归是一种拟合回归曲线的方法,y=f(x),当y是一个分类变量时。
贝叶斯网络(BN)是一种基于有向无环图的概率模型,它描述了一组变量及其相互之间的条件依赖性。
动态时间规整(DTW,Dynamic time warping,动态时间归整/规整/弯曲)是一种衡量两个序列之间最佳排列的算法。
使用glmnet软件包中的相关函数对岭回归和lasso套索回归进行分析。
这篇文章假定你已经知道如何用igraph库建立一个基本的网络图。
这个数据集常用于数据概述、可视化和聚类模型。
VaR是 “风险价值 “的缩写,是许多公司和银行用来确定其公司内部金融风险水平的工具。风险值是为公司的投资而计算的,也可能是为检查银行或公司所管理的投资组合的风险水平。
当需要为数据选择最合适的预测模型或方法时,预测者通常将可用的样本分成两部分:内样本(又称 “训练集”)和保留样本(或外样本,或 “测试集”)。
(a)部分:k-means聚类
使用k-means聚类法将数据集聚成2组。
画一个图来显示聚类的情况
使用k-means聚类法将数据集聚成3组。
画一个图来显示聚类的情况
(b)部分:层次聚类
使用全连接法对观察值进行聚类。
使用平均和单连接对观测值进行聚类。
绘制上述聚类方法的树状图。
最近我们被客户要求撰写关于GLM模型的研究报告。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法。
然而,诸如性别、季节、地点等变量则不能用数字来衡量。相反,我们使用虚拟变量来衡量它们。
我们经常使用的一个关系性指标是相关性。通过可以利用数据框架和绘图来帮助探索相关关系。
主成分分析法是数据挖掘中常用的一种降维算法。
这个例子说明了一个函数拟合的神经网络如何根据测量结果来估计脂肪百分比。
关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。
Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds