R语言贝叶斯MCMC:用rstan建立线性回归模型分析汽车数据和可视化诊断
本文将谈论Stan以及如何在R中使用rstan创建Stan模型。
本文将谈论Stan以及如何在R中使用rstan创建Stan模型。
回归数据可以用Keras深度学习API轻松拟合。
标准化发病率(SIR)或死亡率(SMR)是观察病例和期望病例的比率。
在频率学派中,观察样本是随机的,而参数是固定的、未知的数量。
回归算法最小角回归(LARS)通过高维数据的线性组合提供变量。
本文与以下两个问题有关。你应该如何在回归中添加虚拟变量?你应该如何解释结果?
对于不熟悉的人来说,围绕混合模型的术语,特别是跨学科的术语,可能有点令人困惑。你可能遇到的关于这些类型的模型的一些术语包括。
多项式回归是独立x变量和因果y变量之间的非线性关系。
这个数据集可以追溯到1988年,由四个数据库组成。
逻辑回归是一种拟合回归曲线的方法,y=f(x),当y是一个分类变量时。
使用glmnet软件包中的相关函数对岭回归和lasso套索回归进行分析。
当需要为数据选择最合适的预测模型或方法时,预测者通常将可用的样本分成两部分:内样本(又称 “训练集”)和保留样本(或外样本,或 “测试集”)。
最近我们被客户要求撰写关于GLM模型的研究报告。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法。
然而,诸如性别、季节、地点等变量则不能用数字来衡量。相反,我们使用虚拟变量来衡量它们。
Lease Absolute Shrinkage and Selection Operator(LASSO)在给定的模型上执行正则化和变量选择。
贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯。
这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法。
本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。
本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究?
对于线性关系,我们可以进行简单的线性回归。对于其他关系,我们可以尝试拟合一条曲线。
本文是一个简短的教程,在R中拟合BRT(提升回归树)模型。我们的目标是使BRT(提升回归树)模型应用于生态学数据,并解释结果。
通常,bagging 与树有关,用于生成森林。但实际上,任何类型的模型都有可能使用bagging 。
多项式回归是独立x变量和因果y变量之间的非线性关系。
本文的目的是完成一个逻辑回归分析。使你对分析步骤和思维过程有一个基本概念。
在心理学研究中,个人主体的模型正变得越来越流行。原因之一是很难从人之间的数据推断出个人过程。另一个原因是,由于移动设备无处不在,从个人获得的时间序列变得越来越多。
Boosting算法是一种把若干个分类器整合为一个分类器的方法,也就是一种集成分类方法(Ensemble Method)。
目前,回归诊断不仅用于一般线性模型的诊断,还被逐步推广应用于广义线性模型领域(如用于logistic回归模型)。
最近我们被客户要求撰写关于PLS的研究报告。本文建立偏最小二乘法(PLS)回归(PLSR)模型,以及预测性能评估。
最近我们被客户要求撰写关于混合效应逻辑回归的研究报告。
最近我们被客户要求撰写关于心脏病数据的研究报告。在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量)。
本文考虑一下基于核方法进行分类预测。注意,在这里,我们不使用标准逻辑回归,它是参数模型。
这个例子展示了如何使用分位数随机林来检测异常值。
至少有两种非平稳时间序列:具有趋势的时间序列和具有单位根的时间序列(称为单整时间序列)。
本文将介绍如何在R中做贝叶斯回归分析,R中有不少包可以用来做贝叶斯回归分析,比如最早的(同时也是参考文献和例子最多的)R2WinBUGS包。
多元统计分析中,交互作用是指某因素作用随其他因素水平的不同而不同,两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。
本文学习创建时间序列预测的步骤,关注Dickey-Fuller检验、指数加权平均(EWMA)和ARIMA(自回归移动平均)模型,从理论上学习这些概念以及它们在python和R中的实现。
在劳动经济学领域,收入和工资的研究为从性别歧视到高等教育等问题提供了见解。
我们知道参数的置信区间的计算,这些都服从一定的分布(t分布、正态分布),因此在标准误前乘以相应的t分值或Z分值。
正则化路径是在正则化参数lambda的值网格上计算套索LASSO或弹性网路惩罚的正则化路径。
分段回归( piecewise regression ),顾名思义,回归式是“分段”拟合的。
最近我们被客户要求撰写关于面板平滑转换回归(PSTR)的研究报告。建模过程包括三个阶段:表述,估计和评估。当采用两种状态时,单转换函数PSTR模型具有两个变量:
房价有关的数据可能反映了中国近年来的变化:
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
本文我们对逻辑回归和样条曲线进行介绍。
这篇文章探讨了为什么使用广义相加模型 是一个不错的选择。为此,我们首先需要看一下线性回归,看看为什么在某些情况下它可能不是最佳选择。
本文使用lasso或非凸惩罚拟合线性回归,GLM和Cox回归模型的正则化
当线性假设无法满足时,可以考虑使用其他方法。
假设我们期望因变量由潜在协变量子集的线性组合确定。
资本资产定价模型(CAPM) 是用于确定是否在一个特定资产的投资是值得的。
本文估计实际GDP增长率的两状态Markov区制转换动态回归模型 。
MCMC是从复杂概率模型中采样的通用技术。
包含更多的预测变量不是免费的:在系数估算的更多可变性,更难的解释以及可能包含高度依赖的预测变量方面要付出代价。
之前我们讨论了使用ROC曲线来描述分类器的优势,有人说它描述了“随机猜测类别的策略”。
现在,分位数回归已被确立为重要的计量经济学工具。
这篇文章中我们可以编写自己的代码来计算套索(lasso)回归
本文我们讨论了期望寿命的计算,人口统计模型的起点是死亡率表。
我根据泊松Poisson回归、GAM样条曲线模型对一个十字路口的骑自行车者的数量进行预测
本文想在R软件中更好地了解分位数回归优化。在查看分位数回归之前,让我们从样本中计算中位数或分位数。
电力负荷预测是电网规划的基础,其水平的高低将直接影响电网规划质量的优劣。
为了找出影响价格波动的主要因素,我们使用逐步回归法来剔除一些对于应变量即把对价格影响很小的自变量剔除出我们的模型
本文通过R语言建立广义线性模型(GLM)、多项式回归和广义可加模型(GAM)来预测谁在1912年的泰坦尼克号沉没中幸存下来。
比如说分类变量为是否幸存、是因变量,连续变量为年龄、是自变量,这两者可以做相关分析吗?两者又是否可以做回归分析?
当我们将CNN(卷积神经网络)模型用于训练多维类型的数据(例如图像)时,它们非常有用。
我们首先讨论多项式回归,进一步,我们会想到分段线性或分段多项式函数,可能还有附加的连续性约束,这些是样条曲线回归的基础。
根据我们对温度的预测,我们可以预测电力消耗。
在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。
尽管对于较高的阈值,SVM可以产生更好的ROC值,但逻辑回归通常更擅长区分不同类别。朴素贝叶斯的ROC曲线通常低于其他两个ROC曲线,这表明样本内性能比其他两个分类器方法差。
一种类型的平滑称为样条平滑。柔性金属(通常是铅),可以用作绘制平滑曲线的参考。将选择一组点(称为结),然后将样条线压在特定的x,y点,然后弯曲以通过下一个点,依此类推。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds