R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
最近我们被客户要求撰写关于混合效应逻辑回归的研究报告。
最近我们被客户要求撰写关于混合效应逻辑回归的研究报告。
如果你了解数据科学领域,你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型,试图将不相关的变量从模型中排除。
最近我们被客户要求撰写关于心脏病数据的研究报告。在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量)。
线性回归时若数据不服从正态分布,会给线性回归的最小二乘估计系数的结果带来误差,所以需要对数据进行结构化转换。
两个随机变量之间的相依性问题备受关注,相依性(dependence)是反映两个随机变量之间关联程度的一个概念。
向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的。
每一个动态现象都可以用一个潜过程(Λ(t)来描述,这个潜过程在连续的时间t内演化。
本文考虑一下基于核方法进行分类预测。注意,在这里,我们不使用标准逻辑回归,它是参数模型。
这个例子展示了如何使用分位数随机林来检测异常值。
至少有两种非平稳时间序列:具有趋势的时间序列和具有单位根的时间序列(称为单整时间序列)。
相信大家都听说过股票和债券的多元化投资组合。
本文将介绍如何在R中做贝叶斯回归分析,R中有不少包可以用来做贝叶斯回归分析,比如最早的(同时也是参考文献和例子最多的)R2WinBUGS包。
多元统计分析中,交互作用是指某因素作用随其他因素水平的不同而不同,两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。
假设检验的基本原理是小概率原理,即我们认为小概率事件在一次试验中实际上不可能发生。
这是我们最近的一项护士职业满意度线上调查中关注的一个问题。遗憾的是,对护士工作满意的只有约27%。为何这么多人不愿意再次选择做护士?
本文学习创建时间序列预测的步骤,关注Dickey-Fuller检验、指数加权平均(EWMA)和ARIMA(自回归移动平均)模型,从理论上学习这些概念以及它们在python和R中的实现。
WeChat Tencent QQ email print 由Kaizong Ye,Liao Bao撰写 μ是
在劳动经济学领域,收入和工资的研究为从性别歧视到高等教育等问题提供了见解。
我们知道参数的置信区间的计算,这些都服从一定的分布(t分布、正态分布),因此在标准误前乘以相应的t分值或Z分值。
正则化路径是在正则化参数lambda的值网格上计算套索LASSO或弹性网路惩罚的正则化路径。
最近我们被客户要求撰写关于预测销量时间序列的研究报告。指数平滑模型是基于对数据趋势和季节性的描述,而ARIMA模型则是为了描述数据的自相关性。
分段回归( piecewise regression ),顾名思义,回归式是“分段”拟合的。
任何MCMC方案的目标都是从“目标”分布产生样本。
最近我们被客户要求撰写关于面板平滑转换回归(PSTR)的研究报告。建模过程包括三个阶段:表述,估计和评估。当采用两种状态时,单转换函数PSTR模型具有两个变量:
房价有关的数据可能反映了中国近年来的变化:
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
本文我们对逻辑回归和样条曲线进行介绍。
本文提供了运行分布滞后非线性模型的示例,同时描述了预测变量和结果之间的非线性和滞后效应,这种相互关系被定义为暴露-滞后-反应关联。
最近我们被客户要求撰写关于聚类技术的研究报告。为了说明层次聚类技术和k-均值,我使用了了城市温度数据集,其中包括几个城市的月平均气温。
本文演示了在时间序列分析中应用分布滞后线性和非线性模型(DLMs和DLNMs)。
环境科学中的许多数据不适合简单的线性模型,最好用广义相加模型(GAM)来描述。<
这篇文章探讨了为什么使用广义相加模型 是一个不错的选择。为此,我们首先需要看一下线性回归,看看为什么在某些情况下它可能不是最佳选择。
本文使用lasso或非凸惩罚拟合线性回归,GLM和Cox回归模型的正则化
人工神经网络最初是由研究人员开发的,他们试图模仿人脑的神经生理学。
时间序列 被定义为一系列按时间顺序索引的数据点。时间顺序可以是每天,每月或每年。
预测股价已经受到了投资者,政府,企业和学者广泛的关注。然而,数据的非线性和非平稳性使得开发预测模型成为一项复杂而具有挑战性的任务。
2019年,全球八个主要国家的18岁以上男女共诊断出72,164例急性髓细胞白血病(AML)。
人们通常使用接收者操作特征曲线(ROC)进行二元结果逻辑回归。但是,流行病学研究中感兴趣的结果通常是事件发生时间。使用随时间变化的时间相关ROC可以更全面地描述这种情况下的预测模型。
最近我们被客户要求撰写关于混合效应模型的研究报告。我们已经学习了如何处理混合效应模型。
洛伦兹曲线来源于经济学,用于描述社会收入不均衡的现象。
当线性假设无法满足时,可以考虑使用其他方法。
回首不平凡的2020年,技术力量越来越受到重视,技术从业者的责任也越来越重大。
本文从实践角度讨论了季节性单位根。
时间序列为预测未来数据提供了方法。根据先前的值,时间序列可用于预测经济,天气的趋势。
假设我们期望因变量由潜在协变量子集的线性组合确定。
本文将说明金融数学中的R 语言优化投资组合,因子模型的实现和使用。
在本文中,我们将介绍三种提高循环神经网络性能和泛化能力的高级技术。
资本资产定价模型(CAPM) 是用于确定是否在一个特定资产的投资是值得的。
本文将说明单变量和多变量金融时间序列的不同模型,特别是条件均值和条件协方差矩阵、波动率的模型。
具有单个隐藏层和滞后输入的前馈神经网络,可以用于预测单变量时间序列。
在本教程中,您将学习如何在R中创建神经网络模型。
本文估计实际GDP增长率的两状态Markov区制转换动态回归模型 。
如果您可以写出模型的似然函数,则 Metropolis-Hastings算法可以负责其余部分(即MCMC )。
机器学习算法可用于找到最佳值来交易您的指标。
在移动广告领域,移动APP广告因其独特的价值而受到广告商的青睐。
本示例说明如何使用长短期记忆(LSTM)网络对序列数据进行分类。
Stan是一种用于指定统计模型的概率编程语言。Stan通过马尔可夫链蒙特卡罗方法(例如No-U-Turn采样器,一种汉密尔顿蒙特卡洛采样的自适应形式)为连续变量模型提供了完整的贝叶斯推断。
在引入copula时,大家普遍认为copula很有趣,因为它们允许分别对边缘分布和相依结构进行建模。
MCMC是从复杂概率模型中采样的通用技术。
过程会随着时间的推移而发展,结果会发生变化。
最近我们被客户要求撰写关于时间序列预测的研究报告。时间序列预测问题是预测建模问题中的一种困难类型。
模型表现差异很大的可能原因是什么?换句话说,为什么在别人评估我们的模型时会失去稳定性?
最近我们被客户要求撰写关于ARMA-GARCH模型的研究报告。工业指数(DIJA)的价值基于每个组成公司的每股股票价格之和。
包含更多的预测变量不是免费的:在系数估算的更多可变性,更难的解释以及可能包含高度依赖的预测变量方面要付出代价。
有人已经表示有必要在战术资产配置(Tactical Asset Allocation, 简称TAA)策略中使用共同基金而不是ETF。
随着新型冠状病毒COVID-19的威胁遍及世界,我们生活在一个日益担忧的时代,本文用matlab分析COVID-19数据集。
最近我们被客户要求撰写关于分析高频金融数据波动率的研究报告。在学术界和金融界,分析高频财务数据的经济价值现在显而易见。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds