R语言基于递归神经网络RNN的温度时间序列预测
在本文中,我们将介绍三种提高循环神经网络性能和泛化能力的高级技术。
在本文中,我们将介绍三种提高循环神经网络性能和泛化能力的高级技术。
模型表现差异很大的可能原因是什么?换句话说,为什么在别人评估我们的模型时会失去稳定性?
包含更多的预测变量不是免费的:在系数估算的更多可变性,更难的解释以及可能包含高度依赖的预测变量方面要付出代价。
在回归模型研究中,我们将讨论优化,而经典工具就是所谓的共轭。给定函数f:Rp→R,其共轭值为函数f ⋆:Rp→R使得
随着越来越多的数据被数字化,获取信息变得越来越困难。我们在本文中重点关注的一个示例是评估公司面临的不同风险领域。
最近,我们继续对时间序列建模进行探索,研究时间序列模型的自回归和条件异方差族。我们想了解自回归移动平均值(ARIMA)和广义自回归条件异方差(GARCH)模型。它们在量化金融文献中经常被引用。
当获得奇异拟合时,这通常表明模型过度拟合-也就是说,随机效应结构太复杂而无法由数据支持,这自然导致建议删除随机效应中最复杂的部分结构(通常是随机斜率)。这种方法的好处在于,它生成了一个更加简约的模型,但并没有过度拟合
公司必须使用细分技术才能生存。现在,问题在于,我们不能确定指数衰减是溢价随年龄变化的正确方法。一种替代方法是使用非参数技术来可视化年龄对索赔频率的真实影响。
神经网络是一种非常通用的灵活预测模型,可用于解决各种问题,包括分类,降维和回归。
通常,我们在回归模型中一直说的一句话是“ 请查看一下数据 ”。
在之前的课堂上,我们已经看到了如何可视化多元回归模型(带有两个连续的解释变量)。
本文为非人寿保险课程的一部分,该示例对1900 -2005年间的“ 美国标准化飓风损失 ”数据集进行研究(2008)。我们使用了广义线性模型和帕累托分布Pareto distributions分析。
上周在 非人寿保险课程中,我们了解了广义线性模型的理论
对精算科学来说,当我们处理独立随机变量的总和时,特征函数很有趣,因为总和的特征函数是特征函数的乘积。
在本教程中,我们将讨论一种非常强大的优化(或自动化)算法,即网格搜索算法。
拨号音信号的变模分解,首先创建一个以4 kHz采样的信号
对于许多模型,例如逻辑模型,没有共轭先验分布。因此,吉布斯采样不适用。
R2WinBUGS软件包提供了从R调用WinBUGS的便捷功能。
用户和产品的潜在特征编写推荐系统矩阵分解工作原理使用潜在表征来找到类似的产品。
深度学习无处不在。在本文中,我们将使用Keras进行文本分类。
深度学习技术已用于各种文本生成任务,例如写作诗歌,生成电影脚本甚至创作音乐。
缺失值被认为是预测建模的首要障碍。因此,掌握克服这些问题的方法很重要。
使用R和Python进行分析的主要好处之一是,它们充满活力的开源生态系统中总是有新的和免费提供的服务。
R语言最优聚类数目k改进kmean聚类算法
在逻辑回归中,我们将二元因变量Y_i回归到协变量X_i上。
本文使用R语言进行stan泊松回归Poisson regression。
这是一个非常简化的例子。我模拟了1,000个计数观察值,平均值为1.3。
R语言有RStan的多维验证性因子分析(CFA)
R语言多臂试验 – 我们应该考虑多重性吗?
主题建模是一种在大量文档中查找抽象主题的艺术方法。
判别分析是可用于分类和降维的方法。
A telephone company is interested in determining which customer characteristics are useful for predicting churn, customers who will leave their service.
本文是我们通过时间序列和ARIMA模型预测拖拉机销售的制造案例研究示例。
此示例演示了使用具有胖尾边缘分布的多变量copula模拟计算投资组合的风险价值和条件风险值(预期缺口)。
我们将首先介绍主题建模和t-SNE,然后将这些技术应用于两个数据集:20个新闻组和推文。
状态转换模型,尤其是马尔可夫转换(MS)模型,被认为是识别时间序列非线性的不错的方法。
R语言markov switching model马尔可夫转换模型研究案例
马云说:“员工离职的原因总是只有两个:钱,没有到位;心委屈了。”
通常,当我们在线搜索信息时,有两种主要方法:关键字 – 使用搜索引擎并输入与我们想要查找的内容相关的单词
链接。链接的页面可能共享相似或相关的内容。
此示例显示如何使用估计复合条件均值和方差模型estimate。
某些策略在波动剧烈的市场中表现良好,而其他策略则需要强劲而平稳的趋势,否则将面临长时间的下跌风险。
最近我们被客户要求撰写关于采样算法的研究报告。第一步,我们创建一些测试数据,用来拟合我们的模型。
使用基于分类的递归分区算法来拟合基于树的模型得到的模型类似于推荐的ř包rpart包产生的模型支持分类型树和回归型树。
最近我们被客户要求撰写关于时间序列的研究报告。分析时间序列数据的第一件事就是将其读入R,并绘制时间序列。
本文考虑R语言的EM算法和高斯混合模型实现。
我们最近有一个很棒的机会与一位伟大的客户合作,要求Business Science构建一个适合他们需求的开源异常检测算法。
多层线性模型(Hierarchical Linear Model,HLM),也叫多水平模型(Multilevel Model,MLM),是社会科学常用的高级统计方法之一。
时变参数VAR随机模型是一种新的计量经济学方法
处理分组数据和复杂层次结构的分析师,从嵌入在参与者中的测量,嵌套在州内的县或嵌套在教室内的学生,经常发现他们需要建模工具来反映他们数据的这种结构。
R语言 线性混合效应模型实战案例
风险价值是衡量与投资组合相关的风险水平的统计方法。
最近我们被客户要求撰写关于马尔可夫链蒙特卡罗MCMC模型的研究报告。这只是众多算法之一。这个术语代表“马尔可夫链蒙特卡洛”,因为它是一种使用“马尔可夫链”(我们将在后面讨论)的“蒙特卡罗”(即随机)方法。
此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性。
线性混合效应模型Linear Mixed-Effects Models的部分折叠Gibbs采样
混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对因变量的影响。
早在1995年比尔·盖茨就在《未来之路》里说过:未来没有配套智能家居的房子,就是毛坯房。
随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带。
马云说:“员工离职的原因总是只有两个:钱,没有到位;心委屈了。”
风险价值是衡量与投资组合相关的风险水平的统计方法。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds