R语言对用电负荷时间序列数据进行K-medoids聚类建模和广义加性/相加模型(GAM)回归
通过对用电负荷进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。
通过对用电负荷进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。
R语言中的偏最小二乘PLS回归算法
这里向您展示如何在R中使用glmnet包进行岭回归(使用L2正则化的线性回归),并使用模拟来演示其相对于普通最小二乘回归的优势。
r语言二元期权barrier option实现案例
据外媒报道,特朗普上任8天以来引发51%美国人的不满,42%美国人赞同新总统的政策。该项调查共有1500名成年美国人,误差为3%。
地铁不仅是交通轨道,更是一座城市的血脉,是记录和观察城市经济生活最重要的切入点之一,地铁口的特征是,上下地铁,这类人群都是快消人群。
对于非结构化的网站中文评论信息,r的中文词频包可能是用来挖掘其潜在信息的好工具,要分析文本内容,最常见的分析方法是提取文本中的词语,并统计频率。
R语言Bass模型进行销售预测
通常,当我们在线搜索信息时,有两种主要方法:关键字 – 使用搜索引擎并输入与我们想要查找的内容相关的单词
链接。链接的页面可能共享相似或相关的内容。
对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率。
金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量。然而,资产波动率的类型有多种。
波动率是众多定价和风险模型中的关键参数,例如BS定价方法或风险价值的计算。
我们在这里讨论所谓的“分段线性回归模型”,因为它们利用包含虚拟变量的交互项。
正则化路径是针对正则化参数λ的值网格处的套索或弹性网络罚值计算的。该算法速度极快,可以利用输入矩阵中的稀疏性x。
最近我们被客户要求撰写关于采样算法的研究报告。第一步,我们创建一些测试数据,用来拟合我们的模型。
最近我们被客户要求撰写关于面板平滑转换回归(PSTR)的研究报告。建模过程包括三个阶段:表述,估计和评估。
加速R语言代码的策略
有许多分层数据的例子。例如,地理数据通常按层次分组,可能是全球数据,然后按国家和地区分组 。一个生物学的例子是按物种分组的动物或植物的属性,或者属于一个级别的属性,然后是家族。一个商业例子可能是业务部门和细分的员工满意度。
这次,我们将使用k-Shape时间序列聚类方法检查与我们有业务关系的公司的股票收益率的时间序列。
R语言参数检验 :需要多少样本?如何选择样本数量
R语言检验独立性:卡方检验(Chi-square test)和费舍尔精确检验分析案例报告
使用基于分类的递归分区算法来拟合基于树的模型得到的模型类似于推荐的ř包rpart包产生的模型支持分类型树和回归型树。
最近我们被客户要求撰写关于时间序列的研究报告。分析时间序列数据的第一件事就是将其读入R,并绘制时间序列。
R语言使用马尔可夫链Markov Chain, MC来模拟抵押违约
ImageMagick库具有大量功能。本文简要介绍了最重要的入门概念。
本文考虑R语言的EM算法和高斯混合模型实现。
优化是一种为所有可能的解决方案找到给定问题的最佳解决方案的技术。
R语言用Backfitting MCMC抽样算法进行贝叶斯推理案例
检验对的形式 (x1,x2)(X1,X2) 出现在两种情况中:
R语言离群值处理分析
最近我们被要求撰写关于金融时间序列的arma-garch-copula的调查报告。
这里向您展示如何在R中使用glmnet包进行岭回归(使用L2正则化的线性回归),并使用模拟来演示其相对于普通最小二乘回归的优势。
R语言估计时变VAR模型时间序列的实证研究分析案例
概率编程使我们能够实现统计模型,而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用。
时变参数VAR随机模型是一种新的计量经济学方法
本文在iris数据集上展示了如何使用R软件来建立Hierarchical Cluster Analysis层次聚类分析(更好的可视化和灵敏度分析)。
最近我们被客户要求撰写关于ARMA-GARCH-VaR模型的研究报告。
R语言中的Wilcoxon符号秩检验与配对学生t检验
最近我们被客户要求撰写关于混合模型的研究报告。由于我们发现自己在工作中越来越多地使用这些模型,我们开发了一套R shiny工具来简化和加速与对象交互的lme4常见任务。
R语言用rle,svm和rpart进行时间序列预测
对于熟悉线性回归拟合结构方程模型的分析师来说,在R环境中,拟合结构方程模型涉及学习新的建模语法,新的绘图语法以及通常是新的数据输入方法。
在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。
处理分组数据和复杂层次结构的分析师,从嵌入在参与者中的测量,嵌套在州内的县或嵌套在教室内的学生,经常发现他们需要建模工具来反映他们数据的这种结构。
R语言CRAN软件包Meta分析
R语言 线性混合效应模型实战案例
聚类分析算法很多,比较经典的有k-means和层次聚类法。
澳大利亚在2008 – 2009年全球金融危机期间发生了这种情况。政府发布了一揽子刺激计划,其中包括2008年12月的现金支付,恰逢圣诞节支出。
风险价值是衡量与投资组合相关的风险水平的统计方法。
本文的目的是对如何在R中进行生存分析进行简短而全面的评估。
本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响。
我已经准备了一个文件,其中包含四个用电时间序列来进行分析。数据操作将由data.table程序包完成。
“预测非常困难,特别是关于未来”。-丹麦物理学家尼尔斯·波尔(Neils Bohr)
所述配对双样品的Wilcoxon检验一种的非参数检验,其可以被用于比较样品的两个独立数据。
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。
最近我们被客户要求撰写关于马尔可夫链蒙特卡罗MCMC模型的研究报告。这只是众多算法之一。这个术语代表“马尔可夫链蒙特卡洛”,因为它是一种使用“马尔可夫链”(我们将在后面讨论)的“蒙特卡罗”(即随机)方法。
让我们看一个经济学的例子:假设你想购买一定数量q的特定产品。
本文显示了如何基于潜在的ARMA-GARCH过程(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。
逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x)。
可以使用逐步回归过程确定多元逻辑回归。此函数选择模型以最小化AIC。
和宏观经济数据不同,金融市场上多为高频数据,比如股票收益率序列。
这个问题涉及马蹄蟹研究的数据。
混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对因变量的影响。
本文显示了如何基于潜在的ARMA-GARCH模型(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。
新常态下银行信贷风险预警之道
马云说:“员工离职的原因总是只有两个:钱,没有到位;心委屈了。”
风险价值是衡量与投资组合相关的风险水平的统计方法。
Twitter是一个流行的社交网络,这里有大量的数据等着我们分析。Twitter R包是对twitter数据进行文本挖掘的好工具。 本文是关于如何使用Twitter R包获取twitter数据并将其导入R,然后对它进行一些有趣的数据分析。
随着Web技术的快速发展,越来越多的数据科学家和开发人员倾向于使用Web应用程序进行数据分析和可视化。