R语言中绘制ROC曲线和PR曲线
R语言中绘制ROC曲线和PR曲线
R语言中绘制ROC曲线和PR曲线
copula是将多变量分布函数与其边际分布函数耦合的函数,通常称为边缘。
R语言岭回归ridge regression分析住房价格报告
在依赖模型得出结论或预测未来结果之前,我们应尽可能检查我们假设的模型是否正确指定。
偶尔我想在R中的图表旁边绘制一个表格,例如,以显示图表本身的摘要统计数据。
R语言实现有限混合建模分析
混合模型是k个分量分布的混合,它们共同形成混合分布
四种最常见的聚类方法模型是层次聚类,k均值聚类,基于模型的聚类和基于密度的聚类
本文展示了R语言如何在生存分析与Cox回归中计算IDI,NRI指标 的例子。
根据生存曲线的估计,可以推断出相比组之间存活时间的差异,因此生存曲线非常有用,几乎可以在每个生存分析中看到。
R语言混合时间预测对时间序列进行点估计
这场灾难以拯救“妇女和儿童第一”而闻名,所以让我们来看看性别和年龄变量。
在本文中,我将介绍ARMA,ARIMA(Box-Jenkins),SARIMA和ARIMAX模型如何用于预测给定的时间序列数据。
R语言ggplot2 对Facebook用户数据可视化分析
代写R语言assignment经常用到的“万能”词汇分享!
神经网络是一种基于现有数据创建预测的计算系统。
判别分析是可用于分类和降维的方法。
通过分析文本和共同作者社交网络来研究社会科学、计算机和信息学方面的出版物。
A telephone company is interested in determining which customer characteristics are useful for predicting churn, customers who will leave their service.
此示例显示如何用R语言进行特征选择——逐步回归
生存分析对应于一组统计方法,用于调查感兴趣事件发生所花费的时间。
本文是我们通过时间序列和ARIMA模型预测拖拉机销售的制造案例研究示例。
R语言markov switching model马尔可夫转换分析研究水资源
对商业周期的分析需要提取时间序列的周期性成分,该时间序列通常也受到诸如潜在趋势或噪声等其他因素的影响。
研究煤矿隐患数据的挖掘以实现海量隐患数据的有效利用,在分析矿山数据挖掘枝术和煤矿隐患数据特点的基础上,提出煤矿隐患数据挖掘是矿山数字化的重要组成部分
最近我们被客户要求撰写关于2SLS的研究报告。
R语言通过WinBUGS对MGARCH和MSV模型进行贝叶斯估计和比较
R语言做复杂金融产品的几何布朗运动的模拟
R语言中实现层次聚类模型
R中针对高频数据的添加包highfrequency,用于组织高频数据, 高频数据的清理、整理,高频数据的汇总,使用高频数据建立相关模型 都非常方便。但是其中数据输入的过程中,会使用到包里的函数convert()。该函数支持三类的高频数据:
R语言聚类算法的应用实例
R语言对MNIST数据集分析:探索手写数字分类
为了方便起见,这些模型通常简称为TAR模型。这些模型捕获了线性时间序列模型无法捕获的行为,例如周期,幅度相关的频率和跳跃现象。
机器学习中需要把数据分为训练集和测试集,因此如何划分训练集和测试集就成为影响模型效果的重要因素。本文介绍一种常用的划分最优训练集和测试集的方法——k折交叉验证。”
R语言深度学习不同神经网络模型对比分析案例
与Rshiny相关的主要原因是它的内置交互性。我希望用户只是将鼠标悬停在数据上,然后看到一段描述上一年变化的文字。
R语言推特twitter转发可视化分析,包含关键词“生物信息学”的推文示例
r语言中使用Bioconductor 分析芯片数据
R语言填补缺失的数据
顾名思义,排队论是对用于预测队列长度和等待时间的长等待线的研究。
TMA三均线期指高频交易策略的R语言实现
R语言rcurl抓取问财财经搜索网页股票数据
从海量数据中发现潜在标志指标, 需要借助多变量模式识别方法。
windows中用命令行执行R语言命令
R语言使用特征工程泰坦尼克号数据分析应用案例
在文本挖掘中,我们经常收集一些文档集合,例如博客文章或新闻文章,我们希望将其分成组,以便我们可以分别理解它们。主题建模是对这些文档进行无监督分类的一种方法,类似于对数字数据进行聚类,即使我们不确定要查找什么,也可以找到分组。
如果我们对所有这些模型的结果进行平均,我们有时可以从它们的组合中找到比任何单个部分更好的模型。这就是集成模型的工作方式。
阈值模型用于几个不同的统计领域,而不仅仅是时间序列。
尽管航空业强劲,但为了保持持续增长以及作为跨地区行业领导者的持续地位,必须时刻保持警惕,以跟上客户需求。
只要有金融经济学家,金融经济学家一直在寻找能够预测股票收益的变量。
R语言markov switching model马尔可夫转换模型研究案例
当时间序列数据的频率高于季度或月度时,许多预测程序在分析季节性影响方面遇到了障碍。
R语言Copula的贝叶斯非参数估计
一个加油站有一个加油桩,没有空间供车辆等待(如果车辆到达,加油桩被占用,它就会离开)。
数据来自国际足联的视频游戏FIFA 。游戏的特点是在游戏的各个方面评价每个球员的能力。
通过对用电负荷进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。
R语言中的偏最小二乘PLS回归算法
这里向您展示如何在R中使用glmnet包进行岭回归(使用L2正则化的线性回归),并使用模拟来演示其相对于普通最小二乘回归的优势。
r语言二元期权barrier option实现案例
据外媒报道,特朗普上任8天以来引发51%美国人的不满,42%美国人赞同新总统的政策。该项调查共有1500名成年美国人,误差为3%。
地铁不仅是交通轨道,更是一座城市的血脉,是记录和观察城市经济生活最重要的切入点之一,地铁口的特征是,上下地铁,这类人群都是快消人群。
对于非结构化的网站中文评论信息,r的中文词频包可能是用来挖掘其潜在信息的好工具,要分析文本内容,最常见的分析方法是提取文本中的词语,并统计频率。
R语言Bass模型进行销售预测
通常,当我们在线搜索信息时,有两种主要方法:关键字 – 使用搜索引擎并输入与我们想要查找的内容相关的单词
链接。链接的页面可能共享相似或相关的内容。
对于某企业新用户,会利用大数据来分析该用户的信息来确定是否为付费用户,弄清楚用户属性,从而针对性的进行营销,提高运营人员的办事效率。
金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量。然而,资产波动率的类型有多种。
波动率是众多定价和风险模型中的关键参数,例如BS定价方法或风险价值的计算。
我们在这里讨论所谓的“分段线性回归模型”,因为它们利用包含虚拟变量的交互项。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds