t检验和非正态性的鲁棒性
t检验和非正态性的鲁棒性
t检验和非正态性的鲁棒性
可以从许多统计软件包中运行Stan。到目前为止,我一直在从R运行Stan。
R语言中绘制ROC曲线和PR曲线
主题建模是一种在大量文档中查找抽象主题的艺术方法。
copula是将多变量分布函数与其边际分布函数耦合的函数,通常称为边缘。
sas文本挖掘案例:如何使用SAS计算Word Mover的距离
R语言岭回归ridge regression分析住房价格报告
在依赖模型得出结论或预测未来结果之前,我们应尽可能检查我们假设的模型是否正确指定。
近年来,移动应用让用户体验到更多价值,但许多用户经常在使用该应用一次后卸载。仅打开一次的中国移动应用程序的百分比高达35%,用户打开应用程序的次数超过11次 这个比例仅为17.6%,因此大多数应用程序的使用和保留相对较低,“一次性应用”正在成为用户行为的趋势。
偶尔我想在R中的图表旁边绘制一个表格,例如,以显示图表本身的摘要统计数据。
用SAS进行泊松,零膨胀泊松和有限混合Poisson模型分析
R语言实现有限混合建模分析
混合模型是k个分量分布的混合,它们共同形成混合分布
四种最常见的聚类方法模型是层次聚类,k均值聚类,基于模型的聚类和基于密度的聚类
本文展示了R语言如何在生存分析与Cox回归中计算IDI,NRI指标 的例子。
根据生存曲线的估计,可以推断出相比组之间存活时间的差异,因此生存曲线非常有用,几乎可以在每个生存分析中看到。
R语言混合时间预测对时间序列进行点估计
这场灾难以拯救“妇女和儿童第一”而闻名,所以让我们来看看性别和年龄变量。
Python使用矩阵分解法找到类似的音乐
在本文中,我将介绍ARMA,ARIMA(Box-Jenkins),SARIMA和ARIMAX模型如何用于预测给定的时间序列数据。
R语言ggplot2 对Facebook用户数据可视化分析
代写R语言assignment经常用到的“万能”词汇分享!
代写python assignment经常用到的“万能”词汇分享!3天入门!
用Python粒度分析及其在沉积学中应用研究
神经网络是一种基于现有数据创建预测的计算系统。
判别分析是可用于分类和降维的方法。
用TensorFlow实现MNIST
对于我的可视化类,选择文本作为我的最终项目“数据集”是一个简单的选择。该文有大约175,000个单词,分为42章。我在网上找到了这本书的原始文本版本并开始工作。
通过分析文本和共同作者社交网络来研究社会科学、计算机和信息学方面的出版物。
matlab利用PLSR和支持向量回归分析红树林叶面化学的高光谱分析
随机过程对定量融资的许多方面都很有用,包括但不限于衍生品定价,风险管理和投资管理。
A telephone company is interested in determining which customer characteristics are useful for predicting churn, customers who will leave their service.
此示例显示如何用R语言进行特征选择——逐步回归
生存分析对应于一组统计方法,用于调查感兴趣事件发生所花费的时间。
本文是我们通过时间序列和ARIMA模型预测拖拉机销售的制造案例研究示例。
R语言markov switching model马尔可夫转换分析研究水资源
对商业周期的分析需要提取时间序列的周期性成分,该时间序列通常也受到诸如潜在趋势或噪声等其他因素的影响。
研究煤矿隐患数据的挖掘以实现海量隐患数据的有效利用,在分析矿山数据挖掘枝术和煤矿隐患数据特点的基础上,提出煤矿隐患数据挖掘是矿山数字化的重要组成部分
在这篇文章中,我们看看什么是渠道归因,以及它如何与马尔可夫链的概念联系起来。
最近我们被客户要求撰写关于2SLS的研究报告。
R语言通过WinBUGS对MGARCH和MSV模型进行贝叶斯估计和比较
维度规约(降维)算法在WEKA中应用
R语言做复杂金融产品的几何布朗运动的模拟
在这篇文章中,我将介绍用于Latent Dirichlet Allocation(LDA)的lda Python包的安装和基本用法。
在本文中,我们通过一个名为WinBUGS的免费贝叶斯软件,可以很容易地完成基于似然的多变量随机波动率(SV)模型的估计和比较。
R语言中实现层次聚类模型
R语言数据的收益率和可能的波动性交易
R中针对高频数据的添加包highfrequency,用于组织高频数据, 高频数据的清理、整理,高频数据的汇总,使用高频数据建立相关模型 都非常方便。但是其中数据输入的过程中,会使用到包里的函数convert()。该函数支持三类的高频数据:
已有大量关于预测高频波动的文献,但大多数仅根据统计误差评估预测。
R语言聚类算法的应用实例
在本文中,我们将在贝叶斯框架中引入回归建模,并使用PyMC3 MCMC库进行推理。
Iris鸢尾花数据集,内容摘自百度百科:Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。
R语言对MNIST数据集分析:探索手写数字分类
matlab脉冲响应图的时域特征
为了方便起见,这些模型通常简称为TAR模型。这些模型捕获了线性时间序列模型无法捕获的行为,例如周期,幅度相关的频率和跳跃现象。
在本文中,我们将以Scikit-learn的决策树和随机森林预测NBA获胜者。
时间序列建模三部曲
机器学习中需要把数据分为训练集和测试集,因此如何划分训练集和测试集就成为影响模型效果的重要因素。本文介绍一种常用的划分最优训练集和测试集的方法——k折交叉验证。”
R语言深度学习不同神经网络模型对比分析案例
与Rshiny相关的主要原因是它的内置交互性。我希望用户只是将鼠标悬停在数据上,然后看到一段描述上一年变化的文字。
R语言推特twitter转发可视化分析,包含关键词“生物信息学”的推文示例
众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系
R语言实现:混合正态分布EM最大期望估计法
此示例演示了使用具有胖尾边缘分布的多变量copula模拟计算投资组合的风险价值和条件风险值(预期缺口)。
R语言填补缺失的数据
顾名思义,排队论是对用于预测队列长度和等待时间的长等待线的研究。
贝叶斯分析的许多介绍使用相对简单的教学实例 。虽然这可以很好地介绍贝叶斯原理,但将这些原则扩展到回归并不是直截了当的。
从海量数据中发现潜在标志指标, 需要借助多变量模式识别方法。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds