Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘实例
作为数据挖掘的一个重要研究方向—关联规则用于发现数据项之间隐含的深层次的关联
作为数据挖掘的一个重要研究方向—关联规则用于发现数据项之间隐含的深层次的关联
某交通工程专业博士生想要研究不同因素对通勤交通方式选择的影响。
如果_真实_模型包括_X_ 1 和_X_ 2 ,但我们忘记了_X_ 2,那么 – 在某些情况下 – 对_X_的估计将会有偏差。OVB 需要:cor( X 1, X 2)!= 0 和 cor( X 1, y ) != 0
本文展示了如何通过矩量的广义方法和广义经验似然来估计模型。
本文用爬虫采集了汽车销售数据,后来对其进行了扩展,创建这个数据集,其中包括境内的所有二手车辆或者经销商车辆条目数据。
市场风险指的是由金融市场中资产的价格下跌或价格波动增加所导致的可能损失。
建立重庆市经济指标发展体系,以重庆市一小时经济圈作为样本,运用因子分析方法进行实证分析
本文展示了如何使用 R 构建Bootstrap自举置信区间的示例。
本文应用R软件技术,通过在世界银行网站上查阅的世界人口历史数据,分别利用logistic模型、ARFMA模型、ARIMA模型、时间序列模型对从2016到2100年的世界人口进行预测。
随着互联网和电子商务的发展,人们已经习惯了网上购物。
考虑我们从实验、事件等中观察到一些数据 y 的情况。
在拟合 GLM(并检查残差)之后,可以使用 z 检验一一检验估计参数的显着性,即将估计值与其标准误差进行比较。
数据包含有关葡萄牙“Vinho Verde”葡萄酒的信息。该数据集有1599个观测值和12个变量,分别是固定酸度、挥发性酸度、柠檬酸、残糖、氯化物、游离二氧化硫、总二氧化硫、密度、pH值、硫酸盐、酒精和质量。
本文在相对简单的数据集上探索不同的时间序列技术。
波动率是一个重要的概念,在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR)。
此示例说明如何使用长短期记忆 (LSTM) 网络预测时间序列
WeChat Tencent QQ email print 由Kaizong Ye,Liao Bao撰写 在我
本文开发和应用用于生物序列分析的隐马尔可夫模型和HMM。
此示例说明如何从 VEC( q ) 模型生成 Monte Carlo 预测。
本文包含一些直观的示例来说明 copula 理论的核心概念。
实现一个简单的 Metropolis-Hastings MCMC 从该模型的后验分布中采样。
金融资产/证券已使用多种技术进行建模。
时序数据的聚类方法
使用 ML 进行提升建模和因果推理。
随机森林是决策树的集合。在这篇文章中,我将向您展示如何从随机森林中可视化决策树。
该数据由Hopkins 大学根据世界各国提供的新病例数据提供。
Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。
豆瓣已经成为国内影迷和影评人的聚集地。
WeChat Tencent QQ email print 由Kaizong Ye,Sherry Deng撰写
在进行交叉验证之前,很自然地说“我会预烧 50%(比如说)我的数据来训练一个模型,然后用剩下的来拟合模型”。
零膨胀泊松回归用于对超过零计数的计数数据进行建模。
风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量,也被投资组合经理等从业者用来解释未来市场风险。
在本教程中,我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法。
对于模拟股票价格,几何布朗运动 (GBM) 是 事实上的首选 模型。
由于某大学学生人数过多,助教不足,因此有必要对期中考试给每个学生的题目数量施加五道题的限制。
本文是在 R 中使用 Keras 的LSTM神经网络分类简单介绍。
在本笔记本中,我们向读者介绍了基本的随机波动率模型,并通过连续顺序重要性重采样讨论了它们的估计。我们使用收益率数据集来讨论 CSIR 在随机波动率模型估计中的实现和性能。
在这个项目中,我讨论了如何使用主成分分析 (PCA) 进行简单的预测。
理解世界,我们可以从相关性的角度去描述,统计,机器学习,很多问题都是从相关的角度去描述的。
matlab软件在拟合数据时使用最小二乘法。
指数分布是泊松过程中事件之间时间的概率分布,因此它用于预测到下一个事件的等待时间。
该项目包括:自 2000 年 1 月以来的股票价格数据。我们使用的是 Microsoft 股票。
一个简单的编码器-解码器LSTM神经网络应用于时间序列预测问题
主题将紧紧围绕以下几点:有哪些书籍值得推荐?一般书籍的价格是多少?一本书的评分和评论数量之间是否存在某种关系?
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
Metropolis Hastings 算法是一种非常简单的算法,用于从难以采样的分布中生成样本。
此示例说明如何使用长短期记忆 (LSTM) 网络对序列数据的每个时间步长进行分类。
线性模型是统计学的基础,但它的意义远不止用尺子在几个点上画一条线。
极值理论对样本尾部分布的极值指数的估计方法主要有两类:半参数方法和全 参数方法,前者主要是基于分布尾部的 Hill 估计量,后者则主要基于广义帕累托分布。
Box 等人的开创性工作(1994) 在自回归移动平均模型领域的相关工作为波动率建模领域的相关工作铺平了道路,分别由 Engle (1982) 和 Bollerslev (1986) 引入了 ARCH 和 GARCH 模型。
本文演示了如何训练一个简单的卷积神经网络 (CNN) 来对 CIFAR 图像进行分类。
该数据与银行机构的直接营销活动相关,营销活动基于电话。
结构方程建模 (SEM) 是一种全面而灵活的方法,包括在假设模型中研究变量之间的关系。
在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?
GBDT梯度提升模型由多个决策树组成。
弹性网络正则化同时应用 L1 范数和 L2 范数正则化来惩罚回归模型中的系数。
本文使用的数据集记录了 1236 名新生婴儿的体重,以及他们母亲的其他协变量。
纪录片能够真实、详尽地反映一个地区的风貌,展示经济发展和社会进步。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法,用于描述生命过程中的暴露,它将异质人群简化为同质模式或类别。
我们首先介绍扩展 Rasch 模型的方法论,然后是一般程序描述和应用主题,包括简单的 Rasch 模型、评级量表模型、部分信用模型及其线性扩展。
当您处理金融时间序列时,我们通常可以获得相对高频的观察结果。
在之前的文章中,我们研究了许多使用 多输出回归分析的方法。
假设调查人员有兴趣检查减肥干预方法的三个组成部分。 WeChat Tencent QQ email print
. 您想知道它是否与(例如)零显着不同。一般来说,人们会查看他们选择的软件报告的统计数据或 p.value。问题是,这个 p.value 计算依赖于因变量的分布。如果没有不同的说明,您的软件假定为正态分布,那是怎么回事?
对于那些不熟悉“配对交易”概念的人来说几句话。
本文描述了一个模型,该模型解释了交易的聚集到达,并展示了如何将其应用于比特币交易数据。
从广义上讲,复杂的模型可以实现很高的预测准确性。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds