Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化
Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。
Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。
WeChat Tencent QQ email print 由Kaizong Ye,Sherry Deng撰写
由于某大学学生人数过多,助教不足,因此有必要对期中考试给每个学生的题目数量施加五道题的限制。
该项目包括:自 2000 年 1 月以来的股票价格数据。我们使用的是 Microsoft 股票。
一个简单的编码器-解码器LSTM神经网络应用于时间序列预测问题
本文演示了如何训练一个简单的卷积神经网络 (CNN) 来对 CIFAR 图像进行分类。
该数据与银行机构的直接营销活动相关,营销活动基于电话。
在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?
在之前的文章中,我们研究了许多使用 多输出回归分析的方法。
本文描述了一个模型,该模型解释了交易的聚集到达,并展示了如何将其应用于比特币交易数据。
在这篇文章中,我想介绍 现代 投 资组合理论 (MPT)_、 _有效边界 以及它对投资组合构建的一些影响。
WeChat Tencent QQ email print 由Kaizong Ye,Sherry Deng撰写
本文,我们说明了贝叶斯学习和 计算统计一些结果。
通过训练具有小中心层的多层神经网络重构高维输入向量,可以将高维数据转换为低维代码。
Metropolis-Hastings 算法对概率分布进行采样以产生一组与原始分布成比例的轨迹。
这篇文章介绍了一类离散随机波动率模型。
变量选择是高维统计建模的重要组成部分。
支持向量回归(SVR)是一种回归算法,它应用支持向量机(SVM)的类似技术进行回归分析。
谱聚类是一种将数据的相似矩阵的谱应用于降维的技术。
最近我们被客户要求撰写关于量化交易的研究报告。
配置神经网络很困难,因为没有关于如何去做的好的理论。
Boosting指的是机器学习元算法系列,它将许多 “弱 “分类器的输出合并成一个强大的 “集合”,其中每个弱分类器单独的错误率可能只比随机猜测好一点。
这篇文章讨论了自回归综合移动平均模型 (ARIMA) 和自回归条件异方差模型 (GARCH) 及其在股票市场预测中的应用。
在这篇文章中,我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术 。
在今天产品高度同质化的品牌营销阶段,企业与企业之间的竞争集中地体现在对客户的争夺上。
Boosting 是一类集成机器学习算法,涉及结合许多弱学习器的预测。
在这篇文章中,我将集中讨论一个给定一个短数据序列的推断概率的例子。
在量化金融中,我们学习了各种时间序列分析技术以及如何使用它们。
在这篇文章中,我将扩展从数据推断概率的示例,考虑 0 和 1之间的所有(连续)值,而不是考虑一组离散的候选概率。
T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。
关联规则学习 在机器学习中用于发现变量之间的有趣关系。
时间序列是以固定时间_区间_记录的观察序列。
本文描述了训练支持向量回归模型的过程,该模型用于预测基于几个天气变量、一天中的某个小时、以及这一天是周末/假日/在家工作日还是普通工作日的用电量。
决策树是对例子进行分类的一种简单表示。
本文探索Python中的长短期记忆(LSTM)网络,以及如何使用它们来进行股市预测。
简单地说,copulas是具有均匀边际的联合分布函数。
降维是在我们处理包含过多特征数据的大型数据集时使用的,提高计算速度,减少模型大小,并以更好的方式将巨大的数据集可视化。这种方法的目的是保留最重要的数据,同时删除大部分的特征数据。
我们可以很容易地用Keras序列模型拟合回归数据并预测测试数据。
最近我们被客户要求撰写关于使用长短期记忆网络(LSTM)来拟合一个不稳定的时间序列的研究报告。
项目背景:银行的主要盈利业务靠的是贷款,这些客户中的大多数是存款大小不等的责任客户(存款人)。
回归算法最小角回归(LARS)通过高维数据的线性组合提供变量。
多项式回归是独立x变量和因果y变量之间的非线性关系。
VaR是 “风险价值 “的缩写,是许多公司和银行用来确定其公司内部金融风险水平的工具。风险值是为公司的投资而计算的,也可能是为检查银行或公司所管理的投资组合的风险水平。
Python计算获得多资产投资组合的风险度量。
基本的Prophet模型是一个可分解的单变量时间序列模型,结合了趋势、季节性和节假日效应。
本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。
资产价格具有随时间变化的波动性(逐日收益率的方差)。
本文学习创建时间序列预测的步骤,关注Dickey-Fuller检验、指数加权平均(EWMA)和ARIMA(自回归移动平均)模型,从理论上学习这些概念以及它们在python和R中的实现。
最近我们被客户要求撰写关于预测销量时间序列的研究报告。指数平滑模型是基于对数据趋势和季节性的描述,而ARIMA模型则是为了描述数据的自相关性。
时间序列 被定义为一系列按时间顺序索引的数据点。时间顺序可以是每天,每月或每年。
预测股价已经受到了投资者,政府,企业和学者广泛的关注。然而,数据的非线性和非平稳性使得开发预测模型成为一项复杂而具有挑战性的任务。
时间序列为预测未来数据提供了方法。根据先前的值,时间序列可用于预测经济,天气的趋势。
假设我们期望因变量由潜在协变量子集的线性组合确定。
最近我们被客户要求撰写关于时间序列预测的研究报告。时间序列预测问题是预测建模问题中的一种困难类型。
模型表现差异很大的可能原因是什么?换句话说,为什么在别人评估我们的模型时会失去稳定性?
风险价值(VaR)用于尝试量化指定时间范围内公司或投资组合中的财务风险水平。VaR提供了一段时间内投资组合的最大损失的估计,您可以在各种置信度水平上进行计算。
在数据科学学习之旅中,我经常处理日常工作中的时间序列数据集,并据此做出预测。
深度学习的预测建模是现代开发人员需要了解的一项技能。
在本教程中,我们将讨论一种非常强大的优化(或自动化)算法,即网格搜索算法。
使用ARIMA模型,您可以使用序列过去的值预测时间序列。
ARIMA模型是一种流行的且广泛使用的用于时间序列预测的统计方法。
我想研究如何使用pymc3在贝叶斯框架内进行线性回归。根据从数据中学到的知识进行推断。
在强化学习中,我们有兴趣确定一种最大化获取奖励的策略。假设环境是马尔可夫决策过程 (MDP)的理想模型 ,我们可以应用动态编程方法来解决强化学习问题。
用户和产品的潜在特征编写推荐系统矩阵分解工作原理使用潜在表征来找到类似的产品。
最近我们被客户要求撰写关于决策树分类的研究报告。将使用著名的iris数据集,该数据集对各种不同的iris类型进行各种测量。
特征提取。但是这里我们需要更深入的数据清理。数据清理是在数据集,表格,文本等上完成的。如何在图像上完成?
最近我们被客户要求撰写关于开发具有多个输出的文本分类模型的研究报告。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds