数据分享|基于Python、Hadoop零售交易数据的Spark数据处理与Echarts可视化分析
案例数据集是在线零售业务的交易数据,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并使用Echarts做数据可视化。
案例数据集是在线零售业务的交易数据,采用Python为编程语言,采用Hadoop存储数据,采用Spark对数据进行处理分析,并使用Echarts做数据可视化。
最近我们被客户要求撰写关于租房数据分析的研究报告。利用 python 爬取链家网公开的租房数据
传统上,协整的测试是在非常长的时间内进行的,本案例研究A测试了1960-2010年期间T-Bill利率和国债收益率之间的平衡。
本文收集信息和数据,从多方面评估分析美光科技的市场走向,商业前景。
数据变得越来越重要,其核心应用“预测”也成为互联网行业以及产业变革的重要力量。
2020年疫情愈演愈烈,新冠的检测与确诊人数也急剧上飙,失控的疫情无疑给经济造成了巨大的打击,同时也极大的影响了就业市场。
预测股票价格,并在合适的时间产生交易策略实现收益,一直是一个热门的问题,到现在为止也提出了很多预测方法。
近段时间,美国总统大选引起了世界各国的关注。
WeChat Tencent QQ email print 由Haoran Chen撰写 对于两人竞选,因为对
随着互联网经济的迅猛发展,个人信贷规模在近年来呈现了爆炸式增长。
随着P2P网络金融平台的交易量的激增,其交易数据不能得到充分有效地利用。
河源市是国务院1988年1月7日批准设立的地级市,为了深入研究河源市公路交通与经济发展的关系,本文选取了1988-2014年河源市建市以来24年的地区生产总值(GDP)和公路通车里程(GL)的时间序列数据。
本文展示了如何通过矩量的广义方法和广义经验似然来估计模型。
市场风险指的是由金融市场中资产的价格下跌或价格波动增加所导致的可能损失。
建立重庆市经济指标发展体系,以重庆市一小时经济圈作为样本,运用因子分析方法进行实证分析
本文在相对简单的数据集上探索不同的时间序列技术。
波动率是一个重要的概念,在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR)。
本文开发和应用用于生物序列分析的隐马尔可夫模型和HMM。
此示例说明如何从 VEC( q ) 模型生成 Monte Carlo 预测。
本文包含一些直观的示例来说明 copula 理论的核心概念。
金融资产/证券已使用多种技术进行建模。
在本笔记本中,我们向读者介绍了基本的随机波动率模型,并通过连续顺序重要性重采样讨论了它们的估计。我们使用收益率数据集来讨论 CSIR 在随机波动率模型估计中的实现和性能。
该项目包括:自 2000 年 1 月以来的股票价格数据。我们使用的是 Microsoft 股票。
极值理论对样本尾部分布的极值指数的估计方法主要有两类:半参数方法和全 参数方法,前者主要是基于分布尾部的 Hill 估计量,后者则主要基于广义帕累托分布。
Box 等人的开创性工作(1994) 在自回归移动平均模型领域的相关工作为波动率建模领域的相关工作铺平了道路,分别由 Engle (1982) 和 Bollerslev (1986) 引入了 ARCH 和 GARCH 模型。
该数据与银行机构的直接营销活动相关,营销活动基于电话。
结构方程建模 (SEM) 是一种全面而灵活的方法,包括在假设模型中研究变量之间的关系。
在此数据集中,我们必须预测信贷的违约支付,并找出哪些变量是违约支付的最强预测因子?
当您处理金融时间序列时,我们通常可以获得相对高频的观察结果。
对于那些不熟悉“配对交易”概念的人来说几句话。
本文描述了一个模型,该模型解释了交易的聚集到达,并展示了如何将其应用于比特币交易数据。
从广义上讲,复杂的模型可以实现很高的预测准确性。
这篇文章是关于 copulas 和重尾的。
最近我们被客户要求撰写关于股票收益率时间序列的研究报告,包括一些图形和统计输出。在本文中,我们展示了 copula GARCH 方法拟合模拟数据和股票数据并进行可视化。
VARs的结构也允许联合检验多个方程的限制。
在这篇文章中,我想介绍 现代 投 资组合理论 (MPT)_、 _有效边界 以及它对投资组合构建的一些影响。
在多变量波动率预测中,我们有时会看到对少数主成分驱动的协方差矩阵建模,而不是完整的股票。
一只 股票的_beta_值通常意味着它与市场的关系,当市场变动 1%时,我们期望股票会发生多少百分比的变动。
配对交易提出的问题之一是股票的贝塔值相对于市场的不稳定估计。
在投资组合管理、风险管理和衍生品定价中,波动性起着重要作用。
“分位数自回归”,它是对时间序列域的重要扩展。
从广义上讲,我们可以将金融市场状况分为两类:牛市和熊市。
对于时间序列分析,有两种数据格式: ts (时间序列)和 xts (可扩展时间序列)。
这篇文章介绍了一类离散随机波动率模型。
2017 年年中,R 推出了 Keras 包 ,这是一个在 Tensorflow 之上运行的综合库,具有 CPU 和 GPU 功能。本文将演示如何在 R 中使用 LSTM 实现时间序列预测。
当一个序列遵循随机游走模型时,就说它是非平稳的。
分类树的一个常见用途是预测抵押贷款申请人是否会拖欠贷款。
今年的收益是否真的与典型年份的预期不同?
在事物的发展过程中,常表现出复杂的波动情况,即时而波动的幅度较缓,而又时常出现波动集聚性(VolatilitY clustering),在风险研究中经常遇到这种情况。
FF 模型通过回归除市场收益之外的几个变量的投资组合收益来扩展 CAPM。
最近我们被客户要求撰写关于量化交易的研究报告。
在这项工作中,我通过创建一个包含四只基金的模型来探索 copula,这些基金跟踪股票、债券、美元和商品的市场指数。
Beta 假设反映了一种工具对例如市场的风险。但是,您可以通过各种方式估算此度量。
最近,copula 在仿真模型中变得流行起来。
本文通过一些指数对散点图矩阵和平行坐标显示中的面板进行排序,并根据其数值水平对面板进行着色。
在这个例子中,我们考虑马尔可夫转换随机波动率模型。
此分析的目的是构建一个过程,以在给定时变波动性的情况下正确估计风险价值。 WeChat Tenc
此示例说明如何使用三种方法估计风险价值 (VaR) 并执行 VaR 回测分析。
我们研究波动聚集,以及使用单变量 GARCH(1,1) 模型对其进行建模。
这篇文章讨论了自回归综合移动平均模型 (ARIMA) 和自回归条件异方差模型 (GARCH) 及其在股票市场预测中的应用。
var对象指定了p阶平稳的多变量向量自回归模型(VAR(p))模型的函数形式并存储了参数值。
使用 garch 指定一个单变量GARCH(广义自回归条件异方差)模型。
本文用 R 编程语言极值理论 (EVT) 以确定 10 只股票指数的风险价值(和条件 VaR)。
在这个例子中,我们考虑马尔可夫转换随机波动率模型。
特别是在经济学/计量经济学中,建模者不相信他们的模型能反映现实。
贝叶斯模型提供了变量选择技术,确保变量选择的可靠性。
在量化金融中,我们学习了各种时间序列分析技术以及如何使用它们。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds