Author Archives: tecdat

R语言逻辑回归Logisitc逐步回归训练与验证样本估计分析心脏病数据参数可视化

By tecdat5月 26, 2022大数据部落, 数理统计, 计算机科学与技术可视化, 回归, 心脏病, 逐步回归, 逻辑回归

在进行交叉验证之前，很自然地说“我会预烧 50%（比如说）我的数据来训练一个模型，然后用剩下的来拟合模型”。

R语言零膨胀泊松回归ZERO-INFLATED POISSON（ZIP）模型分析露营钓鱼数据实例估计IRR和OR

By tecdat5月 25, 2022大数据部落, 数理统计, 生态、气象学, 计算机科学与技术IRR, OR, ZERO INFLATED POISSON, ZERO-INFLATED POISSON, ZIP, 回归, 泊松, 钓鱼, 零膨胀泊松回归, 露营

零膨胀泊松回归用于对超过零计数的计数数据进行建模。

R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列

By tecdat5月 24, 2022R语言辅导, 大数据部落, 技术支持, 数理统计, 计算机科学CS辅导, 计算机科学与技术GARCH, VaR, 回测, 时间序列, 波动率, 股市, 预测, 风险价值

风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量，也被投资组合经理等从业者用来解释未来市场风险。

R语言决策树和随机森林分类电信公司用户流失churn数据和参数调优、ROC曲线可视化

By tecdat5月 23, 2022R语言辅导, 大数据部落, 数理统计, 计算机科学CS辅导, 计算机科学与技术churn, ROC, 决策树, 参数调优, 用户流失, 电信公司, 随机森林

在本教程中，我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法。

R语言几何布朗运动 GBM模拟股票价格优化建立期权定价概率加权收益曲线可视化

By tecdat5月 19, 2022大数据部落几何布朗运动, 布朗运动, 收益, 收益曲线, 期权, 期权定价, 模拟, 股票

对于模拟股票价格，几何布朗运动 (GBM) 是事实上的首选模型。

python用pystan贝叶斯IRT模型拟合Rasch模型分析学生考试问题数据

By tecdat5月 18, 2022大数据部落IRT, pystan, Rasch, stan, 学生考试, 贝叶斯

由于某大学学生人数过多，助教不足，因此有必要对期中考试给每个学生的题目数量施加五道题的限制。

R语言用Keras长短期记忆LSTM神经网络分类分析问答文本数据

By tecdat5月 17, 2022大数据部落Keras, LSTM, 分类, 文本, 文本数据, 神经网络, 长短期记忆, 长短期记忆人工神经网络, 长短期记忆模型, 长短期记忆神经网络, 长短期记忆网络, 问答

本文是在 R 中使用 Keras 的LSTM神经网络分类简单介绍。

R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列

By tecdat5月 16, 2022大数据部落, 数理统计, 经济, 计算机科学与技术CSIR, HMM, 序列重要性重抽样, 收益率, 时间序列, 波动率, 波动率建模, 离散随机波动率, 股票, 重抽样, 重要性重抽样, 随机波动率, 随机波动率模型, 隐马尔可夫, 预测波动率, 高频波动率

在本笔记本中，我们向读者介绍了基本的随机波动率模型，并通过连续顺序重要性重采样讨论了它们的估计。我们使用收益率数据集来讨论 CSIR 在随机波动率模型估计中的实现和性能。

R语言用主成分分析（PCA）PCR回归进行预测汽车购买信息可视化

By tecdat5月 12, 2022大数据部落, 数理统计, 计算机科学与技术PCA, PCR, 主成分, 主成分分析, 回归, 汽车

在这个项目中，我讨论了如何使用主成分分析 (PCA) 进行简单的预测。

R语言生存分析模型因果分析：非参数估计、IP加权风险模型、结构嵌套加速失效(AFT)模型分析流行病学随访研究数据

By tecdat5月 11, 2022医药生物, 大数据部落, 数理统计AFT, IP加权风险模型, 加速失效模型, 因果分析, 流行病, 流行病学, 流行病学随访研究数据, 生存分析, 结构嵌套, 随访研究, 随访研究数据, 非参数估计, 风险模型

理解世界，我们可以从相关性的角度去描述，统计，机器学习，很多问题都是从相关的角度去描述的。

Matlab最小二乘法：线性最小二乘、加权线性最小二乘、稳健最小二乘、非线性最小二乘与剔除异常值效果比较

By tecdat5月 10, 2022大数据部落, 数理统计, 计算机科学与技术剔除异常值, 加权线性最小二乘, 异常值, 最小二乘, 最小二乘法, 稳健最小二乘, 线性最小二乘, 非线性最小二乘

matlab软件在拟合数据时使用最小二乘法。

R语言贝叶斯Metropolis-Hastings Gibbs 吉布斯采样器估计变点指数分布分析泊松过程车站等待时间

By tecdat5月 9, 2022大数据部落, 数理统计, 计算机科学与技术Gibbs, Metropolis, Metropolis Hastings, Metropolis-Hastings, 估计, 变点, 吉布斯, 指数分布, 泊松过程, 等待时间, 贝叶斯, 车站等待时间, 采样, 采样器

指数分布是泊松过程中事件之间时间的概率分布，因此它用于预测到下一个事件的等待时间。

Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

By tecdat5月 7, 2022大数据部落, 数理统计, 经济, 计算机科学与技术LSTM, MSE, RNN, TensorFlow, 循环神经网络, 时间序列, 神经网络, 股市, 股票, 股票市场, 预测

该项目包括：自 2000 年 1 月以来的股票价格数据。我们使用的是 Microsoft 股票。

Python用Keras的LSTM神经网络进行时间序列预测天然气价格例

By tecdat5月 5, 2022大数据部落, 数理统计, 计算机科学与技术Keras, LSTM, 价格, 天然气, 数据, 时间序列, 神经网络, 预测

一个简单的编码器-解码器LSTM神经网络应用于时间序列预测问题

关联规则Apriori挖掘豆瓣读书评论爬虫采集数据与可视化

By tecdat4月 29, 2022可视化和设计, 大数据部落, 数理统计, 计算机科学与技术Apriori, 关联规则, 数据, 爬虫, 评论, 豆瓣, 豆瓣读书, 采集, 采集数据

主题将紧紧围绕以下几点：有哪些书籍值得推荐？一般书籍的价格是多少？一本书的评分和评论数量之间是否存在某种关系？

R语言近似贝叶斯计算MCMC（ABC-MCMC）轨迹图和边缘图可视化

By tecdat4月 27, 2022大数据部落, 数理统计, 计算机科学与技术ABC, ABC-MCMC, MCMC, 贝叶斯, 轨迹图, 近似贝叶斯计算

WeChat Tencent QQ email print 由Kaizong Ye，Weilong Zhang

R语言马尔可夫MCMC中的Metropolis Hastings，MH算法抽样（采样）法可视化实例

By tecdat4月 26, 2022大数据部落, 数理统计, 计算机科学与技术MCMC, Metropolis Hasting, Metropolis Hastings, MH, 抽样, 贝叶斯, 采样, 马尔可夫

Metropolis Hastings 算法是一种非常简单的算法，用于从难以采样的分布中生成样本。

MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类

By tecdat4月 25, 2022大数据部落, 数理统计, 计算机科学与技术LSTM, 传感器, 分类, 序列, 手机, 时间序列, 深度学习, 神经网络, 长短期记忆, 预测

此示例说明如何使用长短期记忆 (LSTM) 网络对序列数据的每个时间步长进行分类。

R语言广义线性模型GLM：线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟

By tecdat4月 21, 2022大数据部落, 数理统计, 计算机科学与技术glm, 二项式, 冰淇淋, 回归, 对数变换, 广义线性模型, 数据, 时间序列, 最小二乘, 模拟, 泊松, 线性最小二乘, 线性模型, 逻辑回归, 销售, 预测

线性模型是统计学的基础，但它的意义远不止用尺子在几个点上画一条线。

R语言极值理论：希尔HILL统计量尾部指数参数估计可视化

By tecdat4月 20, 2022大数据部落, 数理统计, 经济, 计算机科学与技术HILL, 参数估计, 尾部指数, 希尔, 极值理论, 统计量

极值理论对样本尾部分布的极值指数的估计方法主要有两类：半参数方法和全参数方法，前者主要是基于分布尾部的 Hill 估计量，后者则主要基于广义帕累托分布。

R语言GARCH模型对股市sp500收益率bootstrap、滚动估计预测VaR、拟合诊断和蒙特卡罗模拟可视化

By tecdat4月 19, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融bootstrap, GARCH, SP500, VaR, 拟合诊断, 收益率, 模拟, 滚动估计, 滚动估计预测, 滚动预测, 股市, 股票, 蒙特卡罗, 诊断

Box 等人的开创性工作(1994) 在自回归移动平均模型领域的相关工作为波动率建模领域的相关工作铺平了道路，分别由 Engle (1982) 和 Bollerslev (1986) 引入了 ARCH 和 GARCH 模型。

python TensorFlow 2二维卷积神经网络CNN对图像物体识别混淆矩阵评估

By tecdat4月 18, 2022大数据部落, 数理统计, 计算机科学与技术CNN, TensorFlow, 卷积神经网络, 图像, 图像识别, 混淆矩阵

本文演示了如何训练一个简单的卷积神经网络 (CNN) 来对 CIFAR 图像进行分类。

Python银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机svm分析营销活动数据

By tecdat4月 14, 2022大数据部落, 数理统计, 经济, 计算机科学与技术knn, svm, 决策树, 回归, 营销, 贝叶斯, 银行, 预测, 高斯朴素贝叶斯

该数据与银行机构的直接营销活动相关，营销活动基于电话。

【视频讲解】R语言结构方程模型SEM分析心理学和营销研究数据路径图可视化

By tecdat4月 13, 2022大数据部落, 心理学, 数理统计, 特色视频, 经济, 计算机科学与技术SEM, 回归, 心理学, 结构方程, 结构方程模型, 营销, 路径图

结构方程建模 (SEM) 是一种全面而灵活的方法，包括在假设模型中研究变量之间的关系。

Python信贷风控模型：梯度提升Adaboost,XGBoost,SGD, GBOOST, SVC,随机森林, KNN预测金融信贷违约支付和模型优化

By tecdat4月 12, 2022大数据部落, 数理统计, 经济, 计算机科学与技术Adaboost, boost, GBOOST, knn, SGD, SVC, xgboost, 优化, 信贷, 信贷违约, 信贷违约支付, 梯度提升, 违约, 随机森林, 风控

在此数据集中，我们必须预测信贷的违约支付，并找出哪些变量是违约支付的最强预测因子？

SAS用梯度提升回归树(GBDT)迁移学习预测抵押贷款拖欠风险和垃圾电子邮件数据

By tecdat4月 11, 2022大数据部落, 数理统计, 计算机科学与技术GBDT, 回归, 抵押贷款, 梯度提升回归树, 电子邮件, 迁移学习

GBDT梯度提升模型由多个决策树组成。

R语言弹性网络Elastic Net正则化惩罚回归模型交叉验证可视化

By tecdat4月 7, 2022大数据部落, 数理统计, 计算机科学与技术Elastic Net, 交叉验证, 弹性网络, 惩罚回归, 正则化

弹性网络正则化同时应用 L1 范数和 L2 范数正则化来惩罚回归模型中的系数。

R语言多变量（多元）多项式曲线回归线性模型分析母亲吸烟对新生婴儿体重影响可视化

By tecdat4月 6, 2022大数据部落, 数理统计, 计算机科学与技术吸烟, 回归, 多元, 多元线性回归, 新生婴儿体重, 线性模型

本文使用的数据集记录了 1236 名新生婴儿的体重，以及他们母亲的其他协变量。

回归树模型分析纪录片播放量影响因素

By tecdat3月 31, 2022可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 可视化, 回归, 播放量, 纪录片, 预测

纪录片能够真实、详尽地反映一个地区的风貌，展示经济发展和社会进步。

R语言马尔可夫链（Markov Chain, MC）模拟赌徒破产模型Gambler’s Ruin Problem可视化

By tecdat3月 30, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术Gambler's Ruin Problem, Markov Chain, 模拟, 赌徒破产模型, 马尔可夫, 马尔可夫链

WeChat Tencent QQ email print 由Kaizong Ye，Weilong Zhang

R语言、SAS潜类别（分类）轨迹模型LCTM分析体重指数 (BMI)数据可视化

By tecdat3月 29, 2022大数据部落, 数理统计, 计算机科学与技术BMI, LCTM, 体重指数, 分类, 潜类别, 潜类别（分类）轨迹模型, 潜类别轨迹模型

潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法，用于描述生命过程中的暴露，它将异质人群简化为同质模式或类别。

R语言IRT理论：扩展Rasch模型等级量表模型lltm、 rsm和pcm模型分析心理和教育测验数据可视化

By tecdat3月 28, 2022大数据部落, 教育学, 数理统计, 计算机科学与技术IRT, lltm, pcm, Rasch, rsm, 心理, 教育, 等级量表模型

我们首先介绍扩展 Rasch 模型的方法论，然后是一般程序描述和应用主题,包括简单的 Rasch 模型、评级量表模型、部分信用模型及其线性扩展。

R语言单变量和多变量（多元）动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率

By tecdat3月 25, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融DCC, DCC-GARCH, GARCH, 动态条件相关系数, 多元, 多元GARCH, 多变量, 收益率, 时间序列, 波动率, 股票, 股票收益率, 金融, 预测

当您处理金融时间序列时，我们通常可以获得相对高频的观察结果。

Python进行多输出（多因变量）回归：集成学习梯度提升决策树GRADIENT BOOSTING REGRESSOR,GBR回归训练和预测可视化

By tecdat3月 23, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术GBR, GRADIENT BOOSTING REGRESSOR, 决策树, 可视化, 回归, 多因变量, 多输出, 梯度提升, 梯度提升决策树, 训练, 输出, 集成学习, 预测

在之前的文章中，我们研究了许多使用多输出回归分析的方法。

R语言两层2^k析因试验设计（因子设计）分析工厂产量数据和Lenth方法检验显著性可视化

By tecdat3月 22, 2022可视化和设计, 大数据部落, 数理统计Lenth, Lenth方法, 因子设计, 析因设计, 析因试验, 析因试验设计, 检验, 检验显著性

假设调查人员有兴趣检查减肥干预方法的三个组成部分。 WeChat Tencent QQ email print

R语言Bootstrap(自举法，自抽样法)估计回归置信区间分析股票收益

By tecdat3月 21, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术bootstrap, 回归, 回归回归, 置信区间, 股票, 股票收益, 自举法, 自抽样, 自抽样法

. 您想知道它是否与（例如）零显着不同。一般来说，人们会查看他们选择的软件报告的统计数据或 p.value。问题是，这个 p.value 计算依赖于因变量的分布。如果没有不同的说明，您的软件假定为正态分布，那是怎么回事？

R语言用回归构建配对交易策略量化模型分析股票收益和价格

By tecdat3月 18, 2022大数据部落, 数理统计, 经济, 计算机科学与技术交易策略, 回归, 策略, 股票, 股票收益, 配对交易, 配对交易策略, 量化

对于那些不熟悉“配对交易”概念的人来说几句话。

R语言和Python用泊松过程扩展：霍克斯过程Hawkes Processes分析比特币交易数据订单到达自激过程时间序列

By tecdat3月 16, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融Hawkes Processes, 时间序列, 比特币, 比特币交易, 泊松, 泊松过程, 自激, 自激过程, 霍克斯过程

本文描述了一个模型，该模型解释了交易的聚集到达，并展示了如何将其应用于比特币交易数据。

R语言指数加权模型EWMA预测股市多变量波动率时间序列

By tecdat3月 15, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融EWMA, 多变量, 指数加权模型, 时间序列, 波动率, 股市

从广义上讲，复杂的模型可以实现很高的预测准确性。

R语言分析股市相关结构：用回归估计股票尾部相关性（相依性、依赖性）

By tecdat3月 14, 2022大数据部落, 数理统计, 经济, 计算机科学与技术依赖性, 回归, 尾部, 尾部相关性, 相依性, 相关结构, 股市, 股票

什么是尾部相关性？假设市场出现了属于最差 5% 的日子的回撤： WeChat Tencent Q

R语言Copula模型分析股票市场板块相关性结构

By tecdat3月 11, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融copula, 相关性, 相关性结构, 股票, 股票市场

这篇文章是关于 copulas 和重尾的。

R语言ARMA GARCH COPULA模型拟合股票收益率时间序列和模拟可视化

By tecdat3月 9, 2022大数据部落, 数理统计, 经济, 金融arima, ARMA, ARMA GARCH COPULA, ARMA-GARCH, ARMA-GARCH-VaR, copula, Copula GARCH, Copulas, GARCH, 可视化, 多元Copula GARCH 模型, 收益率, 时间序列, 模拟, 股票

最近我们被客户要求撰写关于股票收益率时间序列的研究报告，包括一些图形和统计输出。在本文中，我们展示了 copula GARCH 方法拟合模拟数据和股票数据并进行可视化。

R语言向量自回归VAR的迭代多元预测估计 GDP 增长率时间序列

By tecdat3月 8, 2022大数据部落, 数理统计, 经济GDP, GDP 增长率, VaR, VAR模型, 向量自回归, 回归, 增长率, 多元, 多元预测, 时间序列, 自回归, 迭代多元预测, 预测

VARs的结构也允许联合检验多个方程的限制。

Python用Markowitz有效边界构建最优投资组合可视化分析四只股票

By tecdat3月 7, 2022大数据部落, 数理统计, 经济, 金融Markowitz, 投资组合, 最优投资组合, 有效边界, 股票

在这篇文章中，我想介绍现代投资组合理论 (MPT)_、 _有效边界以及它对投资组合构建的一些影响。

MATLAB用Lasso回归拟合高维数据和交叉验证

By tecdat3月 4, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, 交叉验证, 回归, 高维

我们围绕Lasso技术进行一些咨询，帮助客户解决独特的业务问题。使用各种方法从指数分布生成 200 个五维数据 X 样本。

R语言多变量广义正交GARCH（GO-GARCH）模型对股市高维波动率时间序列拟合预测

By tecdat3月 2, 2022大数据部落, 数理统计, 经济, 金融GARCH, 多变量, 广义正交GARCH, 时间序列, 波动率, 股市, 预测

在多变量波动率预测中，我们有时会看到对少数主成分驱动的协方差矩阵建模，而不是完整的股票。

R语言样条曲线分段线性回归模型piecewise regression估计个股beta值分析收益率数据

By tecdat3月 1, 2022大数据部落, 数理统计, 经济, 金融Beta, beta系数, piecewise, piecewise regression, 个股, 分段线性回归, 回归, 收益率, 样条曲线, 线性回归, 股市

一只股票的_beta_值通常意味着它与市场的关系，当市场变动 1%时，我们期望股票会发生多少百分比的变动。

R语言用收缩估计Shrinkage股票beta系数回归分析Microsoft收益率风险

By tecdat2月 25, 2022大数据部落, 数理统计, 经济Beta, beta系数, Shrinkage, 回归, 收益率, 收缩估计, 股票, 风险

配对交易提出的问题之一是股票的贝塔值相对于市场的不稳定估计。

Python多项式Logistic逻辑回归进行多类别分类和交叉验证准确度箱线图可视化

By tecdat2月 23, 2022大数据部落, 数理统计, 计算机科学与技术Logistic, 交叉验证, 准确度, 分类, 回归, 多类别, 多类别分类, 多项式, 箱线图, 逻辑, 逻辑回归

WeChat Tencent QQ email print 由Kaizong Ye，Sherry Deng撰写

R语言GJR-GARCH和GARCH波动率预测普尔指数时间序列和Mincer Zarnowitz回归、DM检验、JB检验

By tecdat2月 22, 2022大数据部落, 数理统计, 经济, 计算机科学与技术DM, DM检验, GARCH, GJR-GARCH, JB, JB检验, Mincer Zarnowitz, 回归, 时间序列, 普尔指数, 检验, 波动率, 预测

在投资组合管理、风险管理和衍生品定价中，波动性起着重要作用。

R语言数量生态学冗余分析RDA分析植物多样性物种数据结果可视化

By tecdat2月 21, 2022可视化和设计, 大数据部落, 数理统计, 生态、气象学, 计算机科学与技术RDA, 冗余分析, 多样性, 植物, 植物多样性, 物种, 生态学

冗余分析（redundancy analysis，RDA）是一种回归分析结合主成分分析的排序方法，也是多因变量（multiresponse）回归分析的拓展。

R语言分位数自回归QAR分析痛苦指数：失业率与通货膨胀率时间序列

By tecdat2月 18, 2022大数据部落, 数理统计, 经济, 计算机科学与技术QAR, 分位数自回归, 回归, 失业率, 时间序列, 痛苦指数, 自回归, 通货膨胀率

“分位数自回归”，它是对时间序列域的重要扩展。

R语言用有限混合模型(FMM,finite mixture model)创建衰退指标对股市SPY、ETF收益聚类和双坐标图可视化

By tecdat2月 17, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融ETF, finite mixture model, FMM, SPY, 收益, 有限混合模型, 聚类, 股市, 衰退指标

从广义上讲，我们可以将金融市场状况分为两类：牛市和熊市。

R语言MCMC的rstan贝叶斯回归模型和标准线性回归模型比较

By tecdat2月 15, 2022大数据部落, 数理统计, 计算机科学与技术MCMC, Rstan, 回归, 标准线性回归, 线性回归, 贝叶斯, 贝叶斯回归

现在有了对贝叶斯方法的概念理解，我们将实际研究使用它的回归模型。

python贝叶斯随机过程：马尔可夫链Markov-Chain，MC和Metropolis-Hastings，MH采样算法可视化

By tecdat2月 14, 2022大数据部落, 数理统计, 计算机科学与技术Markov-Chain, Metropolis-Hastings, 贝叶斯, 采样, 采样算法, 马尔, 马尔可夫, 马尔可夫链

本文，我们说明了贝叶斯学习和计算统计一些结果。

python深度学习实现自编码器Autoencoder神经网络异常检测心电图ECG时间序列

By tecdat2月 11, 2022医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Autoencoder, 异常检测, 心电图, 时间序列, 深度学习, 神经网络, 自编码器, 预测

通过训练具有小中心层的多层神经网络重构高维输入向量，可以将高维数据转换为低维代码。

Python贝叶斯推断Metropolis-Hastings（M-H）MCMC采样算法的实现

By tecdat2月 9, 2022大数据部落, 数理统计, 计算机科学与技术M-H, MCMC, Metropolis-Hastings, 贝叶斯, 贝叶斯推断, 采样

Metropolis-Hastings 算法对概率分布进行采样以产生一组与原始分布成比例的轨迹。

R语言极值分析：分块极大值Block-maxima、阈值超额法threshold excess、广义帕累托分布GPD拟合降雨数据时间序列

By tecdat2月 8, 2022农业, 地理，运输，旅行和物流, 大数据部落, 数理统计, 生态、气象学, 计算机科学与技术Block-maxima, GPD, threshold excess, 分块极大值, 广义帕累托分布, 时间序列, 极值, 极值分析, 阈值超额法, 降水数据, 降雨, 降雨数据

你们可能知道，实际极值分析有两种常用方法：分块极大值Blockmaxima、阈值超额法threshold excess。

R语言ARIMA、ARIMAX、动态回归和OLS 回归预测多元时间序列

By tecdat2月 7, 2022大数据部落, 数理统计, 计算机科学与技术R语言, 时间序列, 预测

当ARIMA模型包括其它时间序列作为输入变量时,被称为传递函数模型(transfer function model)、多变量时间序列模型(multivariate time series model)、ARIMAX模型或Box-Tiao模型。

R语言K-means和层次聚类分析癌细胞系微阵列数据和树状图可视化比较

By tecdat1月 28, 2022医药生物, 大数据部落, 数理统计, 计算机科学与技术k-means, 层次聚类, 微阵列, 树状图, 癌细胞系, 聚类

对“NCI60”（癌细胞系微阵列）数据使用聚类方法

R语言ARIMA、GARCH 和 VAR模型估计、预测ts 和 xts格式时间序列

By tecdat1月 27, 2022大数据部落, 数理统计, 经济, 计算机科学与技术ARMA, GARCH, ts, VaR, 时间序列, 预测

对于时间序列分析，有两种数据格式： ts （时间序列）和 xts （可扩展时间序列）。

Python用GARCH、离散随机波动率模型DSV模拟和估计股票收益时间序列与蒙特卡洛可视化

By tecdat1月 26, 2022大数据部落, 数理统计, 经济DSV, GARCH, 估计, 收益, 时间序列, 模拟, 波动率, 离散随机波动率, 股票, 蒙特卡洛, 随机波动率

这篇文章介绍了一类离散随机波动率模型。

R语言群组变量选择、组惩罚group lasso套索模型预测分析新生儿出生体重风险因素数据和交叉验证、可视化

By tecdat1月 25, 2022医药生物, 大数据部落, 数据库, 数理统计, 计算机科学与技术group lasso, LASSO, R语言, 交叉验证, 体重, 出生体重, 变量选择, 套索, 新生儿出生体重, 组惩罚, 群组变量选择, 预测

本文介绍具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。

R 语言用RNN循环神经网络、LSTM长短期记忆网络实现时间序列长期利率预测

By tecdat1月 24, 2022大数据部落, 数理统计, 经济, 计算机科学与技术LSTM, RNN, 利率, 循环神经网络, 时间序列, 神经网络, 长期利率, 长短期记忆, 长短期记忆网络, 预测

2017 年年中，R 推出了 Keras 包，这是一个在 Tensorflow 之上运行的综合库，具有 CPU 和 GPU 功能。本文将演示如何在 R 中使用 LSTM 实现时间序列预测。

R语言模拟和预测ARIMA模型、随机游走模型RW时间序列趋势可视化

By tecdat1月 21, 2022大数据部落, 数理统计, 经济arima, RW, 时间序列, 模拟, 趋势, 随机游走, 预测

当一个序列遵循随机游走模型时，就说它是非平稳的。

SAS分类决策树预测贷款申请评分剪枝和结果可视化

By tecdat1月 20, 2022可视化和设计, 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术SAS, 决策树, 分类, 剪枝, 可视化, 评分, 贷款, 贷款申请, 预测

分类树的一个常见用途是预测抵押贷款申请人是否会拖欠贷款。

R语言股票收益分布一致性检验KS检验Kolmogorov-Smirnov、置换检验Permutation Test可视化

By tecdat1月 19, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融Kolmogorov-Smirnov, KS, KS检验, Permutation Test, 一致性检验, 分布, 可视化, 收益, 检验, 置换检验, 股票

今年的收益是否真的与典型年份的预期不同？

R语言绘制ggplot2双色XY-面积图组合交叉折线图数据可视化

By tecdat1月 18, 2022可视化和设计, 大数据部落ggplot2, 交叉折线图, 可视化, 折线图, 面积图

本文显示如何填充图表中两条交叉线之间的区域。

Author Archives: tecdat

关注我们，永远不要错过任何见解。