Category Archives: 数理统计

R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性

By tecdat11月 17, 2021可视化和设计, 地理，运输，旅行和物流, 大数据部落, 数理统计, 计算机科学与技术北半球, 可视化, 回归, 多元线性回归, 收敛, 收敛性, 数据, 气候, 海冰, 海冰范围, 线性回归, 线性回归模型, 贝叶斯, 贝叶斯简单线性回归, 贝叶斯线性回归

像任何统计建模一样，贝叶斯建模可能需要为你的研究问题设计合适的模型，然后开发该模型，使其符合你的数据假设并运行。

Python集成机器学习：用AdaBoost、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化

By tecdat11月 16, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Adaboost, 优化, 决策树, 分类, 回归, 机器学习, 网格搜索, 超参数, 超参数优化, 逻辑回归, 集成学习, 集成机器, 集成模型

Boosting 是一类集成机器学习算法，涉及结合许多弱学习器的预测。

MATLAB用GARCH模型对股票市场收益率时间序列波动的拟合与预测

By tecdat11月 15, 2021大数据部落, 数理统计, 经济, 计算机科学与技术, 金融GARCH, matlab, 拟合, 收益率, 时间序列, 波动, 股市, 股票, 股票市场, 预测

使用 garch 指定一个单变量GARCH（广义自回归条件异方差）模型。

R语言贝叶斯广义线性混合（多层次/水平/嵌套）模型GLMM、逻辑回归分析教育留级影响因素数据

By tecdat11月 12, 2021教育学, 数理统计, 机器学习, 计算机科学与技术GLMM, Logistic逻辑回归, 回归, 多分类logistic逻辑回归, 多层次, 多级, 层次, 嵌套, 广义线性混合模型, 教育, 教育留级, 数据, 留级, 线性混合, 线性混合效应, 线性混合效应模型, 线性混合模型, 贝叶斯, 贝叶斯回归, 贝叶斯广义线性混合, 贝叶斯广义线性混合模型, 贝叶斯简单线性回归, 贝叶斯线性回归, 逻辑回归, 非线性混合效应, 非线性混合模型, 预测

本教程使用R介绍了具有非信息先验的贝叶斯 GLM（广义线性模型）。

【视频讲解】R语言Kmeans均值聚类和层次聚类：亚洲国家地区生活幸福质量异同可视化分析和选择最佳聚类数

By tecdat11月 11, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术kmean, kmeans, Kmeans聚类, 亚洲国家, 层次聚类, 最佳聚类数, 生活幸福质量, 聚类, 聚类数, 选择最佳聚类数

《世界幸福报告》是可持续发展解决方案网络的年度报告，该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。

Python 贝叶斯概率推断序列数据概率和先验、似然和后验图可视化

By tecdat11月 10, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术似然, 先验, 可视化, 后验, 序列数据, 推断, 概率推断, 贝叶斯

在这篇文章中，我将集中讨论一个给定一个短数据序列的推断概率的例子。

R语言极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR：多元化投资组合预测风险测度分析

By tecdat11月 9, 2021大数据部落, 数理统计, 经济, 计算机科学与技术, 金融CVaR, EVT, GARCH, POT, VaR, 多元, 多元化, 投资, 投资组合, 指数, 条件CVaR, 极值理论, 股票, 超阈值, 预测, 风险

本文用 R 编程语言极值理论 (EVT) 以确定 10 只股票指数的风险价值（和条件 VaR）。

R语言估计多元标记的潜过程混合效应模型（lcmm）分析心理测试的认知过程

By tecdat11月 8, 2021大数据部落, 数理统计, 计算机科学与技术lcmm, 多元, 心理测试, 混合效应, 混合效应模型, 潜过程, 认知过程, 非线性混合效应

每个动态现象都可以用一个潜过程（Λ(t)）来表征，这个潜过程在连续的时间t中演化。

R语言BUGS序列蒙特卡罗SMC、马尔可夫转换随机波动率SV模型、粒子滤波、Metropolis Hastings时间序列分析

By tecdat11月 5, 2021大数据部落, 数理统计, 经济, 计算机科学与技术BUGS, SMC, SV, SV模型, 序列蒙特卡罗, 时间序列, 波动率, 粒子, 粒子滤波, 蒙特卡罗, 随机波动率, 预测, 马尔可夫, 马尔可夫转换

在这个例子中，我们考虑马尔可夫转换随机波动率模型。

R语言主成分回归（PCR）、多元线性回归特征降维分析光谱数据和汽车油耗、性能数据

By tecdat11月 4, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术PCR, 主成分, 主成分分析, 主成分回归, 主成分回归（PCR）, 主成分得分, 光谱, 回归, 多元线性回, 汽车, 汽车油耗, 特征降维, 线性回归, 降维, 预测

什么是PCR？（PCR = PCA + MLR）

R语言集成模型：提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据

By tecdat11月 3, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术boosting, 加权平均模型, 平均模型, 提升树, 时间序列, 最小二乘法, 模型融合, 约束最小二乘法, 随机森林, 集成模型

特别是在经济学/计量经济学中，建模者不相信他们的模型能反映现实。

【视频讲解】R语言用贝叶斯线性回归、贝叶斯模型平均 (BMA)来预测工人工资

By tecdat11月 2, 2021大数据部落, 数据库, 数理统计, 特色视频, 经济, 计算机科学与技术BMA, 回归, 线性回归, 贝叶斯, 贝叶斯模型平均, 预测

贝叶斯模型提供了变量选择技术，确保变量选择的可靠性。

R语言因子实验设计nlme拟合非线性混合模型分析有机农业施氮水平

By tecdat11月 1, 2021农业, 大数据部落, 数理统计, 计算机科学与技术nlme, 农业, 因子实验设计, 施氮, 施氮水平, 有机农业, 混合模型, 线性, 非线性, 非线性混合模型

因子实验在农业中非常普遍，它们通常用于测试实验因素之间相互作用的重要性。

R语言用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化

By tecdat10月 29, 2021农业, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, uci, uci数据, 可视化, 回归, 弹性网络, 数据, 线性回归, 随机森林, 预测, 鲍鱼

铁和泛酸的极好来源，是澳大利亚、美国和东亚的营养食品资源和农业。100 克鲍鱼可提供超过 20% 的每日推荐摄入量。鲍鱼的经济价值与其年龄呈正相关。因此，准确检测鲍鱼的年龄对于养殖者和消费者确定其价格非常重要。

matlab数据可视化交通流量分析天气条件、共享单车时间序列数据

By tecdat10月 28, 2021可视化和设计, 地理，运输，旅行和物流, 大数据部落, 数理统计matlab, 交通, 交通流量, 共享单车, 单车, 可视化, 天气, 天气条件, 数据, 数据可视化, 时间序列, 预测

此示例说明如何使用从传感器获得的数据分析共享单车交通模式，来预处理带时间戳的数据。数据来自传感器。

matlab用Logistic逻辑回归建模和马尔可夫链蒙特卡罗(MCMC) 方法分析汽车实验数据

By tecdat10月 27, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Logistic, matlab, MCMC, 回归, 汽车, 汽车实验, 汽车实验数据, 蒙特卡罗, 贝叶斯, 逻辑回归, 马尔可夫

此示例说明如何使用逻辑回归模型进行贝叶斯推断。

Python 用ARIMA、GARCH模型预测分析股票市场收益率时间序列

By tecdat10月 26, 2021大数据部落, 数理统计, 经济, 计算机科学与技术, 金融arima, GARCH, python, 收益率, 时间序列, 股票, 股票市场, 预测

在量化金融中，我们学习了各种时间序列分析技术以及如何使用它们。

Python用Beta先验分布推断概率，贝叶斯推断计算和可视化案例

By tecdat10月 25, 2021大数据部落, 数理统计python, 先验分布, 推断, 概率, 贝叶斯, 贝叶斯推断

在这篇文章中，我将扩展从数据推断概率的示例，考虑 0 和 1之间的所有（连续）值，而不是考虑一组离散的候选概率。

R语言非线性混合效应 NLME模型(固定效应&随机效应)对抗哮喘药物茶碱动力学研究

By tecdat10月 22, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术nlme, 动力学, 哮喘, 固定效应, 混合效应, 线性, 药, 药物, 随机效应, 非线性, 非线性混合效应

最近我们被客户要求撰写关于抗哮喘药物茶碱动力学研究的报告。茶碱数据文件报告来自抗哮喘药物茶碱动力学研究。

R语言平滑算法LOESS局部加权回归、三次样条、变化点检测拟合电视节目《白宫风云》在线收视率

By tecdat10月 21, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LOESS, 三次样条, 变化点, 变化点检测, 回归, 在线收视率, 局部加权回归, 平滑, 平滑算法, 收视率, 样条, 电视节目, 白宫风云, 预测

此示例基于电视节目的在线收视率。我们将从抓取数据开始。

【视频讲解】R语言结合新冠疫情COVID-19股票价格预测：ARIMA，KNN和神经网络时间序列分析

By tecdat10月 20, 2021大数据部落, 数理统计, 机器学习, 特色视频, 经济, 计算机科学与技术, 金融arima, COVID, COVID-19, knn, 新冠, 新冠疫情, 时间序列, 疫情, 神经网络, 股票, 股票价格, 预测

本文的目标是使用各种预测模型预测Google的未来股价，然后分析各种模型。

Stata广义矩量法GMM面板向量自回归 VAR模型选择、估计、Granger因果检验分析投资、收入和消费数据

By tecdat10月 19, 2021大数据部落, 数理统计, 经济, 计算机科学与技术GMM, Granger, stata, VAR模型, 向量自回归, 向量自回归模型, 因果检验, 广义矩, 广义矩量法, 投资, 收入, 检验, 消费, 自回归, 面板, 面板向量自回归

面板向量自回归（VAR）模型在应用研究中的应用越来越多。

Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据

By tecdat10月 18, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, MNIST, python, t-SNE, 可视化, 降维, 非线性, 高维, 高维数据, 鸢尾花

T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。

R语言随机波动率(SV)模型、MCMC的Metropolis-Hastings算法金融应用：预测标准普尔SP500指数

By tecdat10月 15, 2021大数据部落, 数理统计, 经济, 计算机科学与技术, 金融MCMC, SV, 随机波动率

在这个例子中，我们考虑随机波动率模型 SV0 的应用，例如在金融领域。

R语言指数平滑法holt-winters分析谷歌Google Analytics博客用户访问时间序列数据

By tecdat10月 14, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Analytics, Google Analytics, holt, holt-winters, winters, 博客, 博客用户, 指数平滑, 指数平滑法, 时间序列, 访问, 谷歌, 预测

最近我们被客户要求撰写关于谷歌Google Analytics分析的研究报告。在等距时间段内以一系列点获得的数据通常称为时间序列数据。

R语言矩阵特征值分解(谱分解)和奇异值分解(SVD)特征向量分析有价证券数据

By tecdat10月 13, 2021大数据部落, 数理统计, 计算机科学与技术SVD, 奇异值分解, 有价证券, 特征值, 特征向量, 矩阵, 矩阵分解, 证券, 谱分解

作为数据分析的一部分，我们要在有价证券矩阵的操作上做一些工作，只需几行代码。

Python在线零售数据关联规则挖掘Apriori算法数据可视化

By tecdat10月 12, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Apriori, python, 关联规则, 可视化, 在线零售数据, 数据可视化, 零售, 零售数据

关联规则学习在机器学习中用于发现变量之间的有趣关系。

R语言分布滞后线性和非线性模型（DLNM）分析空气污染（臭氧）、温度对死亡率时间序列数据的影响

By tecdat10月 11, 2021医药生物, 大数据部落, 数理统计, 计算机科学与技术DLNM, DLNMs, 分布滞后, 分布滞后线性, 分布滞后线性模型, 分布滞后非线性模型, 时间序列, 死亡率, 温度, 滞后, 滞后线性, 空气污染, 线性, 臭氧, 非线性模型

分布滞后非线性模型（DLNM）表示一个建模框架，可以灵活地描述在时间序列数据中显示潜在非线性和滞后影响的关联。

Python面板时间序列数据预测：格兰杰因果关系检验Granger causality test药品销售实例与可视化

By tecdat10月 9, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术Granger causality test, python, 可视化, 时间序列, 格兰杰因果关系检验, 药品, 药品销售, 销售, 面板, 面板时间序列, 预测

时间序列是以固定时间_区间_记录的观察序列。

R语言ARIMA-GARCH波动率模型预测股票市场苹果公司日收益率时间序列

By tecdat10月 8, 2021大数据部落, 数理统计, 经济, 金融arima, GARCH, 收益率, 时间序列, 波动率, 股票, 预测

在本文中，我们将尝试为苹果公司的日收益率寻找一个合适的 GARCH 模型。

python用支持向量机回归(SVR)模型分析用电量预测电力消费

By tecdat9月 29, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术python, svr, 支持向量机, 用电量, 电力负荷, 预测

本文描述了训练支持向量回归模型的过程，该模型用于预测基于几个天气变量、一天中的某个小时、以及这一天是周末/假日/在家工作日还是普通工作日的用电量。

R语言深度学习Keras循环神经网络(RNN)模型预测多输出变量时间序列

By tecdat9月 28, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术RNN, 多变量, 多输出变量, 循环神经网络, 时间序列, 模型, 深度学习, 神经网络, 预测

递归神经网络被用来分析序列数据。

R语言绘制圈图、环形热图可视化基因组实战：展示基因数据比较

By tecdat9月 27, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术圈图, 基因, 基因组, 热图, 环形热图

可以使用环状图形展示基因数据比较。可以添加多种图展信息，如热图、散点图等。

R语言用综合信息准则比较随机波动率（SV）模型对股票价格时间序列建模

By tecdat9月 26, 2021大数据部落, 数理统计, 经济, 计算机科学与技术, 金融SV, 信息准则, 时间序列, 综合信息准则, 股票, 股票价格, 随机波动率

随机波动率（SV）模型是常用于股票价格建模的一系列模型。

R语言使用限制平均生存时间RMST比较两条生存曲线分析肝硬化患者

By tecdat9月 24, 2021医药生物, 大数据部落, 数理统计, 计算机科学与技术RMST, 患者, 生存分析, 生存曲线, 限制平均生存时间

在比较性的纵向临床研究中，主要终点往往是发生特定临床事件的时间，如死亡、心衰住院、肿瘤进展等。

R语言Meta分析效应量

By tecdat9月 23, 2021大数据部落, 数理统计meta, Meta分析, 效应量

进行荟萃分析时，您很可能必须使用通用度量将效果大小计算或转换为效果大小。

Python用决策树分类预测糖尿病和可视化实例

By tecdat9月 23, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术决策树, 可视化, 糖尿病, 预测

决策树是对例子进行分类的一种简单表示。

R语言社区检测算法可视化网络图：ggplot2绘制igraph对象分析物种相对丰度

By tecdat9月 22, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术ggplot2, igraph, 可视化, 物种, 物种相对丰度, 相对丰度, 社区检测, 网络, 网络图

我们使用R中的igraph包，产生了网络的图形。

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化

By tecdat9月 17, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术EM, EM算法, 分层聚类, 分类, 可视化, 密度估计, 有限正态混合, 有限正态混合模型, 聚类

最近我们被客户要求撰写关于有限正态混合模型在r软件中的实现的研究报告，用于基于模型的聚类、分类和密度估计。

R语言回测交易：根据历史信号/交易创建股票收益曲线

By tecdat9月 16, 2021大数据部落, 数理统计, 经济, 金融交易, 历史信号, 回测, 收益, 股票, 股票收益

本文介绍如何根据历史信号/交易制作股票曲线。

R语言空气污染数据的地理空间可视化和分析：颗粒物2.5（PM2.5）和空气质量指数（AQI）

By tecdat9月 16, 2021可视化和设计, 地理，运输，旅行和物流, 大数据部落, 数理统计AQI, PM2.5, 可视化, 地理, 地理空间, 空气污染数据, 空气质量指数, 颗粒物2.5

由于空气污染对公众健康的不利影响，人们一直非常关注。

R语言用假近邻长短期记忆人工神经网络FNN-LSTM模型进行时间序列深度学习预测4个案例

By tecdat9月 15, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术FNN, LSTM, 假近邻, 时间序列, 深度学习, 长短期记忆人工, 长短期记忆人工神经网络, 预测

在最近的一篇文章中，我们展示了一个LSTM模型，通过假近邻（FNN）损失进行正则化，可以用来重建一个非线性动态系统。

R语言贝叶斯非参数模型：密度估计、非参数化随机效应meta分析心肌梗死数据

By tecdat9月 14, 2021医药生物, 大数据部落, 数理统计, 计算机科学与技术meta, Meta分析, 密度估计, 心肌梗死, 数据, 贝叶斯, 随机效应, 非参数

最近，我们使用贝叶斯非参数（BNP）混合模型进行马尔科夫链蒙特卡洛（MCMC）推断。

R语言可视化渐近正态性、收敛性：大数定律、中心极限定理、经验累积分布函数

By tecdat9月 13, 2021大数据部落, 数理统计中心极限, 可视化, 大数定律, 收敛性, 正态性, 渐近正态性, 经验累积分布, 经验累积分布函数

在我们的数理统计课程中，已经看到了大数定律（这在概率课程中已经被证明），证明

R语言计量经济学：工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断

By tecdat9月 10, 2021大数据部落, 数理统计, 经济, 计算机科学与技术2SLS, 两阶段最小二乘法, 人均食品消费, 回归, 回归诊断, 工具变量, 时间序列, 最小二乘法, 消费, 线性模型, 经济, 经济学, 计量经济学, 诊断, 食品消费

两阶段最小二乘法（2SLS）回归拟合的线性模型是一种常用的工具变量估计方法。

r语言逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例

By tecdat9月 9, 2021大数据部落, 数理统计, 计算机科学与技术Logistic, 回归, 对数几率回归, 录取, 研究生, 逻辑回归

Logistic回归，也称为Logit模型，用于对二元结果变量进行建模。

R语言实现随机前沿分析SFA、数据包络分析DEA、自由处置包分析FDH和BOOTSTRAP方法

By tecdat9月 8, 2021大数据部落, 数理统计, 经济, 计算机科学与技术bootstrap, DEA, FDH, R语言, SFA, 数据包络, 数据包络分析, 自由处置包分析, 随机前沿, 随机前沿分析

在经济学中，技术效率是指在既定的投入下产出可增加的能力或在既定的产出下投入可减少的能力。

R语言广义加性模型GAMs分析温度、臭氧环境数据绘制偏回归图与偏残差图

By tecdat9月 7, 2021可视化和设计, 大数据部落, 数理统计, 计算机科学与技术广义加性模型

我们被客户要求使用R库mgcv，用广义加性模型（GAMs）对环境数据进行建模。 WeChat Tencent

Python中TensorFlow的长短期记忆神经网络(LSTM)、指数移动平均法预测股票市场和可视化

By tecdat9月 6, 2021大数据部落, 数理统计, 经济, 计算机科学与技术, 金融LSTM, python, TensorFlow, 可视化, 市场, 指数移动平均, 指数移动平均法, 神经网络, 股票, 股票市场, 长短期记忆, 长短期记忆神经网络

本文探索Python中的长短期记忆（LSTM）网络，以及如何使用它们来进行股市预测。

R语言用线性混合效应（多水平/层次/嵌套）模型分析声调高低与礼貌态度的关系

By tecdat9月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术多水平, 混合效应, 线性, 线性混合效应, 线性混合效应模型

最近我们被客户要求撰写关于线性混合效应模型的研究报告，包括一些图形和统计输出。线性混合效应模型与我们已经知道的线性模型有什么不同？

数据感知游客的森林公园游憩需求

By tecdat9月 2, 2021可视化和设计, 地理，运输，旅行和物流, 大数据部落, 数理统计, 计算机科学与技术感知, 数据, 森林公园, 游客, 游憩, 游憩需求

“随着社会的进步，人们在改善物质生活的同时开始追求精神生活。

R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间

By tecdat9月 2, 2021大数据部落, 教育学, 数理统计, 计算机科学与技术JAGS, 博士, 博士生, 回归, 延期, 毕业, 论文, 论文时间, 贝叶斯, 贝叶斯回归

本文为读者提供了如何进行贝叶斯回归的基本教程。

python中的copula：Frank、Clayton和Gumbel copula模型估计与可视化

By tecdat9月 1, 2021大数据部落, 数理统计, 经济, 计算机科学与技术, 金融Clayton, copula, Frank, Gumbel, python, 可视化

简单地说，copulas是具有均匀边际的联合分布函数。

R语言Keras用RNN、双向RNNs递归神经网络、LSTM分析预测温度时间序列、 IMDB电影评分情感

By tecdat8月 30, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术IMDB, Keras, LSTM, RNN, 情感, 电影评分, 神经网络, 递归神经网络

在这篇文章中，我们将回顾三种提高循环神经网络的性能和泛化能力的高级方法。

R语言用极大似然和梯度下降算法估计GARCH(p)过程

By tecdat8月 30, 2021大数据部落, 数理统计GARCH, 极大似然, 梯度下降

本文考虑一些ARCH(p)过程，例如ARCH(1)。

Python用稀疏、高斯随机投影和主成分分析PCA对MNIST手写数字数据进行降维可视化

By tecdat8月 27, 2021大数据部落, 数理统计, 计算机科学与技术MNIST, PCA, 主成分分析, 随机投影

降维是在我们处理包含过多特征数据的大型数据集时使用的，提高计算速度，减少模型大小，并以更好的方式将巨大的数据集可视化。这种方法的目的是保留最重要的数据，同时删除大部分的特征数据。

上海无印良品地理空间分布特征与选址策略可视化研究

By tecdat8月 27, 2021可视化和设计, 地理，运输，旅行和物流, 大数据部落, 数理统计, 计算机科学与技术上海, 分布特征, 无印良品, 空间, 空间分布, 空间分布特征, 选址, 选址策略

本文以上海市无印良品为例，运用定性分析与定量研究相结合的方法，分析了无印良品宏观和微观空间分布特征、区位分析和选址策略，讨论了无印良品对于城市的影响和意义。

Python用Keras神经网络序列模型回归拟合预测、准确度检查和结果可视化

By tecdat8月 26, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, python, 准确度, 可视化, 回归, 序列, 拟合

我们可以很容易地用Keras序列模型拟合回归数据并预测测试数据。

R语言分布滞后非线性模型（DLNM）空气污染研究温度对死亡率影响建模应用

By tecdat8月 25, 2021医药生物, 大数据部落, 数理统计, 计算机科学与技术DLNM, 分布滞后非线性模型, 死亡率, 温度, 空气污染

环境应激源往往表现出时间上的延迟效应，这就要求使用足够灵活的统计模型来描述暴露-反应关系的时间维度。

R语言用AR，MA，ARIMA 模型进行时间序列预测

By tecdat8月 25, 2021大数据部落, 数理统计, 机器学习arima, 时间序列, 预测

本文讨论用ARIMA模型进行预测。考虑一些简单的平稳的AR（1）模拟时间序列

R语言广义二次跳跃、非线性跳跃扩散过程转移函数密度的估计及其应用

By tecdat8月 25, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术密度, 广义二次跳跃, 跳跃, 跳跃扩散, 跳跃扩散过程, 转移函数, 非线性

扩散的意思是过程可以包含布朗运动的成份，甚至写成布朗运动的积分形式。同时，这样的过程可以包含跳跃。

【视频讲解】Python用LSTM长短期记忆神经网络对不稳定降雨量时间序列进行预测分析

By tecdat8月 24, 2021大数据部落, 数理统计, 特色视频, 计算机科学与技术python, 分析, 时间序列, 神经网络, 长短期记忆, 降雨量, 预测

最近我们被客户要求撰写关于使用长短期记忆网络（LSTM）来拟合一个不稳定的时间序列的研究报告。

基于机器学习的印度肝脏病诊断分析

By tecdat8月 23, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术决策树, 印度, 支持向量回归, 机器学习, 肝脏病, 诊断, 逻辑回归, 随机森林

肝脏病在早期可能没有任何症状，不容易被察觉，或者症状是模糊的。肝脏病的症状和肝脏病的类型和程度高度相关，肝脏病的一般是通过肝功能测试诊断。

R语言Metropolis Hastings采样和贝叶斯泊松回归Poisson模型

By tecdat8月 23, 2021大数据部落, 数理统计, 计算机科学与技术Hastings, Metropolis, Poisson, 回归, 泊松, 贝叶斯, 采样

在本文中，我想向你展示如何使用R的Metropolis采样从贝叶斯Poisson回归模型中采样。

Python决策树、随机森林、朴素贝叶斯、KNN（K-最近邻）分类分析银行拉新活动挖掘潜在贷款客户

By tecdat8月 23, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术K-最近邻居, knn, 决策树, 分类, 拉新, 挖掘, 朴素贝叶斯, 贝叶斯, 贷款, 银行, 随机森林

项目背景：银行的主要盈利业务靠的是贷款，这些客户中的大多数是存款大小不等的责任客户（存款人）。

R语言广义相加（加性）模型（GAMs）与光滑函数可视化

By tecdat8月 20, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, GAMs, 光滑函数, 可视化, 广义加性模型, 广义相加模型

我们在研究工作中使用广义加性模型（GAMs）。mgcv软件包是一套优秀的软件，可以为非常大的数据集指定、拟合和可视化GAMs。

R语言可视化：ggplot2冲积/桑基图sankey分析大学录取情况、泰坦尼克幸存者数据

By tecdat8月 19, 2021可视化和设计, 大数据部落, 数理统计ggplot2, Sankey, 冲积图, 可视化, 大学, 大学录取情况, 幸存者, 录取, 数据, 桑基图, 泰坦尼克

本文介绍了冲积/桑基图，以及

定义了命名方案和冲积/桑基图的基本组成部分（轴、冲积层、流）。
描述了所识别的冲积/桑基图数据结构。
展示了一些流行的主题。

R语言中的神经网络预测时间序列：多层感知器（MLP）和极限学习机（ELM）数据分析报告

By tecdat8月 18, 2021大数据部落, 数理统计, 计算机科学与技术ELM, MLP, 多层感知器, 数据分析, 时间序列, 极限学习机, 神经网络, 预测

用于R语言的多层感知器（MLP）和极限学习机（ELM）进行时间序列预测。

Category Archives: 数理统计

关注我们，永远不要错过任何见解。