Category Archives: 计算机科学与技术

数据分享|R语言回归模型诊断、离群值分析学生考试成绩、病人医护质量满意度、婴儿死亡率和人均收入、针叶树荫面积数据

By tecdat10月 12, 2022农业, 医药生物, 大数据部落, 教育学, 数据库, 数理统计, 生态、气象学, 计算机科学与技术人均收入, 医护, 回归, 婴儿死亡率, 学生考试, 收入, 死亡率, 满意度, 病人, 离群值, 考试

一些标准的图形工具可以极大地帮助理解数据集并评估所建议模型的质量。

R语言ECM误差修正模型、均衡修正模型、受限VECM、协整检验、单位根检验即期利率市场数据

By tecdat10月 10, 2022大数据部落, 数理统计, 经济, 计算机科学与技术ECM, R语言, VECM, 利率, 协整检验, 单位根检验, 受限VECM, 均衡修正模型, 市场, 误差修正模型

传统上，协整的测试是在非常长的时间内进行的，本案例研究A测试了1960-2010年期间T-Bill利率和国债收益率之间的平衡。

R语言MCMC的lme4二元对数Logistic逻辑回归混合效应模型分析吸烟、喝酒和赌博影响数据

By tecdat10月 8, 2022大数据部落, 数理统计, 计算机科学与技术lme4, Logistic, MCMC, R语言, 二元, 吸烟, 喝酒, 对数, 模型, 混合效应, 赌博, 逻辑回归

最近我们被客户要求撰写关于逻辑回归混合效应模型的研究报告。吸烟、喝酒和赌博被认为是由许多因素造成的。

Python用NLP自然语言处理LSTM神经网络Twitter推特灾难文本数据、词云可视化与SVM，KNN，多层感知器，朴素贝叶斯，随机森林，GBDT对比

By tecdat9月 26, 2022大数据部落, 数理统计, 计算机科学与技术LSTM, nlp, python, twitter, 推特, 文本, 神经网络, 自然语言处理, 词云

Twitter是一家美国社交网络及微博客服务的网站，致力于服务公众对话。

函数型数据分析部分省市新冠疫情数据

By tecdat9月 19, 2022大数据部落, 数理统计, 计算机科学与技术函数型, 新冠, 疫情

统计学中传统的数据类型有截面数据和时间序列数据。

数据分享|WEKA用决策树、随机森林、支持向量机SVM、朴素贝叶斯、逻辑回归信贷违约预测报告

By tecdat9月 14, 2022大数据部落, 数据库, 数理统计, 经济, 计算机科学与技术svm, weka, 信贷, 信贷违约, 决策树, 支持向量机, 朴素贝叶斯, 贝叶斯, 违约, 逻辑回归, 随机森林, 预测

数据变得越来越重要，其核心应用“预测”也成为互联网行业以及产业变革的重要力量。

python可视化探索新冠疫情病毒与失业率是否存在线性关系

By tecdat9月 13, 2022大数据部落, 数理统计, 经济, 计算机科学与技术可视化, 失业率, 探索, 新冠, 新冠病毒, 疫情, 线性

2020年疫情愈演愈烈，新冠的检测与确诊人数也急剧上飙，失控的疫情无疑给经济造成了巨大的打击，同时也极大的影响了就业市场。

共享单车需求量用CART决策树、随机森林以及Xgboost算法登记分类及影响因素分析

By tecdat9月 8, 2022可视化和设计, 地理，运输，旅行和物流, 大数据部落, 技术支持, 数理统计, 计算机科学与技术共享单车, 影响因素, 需求

近年来，共享经济成为社会服务业内的一股重要力量。作为共享经济的一个代表性行业，共享单车快速发展，成为继地铁、公交之后的第三大公共出行方式。

Python用RNN神经网络LSTM优化EMD经验模态分解交易策略的股票价格MACD分析

By tecdat8月 15, 2022大数据部落, 技术支持, 数理统计, 经济, 计算机科学与技术, 金融emd, LSTM, MACD, python, RNN, 交易策略, 优化, 神经网络, 经验模态分解, 股票, 股票价格

预测股票价格，并在合适的时间产生交易策略实现收益，一直是一个热门的问题，到现在为止也提出了很多预测方法。

R语言多元线性回归、ARIMA分析美国不同候选人对经济GDP时间序列影响

By tecdat8月 10, 2022大数据部落, 技术支持, 数理统计, 经济, 计算机科学与技术arima, GDP, R语言, 候选, 回归, 时间序列, 经济, 美国

近段时间，美国总统大选引起了世界各国的关注。

Matlab用回归、SEIRD模型、聚类预测美国总统大选、新冠疫情对中美经济的影响

By tecdat8月 8, 2022医药生物, 大数据部落, 技术支持, 数理统计, 经济, 计算机科学与技术SEIRD, 中美经济, 回归, 大选, 总统大选, 新冠疫情, 聚类

WeChat Tencent QQ email print 由Haoran Chen撰写对于两人竞选，因为对

Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别

By tecdat8月 3, 2022图像处理, 大数据部落, 技术支持, 数理统计, 计算机科学与技术CNN, 人脸, 人脸识别, 卷积神经网络, 口罩, 口罩识别, 疫情, 疫情防控, 神经网络, 身份识别

运用Python 3.8.1版本，爬取网络数据，基于卷积神经网络（CNN）的图像处理原理，搭建口罩识别技术训练集，构建人脸识别系统，最终建立高校师生行踪查询管理系统。

Python用分子模拟动态促进DF Theory理论对二进制硬盘系统的适用性

By tecdat8月 1, 2022化学工程, 大数据部落, 技术支持, 数理统计, 计算机科学与技术DF Theory, 二进制硬盘系统, 分子模拟, 动态促进理论, 模拟

WeChat Tencent QQ email print 由Lawrence Xi撰写系统激发态密度与系统

R语言对airbnb数据nlp文本挖掘、词云可视化、回归GAM模型、交叉验证分析

By tecdat7月 28, 2022可视化和设计, 大数据部落, 技术支持, 数理统计, 计算机科学与技术airbnb, GAM, nlp, 交叉验证, 回归, 文本挖掘, 词云

数据量大，数据要进行清洗以及预处理，同时要多方面可视化，要探索多变量对因变量的影响。

基于简化的评分卡、Smote采样和随机森林的信贷违约预测

By tecdat7月 27, 2022大数据部落, 技术支持, 数理统计, 经济, 计算机科学与技术Smote, 信贷, 信贷违约预测, 评分卡, 违约, 采样, 随机森林

随着互联网经济的迅猛发展，个人信贷规模在近年来呈现了爆炸式增长。

SPSS用KMEANS(K均值)、两阶段聚类、RFM模型在P2P网络金融研究借款人、出款人行为数据规律

By tecdat7月 25, 2022大数据部落, 数理统计, 经济, 计算机科学与技术kmeans, K均值, SPSS, 聚类

随着P2P网络金融平台的交易量的激增，其交易数据不能得到充分有效地利用。

Eviews用向量自回归模型VAR实证分析公路交通通车里程与经济发展GDP协整关系时间序列数据和脉冲响应可视化

By tecdat7月 21, 2022地理，运输，旅行和物流, 大数据部落, 数理统计, 经济, 计算机科学与技术GDP, VaR, 公路交通, 协整, 向量自回归模型, 实证, 时间序列, 经济发展, 脉冲响应, 通车里程

河源市是国务院1988年1月7日批准设立的地级市，为了深入研究河源市公路交通与经济发展的关系，本文选取了1988－2014年河源市建市以来24年的地区生产总值（GDP）和公路通车里程（GL）的时间序列数据。

R语言参数自抽样法Bootstrap：估计MSE、经验功效、杰克刀Jackknife、非参数自抽样法可视化

By tecdat7月 20, 2022大数据部落, 数理统计, 计算机科学与技术bootstrap, MSE, 参数, 自抽样, 自抽样法

我们如何回答它：估计从标准柯西分布（t 分布 w/df = 1）生成的大小为 20 的随机样本的水平 \(k\) 修剪均值的 MSE。

R语言使用逻辑回归Logistic、单因素方差分析anova和数据可视化分类iris鸢尾花数据集

By tecdat7月 19, 2022大数据部落, 数理统计, 计算机科学与技术Logistic, 单因素, 单因素ANOVA, 回归, 方差分析, 逻辑回归

本文将探讨 Fisher 和 Anderson 鸢尾花数据集中呈现的三个变量之间的关系，特别是virginica 和 versicolor 级别的因变量变量物种对预测变量花瓣长度和花瓣宽度的逻辑回归。

数据评估三方科技公司开发人员能力

By tecdat7月 18, 2022可视化和设计, 大数据部落, 数理统计, 计算机科学与技术三方, 三方科技公司, 开发人员, 数据, 聚类

各公司信息科技的建设离不开三方科技公司的参与，而三方科技公司提供的开发人员能力高低不一

Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘实例

By tecdat7月 18, 2022大数据部落, 数理统计, 计算机科学与技术Apriori, Carma, Modeler, SPSS, spss modeler, 关联规则, 商品, 超市, 顾客

作为数据挖掘的一个重要研究方向—关联规则用于发现数据项之间隐含的深层次的关联

Spss用K均值聚类Kmeans、决策树、逻辑回归和T检验研究不同因素对通勤出行交通方式选择的影响调查数据分析

By tecdat7月 14, 2022地理，运输，旅行和物流, 大数据部落, 数理统计, 计算机科学与技术kmeans, K均值聚类, SPSS, t检验, 交通, 交通方式, 决策树, 出行, 回归, 聚类, 通勤, 逻辑回归

某交通工程专业博士生想要研究不同因素对通勤交通方式选择的影响。

R语言定量方法：回归，虚拟变量和交互项，假设检验:F检验、AIC和 BIC分析学生成绩数据带自测题

By tecdat7月 13, 2022大数据部落, 数理统计, 计算机科学与技术AIC, BIC, F检验, 交互, 交互项, 假设检验, 回归, 学生成绩, 定量, 虚拟变量

如果_真实_模型包括_X_ 1 和_X_ 2 ，但我们忘记了_X_ 2，那么 – 在某些情况下 – 对_X_的估计将会有偏差。OVB 需要：cor( X 1, X 2)！= 0 和 cor( X 1, y ) ！= 0

R语言广义矩量法GMM和广义经验似然GEL估计ARMA、CAPM模型分析股票收益时间序列

By tecdat7月 12, 2022大数据部落, 数理统计, 经济, 计算机科学与技术ARMA, CAPM, GEL, GMM, 广义矩量法, 广义经验似然, 时间序列, 股票, 股票收益

本文展示了如何通过矩量的广义方法和广义经验似然来估计模型。

R语言二手车汽车销售数据可视化探索：预处理、平滑密度图、地理空间可视化

By tecdat7月 11, 2022大数据部落, 数理统计, 计算机科学与技术二手车, 可视化, 地理空间, 地理空间数据分析, 平滑密度, 汽车, 销售, 预处理

本文用爬虫采集了汽车销售数据，后来对其进行了扩展，创建这个数据集，其中包括境内的所有二手车辆或者经销商车辆条目数据。

R语言VaR市场风险计算方法与回测、用Logit逻辑回归、Probit模型信用风险与分类模型

By tecdat7月 7, 2022大数据部落, 数理统计, 经济, 计算机科学与技术Logit, Probit, VaR, 信用风险, 分类, 回归, 回测, 市场风险, 逻辑回归

市场风险指的是由金融市场中资产的价格下跌或价格波动增加所导致的可能损失。

R语言主成分pca、因子分析、聚类对地区经济研究分析重庆市经济指标

By tecdat7月 6, 2022大数据部落, 数理统计, 经济, 计算机科学与技术PCA, 主成分, 因子分析, 指标, 经济, 聚类, 重庆

建立重庆市经济指标发展体系，以重庆市一小时经济圈作为样本，运用因子分析方法进行实证分析

R语言Bootstrap、百分位Bootstrap法抽样参数估计置信区间分析通勤时间和学生锻炼数据

By tecdat7月 5, 2022大数据部落, 数理统计, 计算机科学与技术bootstrap, 参数估计, 学生, 百分位, 置信区间, 通勤时间

本文展示了如何使用 R 构建Bootstrap自举置信区间的示例。

R语言用logistic逻辑回归和AFRIMA、ARIMA时间序列模型预测世界人口

By tecdat7月 4, 2022大数据部落, 数理统计, 计算机科学与技术AFRIMA, arima, Logistic, 世界人口, 人口, 回归, 数据, 时间序列, 逻辑回归, 预测

本文应用R软件技术，通过在世界银行网站上查阅的世界人口历史数据，分别利用logistic模型、ARFMA模型、ARIMA模型、时间序列模型对从2016到2100年的世界人口进行预测。

数据探索电商平台用户行为流失分析

By tecdat6月 30, 2022可视化和设计, 大数据部落, 数理统计, 计算机科学与技术流失, 流失分析, 用户, 用户付费模型, 用户异常行为, 用户数据, 用户流失, 用户画像, 用户行为, 用户行为数据, 用户行为流失, 电商

随着互联网和电子商务的发展，人们已经习惯了网上购物。

R语言线性回归模型拟合诊断异常值分析家庭燃气消耗量和卡路里实例带自测题

By tecdat6月 29, 2022大数据部落, 数理统计, 计算机科学与技术卡路里, 回归, 异常值, 拟合诊断, 燃气, 线性回归, 自测题

考虑我们从实验、事件等中观察到一些数据 y 的情况。

R语言GLM广义线性模型：逻辑回归、泊松回归拟合小鼠临床试验数据（剂量和反应）示例和自测题

By tecdat6月 28, 2022医药生物, 大数据部落, 数理统计, 计算机科学与技术临床试验, 回归, 广义线性模型, 数据, 泊松回归, 逻辑回归, 预测

在拟合 GLM（并检查残差）之后，可以使用 z 检验一一检验估计参数的显着性，即将估计值与其标准误差进行比较。

R语言惩罚逻辑回归、线性判别分析LDA、广义加性模型GAM、多元自适应回归样条MARS、KNN、二次判别分析QDA、决策树、随机森林、支持向量机SVM分类优质劣质葡萄酒十折交叉验证和ROC可视化

By tecdat6月 27, 2022大数据部落, 数理统计, 计算机科学与技术GAM, knn, LDA, MARS, QDA, svm, 二次判别分析, 交叉验证, 决策树, 判别分析, 十折交叉验证, 回归, 多元自适应回归样条, 广义加性模型, 支持向量机, 线性判别分析, 葡萄酒, 逻辑回归, 随机森林

数据包含有关葡萄牙“Vinho Verde”葡萄酒的信息。该数据集有1599个观测值和12个变量，分别是固定酸度、挥发性酸度、柠檬酸、残糖、氯化物、游离二氧化硫、总二氧化硫、密度、pH值、硫酸盐、酒精和质量。

Python用ARIMA ，ARIMAX预测商店商品销售需求时间序列数据

By tecdat6月 23, 2022大数据部落, 数理统计, 经济, 计算机科学与技术ARIMAX, 数据, 时间序列, 预测

本文在相对简单的数据集上探索不同的时间序列技术。

Matlab随机波动率SV、GARCH用MCMC马尔可夫链蒙特卡罗方法分析汇率时间序列

By tecdat6月 22, 2022大数据部落, 数理统计, 经济, 计算机科学与技术GARCH, MCMC, SV, 时间序列, 股票, 蒙特卡罗, 随机波动率, 预测, 马尔可夫链

波动率是一个重要的概念，在金融和交易中有许多应用。它是期权定价的基础。波动率还可以让您确定资产配置并计算投资组合的风险价值 (VaR)。

Matlab用深度学习循环神经网络RNN长短期记忆LSTM进行波形时间序列数据预测

By tecdat6月 21, 2022大数据部落, 数理统计, 计算机科学与技术LSTM, RNN, 循环神经网络, 时间序列, 时间序列数据, 时间序列预测, 波形, 深度学习, 神经网络, 长短期记忆, 长短期记忆人工, 长短期记忆人工神经网络, 长短期记忆模型, 长短期记忆神经网络, 长短期记忆网络, 预测

此示例说明如何使用长短期记忆 (LSTM) 网络预测时间序列

Python用MCMC马尔科夫链蒙特卡洛、拒绝抽样和Metropolis-Hastings采样算法

By tecdat6月 20, 2022大数据部落, 数理统计, 计算机科学与技术MCMC, Metropolis-Hastings, python，马尔可夫，, 抽样, 拒绝抽样, 蒙特卡洛, 采样, 隐马尔可夫, 隐马尔可夫模型, 隐马尔科夫模型, 马尔, 马尔可夫, 马尔可夫体制转换模型, 马尔可夫切换, 马尔可夫区制转换, 马尔可夫区制转移, 马尔可夫机制转换模型, 马尔可夫状态转换, 马尔可夫转换, 马尔可夫转换模型, 马尔可夫链, 马尔科夫, 马尔科夫机制转换模型, 马尔科夫转换, 马尔科夫链, 马氏链，马尔可夫，R语言

WeChat Tencent QQ email print 由Kaizong Ye，Liao Bao撰写马尔

R语言用隐马尔可夫Profile HMM模型进行生物序列分析和模拟可视化

By tecdat6月 16, 2022医药生物, 大数据部落, 数理统计, 经济, 计算机科学与技术HMM, Profile HMM, 模拟, 生物序列, 隐马尔可夫, 马尔可夫

本文开发和应用用于生物序列分析的隐马尔可夫模型和HMM。

Matlab用向量误差修正VECM模型蒙特卡洛Monte Carlo预测债券利率时间序列和MMSE 预测

By tecdat6月 15, 2022大数据部落, 数理统计, 经济, 计算机科学与技术MMSE, Monte Carlo, VEC, VECM, 债券, 利率, 向量误差修正, 时间序列, 蒙特卡洛, 预测

此示例说明如何从 VEC( q ) 模型生成 Monte Carlo 预测。

R语言和Python对copula模型Gaussian、t、Clayton 和Gumbel族可视化理论概念和文献计量使用情况

By tecdat6月 14, 2022大数据部落, 数理统计, 经济, 计算机科学与技术Clayton, copula, Gaussian, Gumbel, python, 可视化, 时间序列

本文包含一些直观的示例来说明 copula 理论的核心概念。

R语言coda贝叶斯MCMC Metropolis-Hastings采样链分析和收敛诊断可视化

By tecdat6月 13, 2022大数据部落, 数理统计, 计算机科学与技术coda, Hastings, MCMC, Metropolis, Metropolis Hasting, Metropolis Hastings, Metropolis-Hasting, Metropolis-Hastings, 收敛, 诊断, 贝叶斯, 采样, 链分析

实现一个简单的 Metropolis-Hastings MCMC 从该模型的后验分布中采样。

Python 用几何布朗运动模型和蒙特卡罗Monte Carlo随机过程模拟股票价格可视化分析耐克NKE股价时间序列数据

By tecdat6月 9, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融Monte Carlo, 价格, 几何布朗运动, 布朗运动, 股票, 蒙特卡罗, 随机过程

金融资产/证券已使用多种技术进行建模。

Python用KShape对时间序列进行聚类和肘方法确定最优聚类数k可视化

By tecdat6月 8, 2022大数据部落, 数理统计, 计算机科学与技术KShape, python, 时间序列, 最优聚类数, 聚类, 肘方法

时序数据的聚类方法

Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型

By tecdat6月 7, 2022大数据部落, 数理统计, 计算机科学与技术Uplift, Uplift Modeling, 因果推断, 增益模型, 增量, 智能营销, 机器学习

使用 ML 进行提升建模和因果推理。

Python在Scikit-Learn可视化随机森林中的决策树分析房价数据

By tecdat6月 6, 2022可视化和设计, 大数据部落, 数理统计, 计算机科学与技术决策树, 可视化, 房价, 数据, 随机森林

随机森林是决策树的集合。在这篇文章中，我将向您展示如何从随机森林中可视化决策树。

Python用RNN循环神经网络：LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID-19新冠疫情新增人数时间序列预测

By tecdat6月 2, 2022大数据部落, 数理统计, 计算机科学与技术arima, COVID, GRU, LSTM, RNN, 回归, 循环神经网络, 新冠, 时间序列, 疫情, 神经网络, 长期记忆, 门循环单元

该数据由Hopkins 大学根据世界各国提供的新病例数据提供。

Python用Apriori算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

By tecdat6月 1, 2022大数据部落, 数理统计, 计算机科学与技术Apriori, 书籍, 亚马逊, 关联推荐, 关联规则, 网络图

Apriori 算法是一个相当新的算法，由 Agrawal 和 Srikant 于 1994 年提出。

数据视角可视化分析豆瓣电影评分爬虫数据

By tecdat5月 31, 2022可视化和设计, 大数据部落, 数理统计, 计算机科学与技术可视化, 爬虫, 电影, 电影评分, 评分, 豆瓣

豆瓣已经成为国内影迷和影评人的聚集地。

Python条件生存森林模型Conditional Survival Forest分类预测客户流失交叉验证可视化

By tecdat5月 30, 2022大数据部落, 数理统计, 计算机科学与技术Conditional Survival Forest, 交叉验证, 可视化, 客户流失, 条件生存森林, 流失

WeChat Tencent QQ email print 由Kaizong Ye，Sherry Deng撰写

R语言逻辑回归Logisitc逐步回归训练与验证样本估计分析心脏病数据参数可视化

By tecdat5月 26, 2022大数据部落, 数理统计, 计算机科学与技术可视化, 回归, 心脏病, 逐步回归, 逻辑回归

在进行交叉验证之前，很自然地说“我会预烧 50%（比如说）我的数据来训练一个模型，然后用剩下的来拟合模型”。

R语言零膨胀泊松回归ZERO-INFLATED POISSON（ZIP）模型分析露营钓鱼数据实例估计IRR和OR

By tecdat5月 25, 2022大数据部落, 数理统计, 生态、气象学, 计算机科学与技术IRR, OR, ZERO INFLATED POISSON, ZERO-INFLATED POISSON, ZIP, 回归, 泊松, 钓鱼, 零膨胀泊松回归, 露营

零膨胀泊松回归用于对超过零计数的计数数据进行建模。

R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列

By tecdat5月 24, 2022R语言辅导, 大数据部落, 技术支持, 数理统计, 计算机科学CS辅导, 计算机科学与技术GARCH, VaR, 回测, 时间序列, 波动率, 股市, 预测, 风险价值

风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量，也被投资组合经理等从业者用来解释未来市场风险。

R语言决策树和随机森林分类电信公司用户流失churn数据和参数调优、ROC曲线可视化

By tecdat5月 23, 2022R语言辅导, 大数据部落, 数理统计, 计算机科学CS辅导, 计算机科学与技术churn, ROC, 决策树, 参数调优, 用户流失, 电信公司, 随机森林

在本教程中，我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法。

R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列

By tecdat5月 16, 2022大数据部落, 数理统计, 经济, 计算机科学与技术CSIR, HMM, 序列重要性重抽样, 收益率, 时间序列, 波动率, 波动率建模, 离散随机波动率, 股票, 重抽样, 重要性重抽样, 随机波动率, 随机波动率模型, 隐马尔可夫, 预测波动率, 高频波动率

在本笔记本中，我们向读者介绍了基本的随机波动率模型，并通过连续顺序重要性重采样讨论了它们的估计。我们使用收益率数据集来讨论 CSIR 在随机波动率模型估计中的实现和性能。

R语言用主成分分析（PCA）PCR回归进行预测汽车购买信息可视化

By tecdat5月 12, 2022大数据部落, 数理统计, 计算机科学与技术PCA, PCR, 主成分, 主成分分析, 回归, 汽车

在这个项目中，我讨论了如何使用主成分分析 (PCA) 进行简单的预测。

Matlab最小二乘法：线性最小二乘、加权线性最小二乘、稳健最小二乘、非线性最小二乘与剔除异常值效果比较

By tecdat5月 10, 2022大数据部落, 数理统计, 计算机科学与技术剔除异常值, 加权线性最小二乘, 异常值, 最小二乘, 最小二乘法, 稳健最小二乘, 线性最小二乘, 非线性最小二乘

matlab软件在拟合数据时使用最小二乘法。

R语言贝叶斯Metropolis-Hastings Gibbs 吉布斯采样器估计变点指数分布分析泊松过程车站等待时间

By tecdat5月 9, 2022大数据部落, 数理统计, 计算机科学与技术Gibbs, Metropolis, Metropolis Hastings, Metropolis-Hastings, 估计, 变点, 吉布斯, 指数分布, 泊松过程, 等待时间, 贝叶斯, 车站等待时间, 采样, 采样器

指数分布是泊松过程中事件之间时间的概率分布，因此它用于预测到下一个事件的等待时间。

Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

By tecdat5月 7, 2022大数据部落, 数理统计, 经济, 计算机科学与技术LSTM, MSE, RNN, TensorFlow, 循环神经网络, 时间序列, 神经网络, 股市, 股票, 股票市场, 预测

该项目包括：自 2000 年 1 月以来的股票价格数据。我们使用的是 Microsoft 股票。

Python用Keras的LSTM神经网络进行时间序列预测天然气价格例

By tecdat5月 5, 2022大数据部落, 数理统计, 计算机科学与技术Keras, LSTM, 价格, 天然气, 数据, 时间序列, 神经网络, 预测

一个简单的编码器-解码器LSTM神经网络应用于时间序列预测问题

关联规则Apriori挖掘豆瓣读书评论爬虫采集数据与可视化

By tecdat4月 29, 2022可视化和设计, 大数据部落, 数理统计, 计算机科学与技术Apriori, 关联规则, 数据, 爬虫, 评论, 豆瓣, 豆瓣读书, 采集, 采集数据

主题将紧紧围绕以下几点：有哪些书籍值得推荐？一般书籍的价格是多少？一本书的评分和评论数量之间是否存在某种关系？

R语言近似贝叶斯计算MCMC（ABC-MCMC）轨迹图和边缘图可视化

By tecdat4月 27, 2022大数据部落, 数理统计, 计算机科学与技术ABC, ABC-MCMC, MCMC, 贝叶斯, 轨迹图, 近似贝叶斯计算

WeChat Tencent QQ email print 由Kaizong Ye，Weilong Zhang

R语言马尔可夫MCMC中的Metropolis Hastings，MH算法抽样（采样）法可视化实例

By tecdat4月 26, 2022大数据部落, 数理统计, 计算机科学与技术MCMC, Metropolis Hasting, Metropolis Hastings, MH, 抽样, 贝叶斯, 采样, 马尔可夫

Metropolis Hastings 算法是一种非常简单的算法，用于从难以采样的分布中生成样本。

MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类

By tecdat4月 25, 2022大数据部落, 数理统计, 计算机科学与技术LSTM, 传感器, 分类, 序列, 手机, 时间序列, 深度学习, 神经网络, 长短期记忆, 预测

此示例说明如何使用长短期记忆 (LSTM) 网络对序列数据的每个时间步长进行分类。

R语言广义线性模型GLM：线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟

By tecdat4月 21, 2022大数据部落, 数理统计, 计算机科学与技术glm, 二项式, 冰淇淋, 回归, 对数变换, 广义线性模型, 数据, 时间序列, 最小二乘, 模拟, 泊松, 线性最小二乘, 线性模型, 逻辑回归, 销售, 预测

线性模型是统计学的基础，但它的意义远不止用尺子在几个点上画一条线。

R语言极值理论：希尔HILL统计量尾部指数参数估计可视化

By tecdat4月 20, 2022大数据部落, 数理统计, 经济, 计算机科学与技术HILL, 参数估计, 尾部指数, 希尔, 极值理论, 统计量

极值理论对样本尾部分布的极值指数的估计方法主要有两类：半参数方法和全参数方法，前者主要是基于分布尾部的 Hill 估计量，后者则主要基于广义帕累托分布。

R语言GARCH模型对股市sp500收益率bootstrap、滚动估计预测VaR、拟合诊断和蒙特卡罗模拟可视化

By tecdat4月 19, 2022大数据部落, 数理统计, 经济, 计算机科学与技术, 金融bootstrap, GARCH, SP500, VaR, 拟合诊断, 收益率, 模拟, 滚动估计, 滚动估计预测, 滚动预测, 股市, 股票, 蒙特卡罗, 诊断

Box 等人的开创性工作(1994) 在自回归移动平均模型领域的相关工作为波动率建模领域的相关工作铺平了道路，分别由 Engle (1982) 和 Bollerslev (1986) 引入了 ARCH 和 GARCH 模型。

python TensorFlow 2二维卷积神经网络CNN对图像物体识别混淆矩阵评估

By tecdat4月 18, 2022大数据部落, 数理统计, 计算机科学与技术CNN, TensorFlow, 卷积神经网络, 图像, 图像识别, 混淆矩阵

本文演示了如何训练一个简单的卷积神经网络 (CNN) 来对 CIFAR 图像进行分类。

Python银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机svm分析营销活动数据

By tecdat4月 14, 2022大数据部落, 数理统计, 经济, 计算机科学与技术knn, svm, 决策树, 回归, 营销, 贝叶斯, 银行, 预测, 高斯朴素贝叶斯

该数据与银行机构的直接营销活动相关，营销活动基于电话。

Category Archives: 计算机科学与技术

关注我们，永远不要错过任何见解。