Category Archives: 机器学习

R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

By tecdat7月 14, 2021大数据部落, 数据库, 数理统计, 机器学习, 计算机科学与技术Bayes, Naive Bayes, 决策树, 心脏病, 贝叶斯, 逻辑回归, 随机森林, 预测

这个数据集可以追溯到1988年，由四个数据库组成。

R语言实现k-means聚类优化的分层抽样(Stratified Sampling)分析各市镇的人口数据

By tecdat7月 12, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术k-means, Stratified Sampling, 人口数据, 分层, 分层抽样, 聚类

假设我们需要设计一个抽样调查，有一个完整的框架，包含目标人群的信息（识别信息和辅助信息）。

R语言蒙特卡洛方法：方差分量的Metropolis Hastings（M-H）、吉布斯Gibbs采样比较分析

By tecdat7月 9, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Hastings, M-H, Metropolis, Metropolis Hastings, 吉布斯, 方差, 方差分量, 蒙特卡洛, 蒙特卡洛方法

蒙特卡洛方法利用随机数从概率分布P(x)中生成样本，并从该分布中评估期望值，该期望值通常很复杂，不能用精确方法评估。

R语言文本挖掘、情感分析和可视化哈利波特小说文本数据

By tecdat7月 6, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术可视化, 情感分析, 文本挖掘

一旦我们清理了我们的文本并进行了一些基本的词频分析，下一步就是了解文本中的观点或情感。这被认为是情感分析，本教程将引导你通过一个简单的方法来进行情感分析。

R语言逻辑回归logistic模型预测泰坦尼克titanic 数据集生还情况

By tecdat7月 6, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Logistic, titanic, 回归, 泰坦尼克, 逻辑回归

逻辑回归是一种拟合回归曲线的方法，y=f(x)，当y是一个分类变量时。

R语言中贝叶斯网络（BN）、动态贝叶斯网络、线性模型分析错颌畸形数据

By tecdat7月 5, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术BN, 动态, 数据, 线性, 线性模型, 贝叶斯, 贝叶斯网络

贝叶斯网络（BN）是一种基于有向无环图的概率模型，它描述了一组变量及其相互之间的条件依赖性。

R语言DTW(Dynamic Time Warping) 动态时间规整算法分析时间序列数据和可视化

By tecdat7月 2, 2021可视化和设计, 大数据部落, 机器学习, 计算机科学与技术DTW, Dynamic Time Warping, 时间序列

动态时间规整（DTW,Dynamic time warping,动态时间归整/规整/弯曲）是一种衡量两个序列之间最佳排列的算法。

R语言Bootstrap的岭回归和自适应LASSO回归可视化

By tecdat7月 1, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术bootstrap, LASSO, 可视化, 回归, 岭回归, 自适应

使用glmnet软件包中的相关函数对岭回归和lasso套索回归进行分析。

R语言聚类有效性：确定最优聚类数分析IRIS鸢尾花数据和可视化

By tecdat6月 28, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, 可视化, 最优, 最优聚类数, 有效性, 聚类, 鸢尾花

这个数据集常用于数据概述、可视化和聚类模型。

【视频讲解】Python蒙特卡罗（Monte Carlo）模拟计算投资组合的风险价值（VaR）

By tecdat6月 25, 2021大数据部落, 数理统计, 机器学习, 特色视频, 经济, 计算机科学与技术, 金融Carlo, Monte, Monte Carlo, VaR, 投资, 投资组合, 模拟, 组合, 蒙特卡洛, 风险价值

VaR是 “风险价值 “的缩写，是许多公司和银行用来确定其公司内部金融风险水平的工具。风险值是为公司的投资而计算的，也可能是为检查银行或公司所管理的投资组合的风险水平。

R语言k-means聚类、层次聚类、主成分（PCA）降维及可视化分析鸢尾花iris数据集

By tecdat6月 22, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, k-means, PCA, 主成分, 可视化, 层次聚类, 数据, 聚类, 降维, 鸢尾花

(a)部分：k-means聚类
使用k-means聚类法将数据集聚成2组。
画一个图来显示聚类的情况
使用k-means聚类法将数据集聚成3组。
画一个图来显示聚类的情况
(b)部分：层次聚类
使用全连接法对观察值进行聚类。
使用平均和单连接对观测值进行聚类。
绘制上述聚类方法的树状图。

R语言用lme4多层次（混合效应）广义线性模型（GLM），逻辑回归分析教育留级调查数据

By tecdat6月 18, 2021大数据部落, 教育学, 数理统计, 机器学习, 计算机科学与技术glm, lme4, 回归, 多层, 广义线性模型, 教育, 数据, 混合, 线性模型, 调查, 逻辑回归

最近我们被客户要求撰写关于GLM模型的研究报告。具体来说，本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用，以及模型评估的方法。

R语言 PCA(主成分分析)，CA(对应分析)夫妻职业差异和马赛克图可视化

By tecdat6月 11, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术CA, PCA, 主成分, 主成分分析, 可视化, 夫妻职业, 对应, 对应分析, 差异, 马赛克图

主成分分析法是数据挖掘中常用的一种降维算法。

MATLAB中用BP神经网络预测人体脂肪百分比数据

By tecdat6月 10, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术BP, matlab, 神经网络, 预测

这个例子说明了一个函数拟合的神经网络如何根据测量结果来估计脂肪百分比。

【视频讲解】R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

By tecdat6月 9, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术Apriori, 交互, 交互可视化, 交易, 交易数据, 关联规则, 可视化, 挖掘, 算法

关联规则挖掘是一种无监督的学习方法，从交易数据中挖掘规则。

R语言Lasso回归模型变量选择和糖尿病发展预测模型

By tecdat6月 8, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, 变量选择, 回归, 模型, 糖尿病, 预测

Lease Absolute Shrinkage and Selection Operator（LASSO）在给定的模型上执行正则化和变量选择。

R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

By tecdat6月 7, 2021数理统计, 机器学习, 计算机科学与技术LASSO, 分位数, 分位数回归, 回归, 自适应, 贝叶斯

贝叶斯回归分位数在最近的文献中受到广泛关注，本文实现了贝叶斯系数估计和回归分位数（RQ）中的变量选择，带有lasso和自适应lasso惩罚的贝叶斯。

Python中用Prophet模型对天气时间序列进行预测与异常检测

By tecdat6月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Prophet, python, 天气, 异常, 异常检测, 时间序列, 预测

基本的Prophet模型是一个可分解的单变量时间序列模型，结合了趋势、季节性和节假日效应。

R语言状态空间模型和卡尔曼滤波预测酒精死亡人数时间序列

By tecdat6月 2, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术卡尔曼滤波, 时间序列, 死亡人数, 状态空间模型, 酒精, 预测

状态空间建模是一种高效、灵活的方法，用于对大量的时间序列和其他数据进行统计推断。本文介绍了状态空间建模，其观测值来自指数族，即高斯、泊松、二项、负二项和伽马分布。

数据挖掘：香水电商销售策略分析

By tecdat6月 1, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Apriori, 关联规则, 决策树, 数据, 数据挖掘, 电商, 策略, 销售, 香水

就香水市场份额而言，亚洲占全球销售额的8%，仅占拉丁美洲的20%，而中国仅占全球销售额的0.8%。

R语言用LOESS(局部加权回归)季节趋势分解（STL）进行时间序列异常检测

By tecdat6月 1, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LOESS, STL, 分解, 回归, 季节趋势, 季节趋势分解, 局部加权回归, 异常检测, 时间序列, 趋势分解

这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法。

Python用时变马尔可夫区制转换（Markov regime switching）自回归模型分析经济时间序列

By tecdat5月 28, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融Markov, Markov regime switching, 区制, 区制转换, 时变, 时间序列, 经济, 自回归, 马尔, 马尔可夫, 马尔可夫区制转换

本文提供了一个在统计模型中使用马可夫转换模型模型的例子，来复现Kim和Nelson（1999）中提出的一些结果。

R语言有限混合模型(FMM,finite mixture model)及其EM算法聚类分析间歇泉喷发时间

By tecdat5月 27, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术EM, finite mixture model, FMM, 数据, 有限混合模型, 聚类, 间歇泉

既包括传统的方法，如单变量和多变量正态混合的EM算法，也包括反映有限混合模型的一些最新研究的方法。许多算法都是EM算法或基于类似EM的思想，因此本文包括有限混合模型的EM算法的概述。

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

By tecdat5月 26, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Logisitc, RandomForest, 可视化, 回归, 心脏病, 逻辑回归, 随机森林, 预测

本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说，我们的目标是在心脏研究的数据集上建立一些预测模型，并建立探索性和建模方法。但什么是心脏研究？

使用R语言进行多项式回归、非线性回归模型曲线拟合

By tecdat5月 19, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术回归, 多项式, 拟合, 曲线, 非线性, 非线性回归

对于线性关系，我们可以进行简单的线性回归。对于其他关系，我们可以尝试拟合一条曲线。

R语言用ARIMA模型，ARIMAX模型预测冰淇淋消费时间序列数据

By tecdat5月 17, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, ARIMAX, 冰淇淋, 时间序列, 模型, 消费, 预测

标准的ARIMA（移动平均自回归模型）模型允许只根据预测变量的过去值进行预测。

【视频讲解】R语言主成分分析（PCA）葡萄酒可视化：主成分得分散点图和载荷图

By tecdat5月 14, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术PCA, 主成分, 主成分分析, 可视化

我们将使用葡萄酒数据集进行主成分分析。

【视频讲解】R语言生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素

By tecdat5月 13, 2021大数据部落, 数理统计, 机器学习, 特色视频, 生态、气象学, 计算机科学与技术BRT, 增强回归树, 影响, 影响因素, 生存分布, 生态学, 预测

本文是一个简短的教程，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。

matlab实现扩展卡尔曼滤波(EKF)进行故障检测

By tecdat5月 12, 2021大数据部落, 控制科学与工程, 数理统计, 机器学习, 机械工程及自动化, 电气工程及自动化, 计算机科学与技术EKF, matlab, 卡尔曼, 卡尔曼滤波, 扩展卡尔曼滤波, 故障检测, 滤波

本文展示了如何使用扩展卡尔曼滤波器进行故障检测。本文使用扩展的卡尔曼滤波器对一个简单的直流电机的摩擦力进行在线估计。

R语言经济学：动态模型平均(DMA)、动态模型选择(DMS)预测原油价格时间序列

By tecdat5月 11, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融DMA, DMS, 动态模型平均, 动态模型选择, 原油, 时间序列, 经济, 预测

简要地提供了在经济学中使用模型平均和贝叶斯方法的论据，使用了动态模型平均法（DMA），并与ARIMA、TVP等方法进行比较。希望对经济和金融领域的从业人员和研究人员有用。

R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者

By tecdat5月 10, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Bagging, Logistic, logistic regression, 决策树, 分类, 回归, 心脏病, 森林, 逻辑回归

通常，bagging 与树有关，用于生成森林。但实际上，任何类型的模型都有可能使用bagging 。

R语言多项式回归拟合非线性关系

By tecdat5月 8, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术回归, 多项式回归, 非线性关系

多项式回归是独立x变量和因果y变量之间的非线性关系。

【视频讲解】R语言逻辑回归（Logistic回归）模型分类预测病人冠心病风险

By tecdat5月 6, 2021大数据部落, 数据库, 数理统计, 机器学习, 特色视频, 计算机科学与技术Logistic, 冠心病, 分类, 回归, 病人, 逻辑回归, 预测

本文的目的是完成一个逻辑回归分析。使你对分析步骤和思维过程有一个基本概念。

R语言时变向量自回归（TV-VAR）模型分析时间序列和可视化

By tecdat4月 28, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术TV-VAR, VAR模型, 可视化, 向量自回归, 时变, 时间序列

在心理学研究中，个人主体的模型正变得越来越流行。原因之一是很难从人之间的数据推断出个人过程。另一个原因是，由于移动设备无处不在，从个人获得的时间序列变得越来越多。

R语言用样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

By tecdat4月 27, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Adaboost, boosting, GBM, 决策树, 分类, 动态可视化, 可视化, 回归, 样条曲线, 梯度提升

Boosting算法是一种把若干个分类器整合为一个分类器的方法，也就是一种集成分类方法（Ensemble Method）。

R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析

By tecdat4月 26, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Logistic, LOWESS, 回归, 回归诊断, 局部加权回归, 残差, 诊断, 逻辑回归

目前，回归诊断不仅用于一般线性模型的诊断，还被逐步推广应用于广义线性模型领域（如用于logistic回归模型）。

Matlab中的偏最小二乘法（PLS）回归模型，离群点检测和变量选择

By tecdat4月 23, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术PLS, 偏最小二乘, 偏最小二乘法, 变量选择, 回归, 最小二乘, 最小二乘法, 离群点, 离群点检测

最近我们被客户要求撰写关于PLS的研究报告。本文建立偏最小二乘法（PLS）回归（PLSR）模型，以及预测性能评估。

R语言混合效应逻辑回归（mixed effects logistic）模型分析肺癌数据

By tecdat4月 22, 2021大数据部落, 数据库, 数理统计, 机器学习, 计算机科学与技术Logistic, 混合效应, 肺癌, 逻辑回归

最近我们被客户要求撰写关于混合效应逻辑回归的研究报告。

R语言用LASSO，adaptive LASSO 预测通货膨胀时间序列

By tecdat4月 21, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术adaLASSO, adaptive LASSO, LASSO, 时间序列, 通货膨胀, 预测

如果你了解数据科学领域，你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型，试图将不相关的变量从模型中排除。

R语言用主成分PCA、逻辑回归、决策树、随机森林分析心脏病数据并高维可视化

By tecdat4月 20, 2021可视化和设计, 大数据部落, 机器学习, 计算机科学与技术PCA, 主成分, 决策树, 可视化, 心脏病, 逻辑回归, 随机森林

最近我们被客户要求撰写关于心脏病数据的研究报告。在讨论分类时，我们经常分析二维数据（一个自变量，一个因变量）。

【视频讲解】R语言进行数据结构化转换：Box-Cox变换、“凸规则”变换方法

By tecdat4月 19, 2021大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术“凸规则”变换, Box-Cox, 凸规则, 变换, 数据结构化转换, 数据转换

线性回归时若数据不服从正态分布，会给线性回归的最小二乘估计系数的结果带来误差，所以需要对数据进行结构化转换。

R语言向量误差修正模型 (VECMs)分析长期利率和通胀率影响关系

By tecdat4月 15, 2021大数据部落, 机器学习, 经济, 计算机科学与技术VECM, VECMs, 关系, 利率, 向量误差修正模型, 影响, 通胀率, 长期利率

向量自回归模型估计的先决条件之一是被分析的时间序列是平稳的。

R语言如何用潜类别混合效应模型（lcmm）分析抑郁症状

By tecdat4月 14, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术lcmm, R语言, 混合效应, 混合效应模型, 潜类别混合效应模型

每一个动态现象都可以用一个潜过程(Λ(t)来描述，这个潜过程在连续的时间t内演化。

R语言非参数方法：使用核回归平滑估计和K-NN(k近邻算法)分类预测心脏病数据

By tecdat4月 13, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术K-NN, k近邻, R语言, 分类, 回归, 平滑估计, 心脏病, 心脏病数据, 数据, 核回归, 核方法, 算法, 非参数, 非参数方法, 预测

本文考虑一下基于核方法进行分类预测。注意，在这里，我们不使用标准逻辑回归，它是参数模型。

matlab使用分位数随机森林（QRF）回归树检测异常值

By tecdat4月 12, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术matlab, QRF, 分位数, 去除异常值, 回归, 回归树, 异常, 异常值, 异常值处理, 异常值检测, 随机森林

这个例子展示了如何使用分位数随机林来检测异常值。

R语言和Stan,JAGS：用rstan,rjag建立贝叶斯多元线性回归预测数据

By tecdat4月 7, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术JAGS, rjag, Rstan, stan, 回归, 多元, 线性回归, 贝叶斯, 预测

本文将介绍如何在R中做贝叶斯回归分析，R中有不少包可以用来做贝叶斯回归分析，比如最早的（同时也是参考文献和例子最多的）R2WinBUGS包。

R语言信用风险回归模型中交互作用的分析及可视化

By tecdat4月 6, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术交互, 交互作用, 信用, 信用风险, 可视化, 回归

多元统计分析中，交互作用是指某因素作用随其他因素水平的不同而不同，两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。

【视频讲解】Python和R语言使用指数加权平均(EWMA)，ARIMA自回归移动平均模型预测时间序列

By tecdat4月 1, 2021大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术arima, EWMA, python, R, 指数加权平均, 时间序列, 自回归移动平均模型, 预测

本文学习创建时间序列预测的步骤，关注Dickey-Fuller检验、指数加权平均(EWMA)和ARIMA（自回归移动平均）模型，从理论上学习这些概念以及它们在python和R中的实现。

R语言贝叶斯线性回归和多元线性回归构建工资预测模型

By tecdat3月 29, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 回归, 多元线性回归, 工资, 线性回归, 贝叶斯, 预测

在劳动经济学领域，收入和工资的研究为从性别歧视到高等教育等问题提供了见解。

【视频讲解】R语言基于Bootstrap的线性回归预测置信区间估计方法

By tecdat3月 26, 2021大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术bootstrap, R语言, 估计, 回归, 线性回归, 置信区间, 预测

我们知道参数的置信区间的计算，这些都服从一定的分布(t分布、正态分布），因此在标准误前乘以相应的t分值或Z分值。

R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析

By tecdat3月 25, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, 回归, 多项式回归, 岭回归, 自适应, 逻辑回归

正则化路径是在正则化参数lambda的值网格上计算套索LASSO或弹性网路惩罚的正则化路径。

R语言分段线性回归分析预测车辆的制动距离

By tecdat3月 23, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术分段线性回归, 制动距离, 回归, 线性回归, 车辆, 预测

分段回归( piecewise regression )，顾名思义，回归式是“分段”拟合的。

R语言贝叶斯推断与MCMC：实现Metropolis-Hastings 采样算法示例

By tecdat3月 22, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术MCMC, Metropolis-Hastings, 贝叶斯, 贝叶斯推断, 采样, 采样算法

任何MCMC方案的目标都是从“目标”分布产生样本。

R语言线性回归和时间序列分析北京房价影响因素可视化案例

By tecdat3月 18, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术可视化, 回归, 影响, 房价, 时间序列

房价有关的数据可能反映了中国近年来的变化：

R语言惩罚logistic逻辑回归（LASSO,岭回归）高维变量选择的分类模型案例

By tecdat3月 17, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, Logistic, 分类, 变量选择, 回归, 岭回归, 惩罚l, 模型, 逻辑回归, 高维

WeChat Tencent QQ email print 由Kaizong Ye，Weilong Zhang

R语言用普通最小二乘OLS，广义相加模型GAM ，样条函数进行逻辑回归LOGISTIC分类

By tecdat3月 15, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, Logistic, ols, R语言, 分类, 广义相加模型, 标准最小二乘, 样条函数, 逻辑回归

本文我们对逻辑回归和样条曲线进行介绍。

【视频讲解】R语言分布滞后非线性模型（DLNM）研究发病率，死亡率和空气污染示例

By tecdat3月 12, 2021医药生物, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术DLNM, R语言, 分布滞后非线性模型, 发病率, 死亡率, 空气污染

本文提供了运行分布滞后非线性模型的示例，同时描述了预测变量和结果之间的非线性和滞后效应，这种相互关系被定义为暴露-滞后-反应关联。

R语言基于温度对城市层次聚类、kmean聚类、PCA主成分分析和Voronoi图可视化

By tecdat3月 11, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术kmean, kmean聚类, PCA, R语言, Voronoi, Voronoi图, 主成分分析, 可视化, 城市, 层次聚类, 温度, 聚类

最近我们被客户要求撰写关于聚类技术的研究报告。为了说明层次聚类技术和k-均值，我使用了了城市温度数据集，其中包括几个城市的月平均气温。

R语言分布滞后线性和非线性模型（DLMs和DLNMs）分析时间序列数据

By tecdat3月 10, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术DLM, DLMs, DLNM, DLNMs, R语言, 分布滞后线性, 时间序列, 非线性模型

本文演示了在时间序列分析中应用分布滞后线性和非线性模型（DLMs和DLNMs）。

R语言广义相加模型 (GAMs)分析预测CO2时间序列数据

By tecdat3月 9, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术CO2, GAM, R语言, 广义相加模型, 数据, 预测

环境科学中的许多数据不适合简单的线性模型，最好用广义相加模型（GAM）来描述。<

R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归

By tecdat3月 8, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, ols, R语言, 广义相加模型, 普通最小二乘

这篇文章探讨了为什么使用广义相加模型是一个不错的选择。为此，我们首先需要看一下线性回归，看看为什么在某些情况下它可能不是最佳选择。

R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据

By tecdat3月 5, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术glm, LASSO, MCP, R语言, SCAD, 前列腺, 非凸惩罚函数回归

本文使用lasso或非凸惩罚拟合线性回归，GLM和Cox回归模型的正则化

SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

By tecdat3月 4, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术ANN, Iris, SAS, 人工神经网络, 神经网络, 鸢尾花

人工神经网络最初是由研究人员开发的，他们试图模仿人脑的神经生理学。

Python | ARIMA时间序列预测模型

By tecdat3月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, python, 时间序列, 预测

时间序列被定义为一系列按时间顺序索引的数据点。时间顺序可以是每天，每月或每年。

Python使用GARCH，EGARCH，GJR-GARCH模型和蒙特卡洛模拟进行股价预测

By tecdat3月 2, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融EGARCH, GARCH, GJR-GARCH, python, 模拟, 股价, 股市, 蒙特卡洛, 预测

预测股价已经受到了投资者，政府，企业和学者广泛的关注。然而，数据的非线性和非平稳性使得开发预测模型成为一项复杂而具有挑战性的任务。

R语言建立和可视化混合效应模型mixed effect model

By tecdat2月 26, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术mixed effect model, R语言, 可视化, 混合效应, 混合效应模型

最近我们被客户要求撰写关于混合效应模型的研究报告。我们已经学习了如何处理混合效应模型。

R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

By tecdat2月 24, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术回归, 多项式回归, 局部回归, 平滑样条, 核平滑, 线性, 线性模型

当线性假设无法满足时，可以考虑使用其他方法。

拓端tecdat荣获腾讯云+社区年度最佳作者奖

By tecdat2月 23, 2021大数据部落, 机器学习, 计算机科学与技术arima, tecdat, 拓端, 拓端数据, 社区, 腾讯, 腾讯云

回首不平凡的2020年，技术力量越来越受到重视，技术从业者的责任也越来越重大。

Category Archives: 机器学习

关注我们，永远不要错过任何见解。