Category Archives: 机器学习

【梯度提升专题】XGBoost、Adaboost、CatBoost预测合集：抗乳腺癌药物优化、信贷风控、比特币应用|附数据代码

By tecdat11月 5, 2024R语言辅导, 医药生物, 大数据部落, 技术支持, 数理统计, 期刊论文发表投稿, 机器学习, 经济, 计算机科学CS辅导, 计算机科学与技术, 金融Adaboost, CatBoost, xgboost, 信贷, 信贷风控, 抗乳腺癌药物, 比特币, 预测, 风控

金融领域同样挑战重重，信贷风控中精准预测违约支付及把握相关因素变化规律，以及比特币价格走势的准确预判，都对决策制定至关重要。再者，企业经营中处理严重不平衡的破产数据以评估风险，也是一大难点。在此背景下，XGBoost、Adaboost、CatBoost 等梯度提升算法展现出强大的预测能力。

R语言混合SVD模型IBCF协同过滤推荐算法研究——以母婴购物平台为例

By tecdat3月 28, 2024R语言辅导, 信息管理与信息系统, 大数据部落, 技术支持, 数理统计, 期刊论文发表投稿, 机器学习, 计算机科学CS辅导, 计算机科学与技术, 软件工程IBCF, SVD, 协同过滤, 推荐算法, 母婴, 混合, 购物, 购物平台

随着用户数量和项目数量的增加，数据的稀疏性成为影响推荐质量的重要因素。对此，本文帮助客户提出了一种基于混合SVD矩阵填充技术的协同过滤算法。

R语言谱聚类社会化推荐挖掘协同过滤电影社交网站Flixster数据集应用研究

By tecdat2月 3, 2023R语言辅导, 大数据部落, 技术支持, 数理统计, 期刊论文发表投稿, 机器学习, 计算机科学CS辅导, 计算机科学与技术Flixster, 协同过滤, 电影, 社交网站, 社会化, 谱聚类

本课题着眼于谱聚类在社会化推荐挖掘中的应用研究。

Python用Lstm神经网络、离散小波转换DWT降噪对中压电网电压时间序列预测

By tecdat1月 5, 2023Python辅导, 大数据部落, 技术支持, 数理统计, 期刊论文发表投稿, 机器学习, 计算机科学CS辅导, 计算机科学与技术DWT, LSTM, 中压电网, 中压电网电压, 时间序列, 电压, 电网, 电网电压, 神经网络, 离散小波转换, 降噪, 预测

对于电力公司来说，对局部放电的准确预测可以显著降低人力物力成本。

回归树模型分析纪录片播放量影响因素

By tecdat3月 31, 2022可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 可视化, 回归, 播放量, 纪录片, 预测

纪录片能够真实、详尽地反映一个地区的风貌，展示经济发展和社会进步。

R语言马尔可夫链（Markov Chain, MC）模拟赌徒破产模型Gambler’s Ruin Problem可视化

By tecdat3月 30, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术Gambler's Ruin Problem, Markov Chain, 模拟, 赌徒破产模型, 马尔可夫, 马尔可夫链

WeChat Tencent QQ email print 由Kaizong Ye，Weilong Zhang

Python进行多输出（多因变量）回归：集成学习梯度提升决策树GRADIENT BOOSTING REGRESSOR,GBR回归训练和预测可视化

By tecdat3月 23, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术GBR, GRADIENT BOOSTING REGRESSOR, 决策树, 可视化, 回归, 多因变量, 多输出, 梯度提升, 梯度提升决策树, 训练, 输出, 集成学习, 预测

在之前的文章中，我们研究了许多使用多输出回归分析的方法。

R语言Bootstrap(自举法，自抽样法)估计回归置信区间分析股票收益

By tecdat3月 21, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术bootstrap, 回归, 回归回归, 置信区间, 股票, 股票收益, 自举法, 自抽样, 自抽样法

. 您想知道它是否与（例如）零显着不同。一般来说，人们会查看他们选择的软件报告的统计数据或 p.value。问题是，这个 p.value 计算依赖于因变量的分布。如果没有不同的说明，您的软件假定为正态分布，那是怎么回事？

MATLAB用Lasso回归拟合高维数据和交叉验证

By tecdat3月 4, 2022大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, 交叉验证, 回归, 高维

我们围绕Lasso技术进行一些咨询，帮助客户解决独特的业务问题。使用各种方法从指数分布生成 200 个五维数据 X 样本。

python深度学习实现自编码器Autoencoder神经网络异常检测心电图ECG时间序列

By tecdat2月 11, 2022医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Autoencoder, 异常检测, 心电图, 时间序列, 深度学习, 神经网络, 自编码器, 预测

通过训练具有小中心层的多层神经网络重构高维输入向量，可以将高维数据转换为低维代码。

SAS分类决策树预测贷款申请评分剪枝和结果可视化

By tecdat1月 20, 2022可视化和设计, 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术SAS, 决策树, 分类, 剪枝, 可视化, 评分, 贷款, 贷款申请, 预测

分类树的一个常见用途是预测抵押贷款申请人是否会拖欠贷款。

R语言逻辑回归、随机森林、SVM支持向量机预测Framingham心脏病风险和模型诊断可视化

By tecdat1月 10, 2022医药生物, 大数据部落, 数据库, 数理统计, 机器学习, 计算机科学与技术Framingham, svm, 可视化, 回归, 心脏病, 支持向量机, 模型诊断, 逻辑回归, 随机森林, 预测, 风险

世界卫生组织估计全世界每年有 1200 万人死于心脏病。

Python实现谱聚类Spectral Clustering算法和改变聚类簇数结果可视化比较

By tecdat12月 23, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Spectral Clustering, 可视化, 簇数, 聚类, 聚类簇数, 谱聚类

谱聚类是一种将数据的相似矩阵的谱应用于降维的技术。

Matlab广义线性模型glm泊松回归的lasso、弹性网络正则化分类预测考试成绩数据和交叉验证可视化

By tecdat12月 21, 2021大数据部落, 教育学, 数理统计, 机器学习, 计算机科学与技术glm, LASSO, matlab, 交叉验证, 分类, 回归, 广义线性模型, 弹性网络, 成绩, 成绩数据, 正则化, 泊松, 泊松回归, 线性, 线性模型, 考试, 预测

WeChat Tencent QQ email print 由Kaizong Ye，Coin Ge撰写使用l

R语言有限混合模型聚类FMM、广义线性回归模型GLM混合应用分析威士忌市场和研究专利申请、支出数据

By tecdat12月 16, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术FMM, glm, 专利, 市场, 广义线性回归模型, 支出, 有限混合模型聚类, 研究, 研究专利, 聚类

有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。

R语言结构方程模型 SEM 多元回归和模型诊断分析学生测试成绩数据与可视化

By tecdat12月 14, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术SEM, 可视化, 回归, 多元回归, 学生, 学生测试, 学生测试成绩, 成绩, 模型诊断, 结构方程, 诊断

WeChat Tencent QQ email print 由Kaizong Ye，Weilong Zhang

R语言社区发现算法检测心理学复杂网络：spinglass、探索性图分析walktrap算法与可视化

By tecdat12月 7, 2021可视化和设计, 大数据部落, 心理学, 数理统计, 机器学习, 计算机科学与技术spinglass, walktrap, 可视化, 复杂网络, 心理学, 探索性图分析, 检测, 社区发现, 社区发现算法, 网络

我们在心理学网络论文中看到的一个问题是，作者有时会对其数据的可视化进行过度解释。

Matlab用Copula模型进行蒙特卡洛(Monte Carlo)模拟和拟合股票收益数据分析

By tecdat12月 6, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融copula, matlab, Monte Carlo, 拟合, 收益, 模拟, 股票, 股票收益, 蒙特卡洛

最近，copula 在仿真模型中变得流行起来。

R语言多维数据层次聚类散点图矩阵、配对图、平行坐标图、树状图可视化城市宏观经济指标数据

By tecdat12月 3, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术可视化, 城市, 城市宏观经济指标数据, 多维数据, 宏观, 宏观经济, 层次聚类, 平行坐标图, 指标, 散点图, 数据, 树状图, 矩阵, 经济, 聚类, 配对图

本文通过一些指数对散点图矩阵和平行坐标显示中的面板进行排序，并根据其数值水平对面板进行着色。

Python集成学习：自己编写构建AdaBoost分类模型可视化决策边界及sklearn包调用比较

By tecdat11月 23, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Adaboost, sklearn, 决策边界, 分类, 可视化, 自己编写, 集成学习

Boosting指的是机器学习元算法系列，它将许多 “弱 “分类器的输出合并成一个强大的 “集合”，其中每个弱分类器单独的错误率可能只比随机猜测好一点。

Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集

By tecdat11月 19, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, python, t-SNE, 主题建模, 可视化, 文本, 文本挖掘, 新闻组, 聚类, 词云, 降维

在这篇文章中，我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术。

R语言梯度提升机 GBM、支持向量机SVM、正则判别分析RDA模型训练、参数调优化和性能比较可视化分析声纳数据

By tecdat11月 18, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术GBM, RDA, svm, 优化, 参数调优, 声纳, 声纳数据, 性能比较, 支持向量机, 梯度提升, 梯度提升机, 模型训练, 正则判别分析

本文介绍简化模型构建和评估过程。

Python集成机器学习：用AdaBoost、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化

By tecdat11月 16, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Adaboost, 优化, 决策树, 分类, 回归, 机器学习, 网格搜索, 超参数, 超参数优化, 逻辑回归, 集成学习, 集成机器, 集成模型

Boosting 是一类集成机器学习算法，涉及结合许多弱学习器的预测。

R语言贝叶斯广义线性混合（多层次/水平/嵌套）模型GLMM、逻辑回归分析教育留级影响因素数据

By tecdat11月 12, 2021教育学, 数理统计, 机器学习, 计算机科学与技术GLMM, Logistic逻辑回归, 回归, 多分类logistic逻辑回归, 多层次, 多级, 层次, 嵌套, 广义线性混合模型, 教育, 教育留级, 数据, 留级, 线性混合, 线性混合效应, 线性混合效应模型, 线性混合模型, 贝叶斯, 贝叶斯回归, 贝叶斯广义线性混合, 贝叶斯广义线性混合模型, 贝叶斯简单线性回归, 贝叶斯线性回归, 逻辑回归, 非线性混合效应, 非线性混合模型, 预测

本教程使用R介绍了具有非信息先验的贝叶斯 GLM（广义线性模型）。

【视频讲解】R语言Kmeans均值聚类和层次聚类：亚洲国家地区生活幸福质量异同可视化分析和选择最佳聚类数

By tecdat11月 11, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术kmean, kmeans, Kmeans聚类, 亚洲国家, 层次聚类, 最佳聚类数, 生活幸福质量, 聚类, 聚类数, 选择最佳聚类数

《世界幸福报告》是可持续发展解决方案网络的年度报告，该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。

Python 贝叶斯概率推断序列数据概率和先验、似然和后验图可视化

By tecdat11月 10, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术似然, 先验, 可视化, 后验, 序列数据, 推断, 概率推断, 贝叶斯

在这篇文章中，我将集中讨论一个给定一个短数据序列的推断概率的例子。

R语言主成分回归（PCR）、多元线性回归特征降维分析光谱数据和汽车油耗、性能数据

By tecdat11月 4, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术PCR, 主成分, 主成分分析, 主成分回归, 主成分回归（PCR）, 主成分得分, 光谱, 回归, 多元线性回, 汽车, 汽车油耗, 特征降维, 线性回归, 降维, 预测

什么是PCR？（PCR = PCA + MLR）

R语言集成模型：提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据

By tecdat11月 3, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术boosting, 加权平均模型, 平均模型, 提升树, 时间序列, 最小二乘法, 模型融合, 约束最小二乘法, 随机森林, 集成模型

特别是在经济学/计量经济学中，建模者不相信他们的模型能反映现实。

R语言用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化

By tecdat10月 29, 2021农业, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, uci, uci数据, 可视化, 回归, 弹性网络, 数据, 线性回归, 随机森林, 预测, 鲍鱼

铁和泛酸的极好来源，是澳大利亚、美国和东亚的营养食品资源和农业。100 克鲍鱼可提供超过 20% 的每日推荐摄入量。鲍鱼的经济价值与其年龄呈正相关。因此，准确检测鲍鱼的年龄对于养殖者和消费者确定其价格非常重要。

matlab用Logistic逻辑回归建模和马尔可夫链蒙特卡罗(MCMC) 方法分析汽车实验数据

By tecdat10月 27, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Logistic, matlab, MCMC, 回归, 汽车, 汽车实验, 汽车实验数据, 蒙特卡罗, 贝叶斯, 逻辑回归, 马尔可夫

此示例说明如何使用逻辑回归模型进行贝叶斯推断。

R语言非线性混合效应 NLME模型(固定效应&随机效应)对抗哮喘药物茶碱动力学研究

By tecdat10月 22, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术nlme, 动力学, 哮喘, 固定效应, 混合效应, 线性, 药, 药物, 随机效应, 非线性, 非线性混合效应

最近我们被客户要求撰写关于抗哮喘药物茶碱动力学研究的报告。茶碱数据文件报告来自抗哮喘药物茶碱动力学研究。

R语言平滑算法LOESS局部加权回归、三次样条、变化点检测拟合电视节目《白宫风云》在线收视率

By tecdat10月 21, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LOESS, 三次样条, 变化点, 变化点检测, 回归, 在线收视率, 局部加权回归, 平滑, 平滑算法, 收视率, 样条, 电视节目, 白宫风云, 预测

此示例基于电视节目的在线收视率。我们将从抓取数据开始。

【视频讲解】R语言结合新冠疫情COVID-19股票价格预测：ARIMA，KNN和神经网络时间序列分析

By tecdat10月 20, 2021大数据部落, 数理统计, 机器学习, 特色视频, 经济, 计算机科学与技术, 金融arima, COVID, COVID-19, knn, 新冠, 新冠疫情, 时间序列, 疫情, 神经网络, 股票, 股票价格, 预测

本文的目标是使用各种预测模型预测Google的未来股价，然后分析各种模型。

Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据

By tecdat10月 18, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, MNIST, python, t-SNE, 可视化, 降维, 非线性, 高维, 高维数据, 鸢尾花

T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。

R语言指数平滑法holt-winters分析谷歌Google Analytics博客用户访问时间序列数据

By tecdat10月 14, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Analytics, Google Analytics, holt, holt-winters, winters, 博客, 博客用户, 指数平滑, 指数平滑法, 时间序列, 访问, 谷歌, 预测

最近我们被客户要求撰写关于谷歌Google Analytics分析的研究报告。在等距时间段内以一系列点获得的数据通常称为时间序列数据。

Python在线零售数据关联规则挖掘Apriori算法数据可视化

By tecdat10月 12, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Apriori, python, 关联规则, 可视化, 在线零售数据, 数据可视化, 零售, 零售数据

关联规则学习在机器学习中用于发现变量之间的有趣关系。

Python面板时间序列数据预测：格兰杰因果关系检验Granger causality test药品销售实例与可视化

By tecdat10月 9, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术Granger causality test, python, 可视化, 时间序列, 格兰杰因果关系检验, 药品, 药品销售, 销售, 面板, 面板时间序列, 预测

时间序列是以固定时间_区间_记录的观察序列。

python用支持向量机回归(SVR)模型分析用电量预测电力消费

By tecdat9月 29, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术python, svr, 支持向量机, 用电量, 电力负荷, 预测

本文描述了训练支持向量回归模型的过程，该模型用于预测基于几个天气变量、一天中的某个小时、以及这一天是周末/假日/在家工作日还是普通工作日的用电量。

R语言深度学习Keras循环神经网络(RNN)模型预测多输出变量时间序列

By tecdat9月 28, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术RNN, 多变量, 多输出变量, 循环神经网络, 时间序列, 模型, 深度学习, 神经网络, 预测

递归神经网络被用来分析序列数据。

R语言绘制圈图、环形热图可视化基因组实战：展示基因数据比较

By tecdat9月 27, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术圈图, 基因, 基因组, 热图, 环形热图

可以使用环状图形展示基因数据比较。可以添加多种图展信息，如热图、散点图等。

Python用决策树分类预测糖尿病和可视化实例

By tecdat9月 23, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术决策树, 可视化, 糖尿病, 预测

决策树是对例子进行分类的一种简单表示。

R语言社区检测算法可视化网络图：ggplot2绘制igraph对象分析物种相对丰度

By tecdat9月 22, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术ggplot2, igraph, 可视化, 物种, 物种相对丰度, 相对丰度, 社区检测, 网络, 网络图

我们使用R中的igraph包，产生了网络的图形。

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化

By tecdat9月 17, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术EM, EM算法, 分层聚类, 分类, 可视化, 密度估计, 有限正态混合, 有限正态混合模型, 聚类

最近我们被客户要求撰写关于有限正态混合模型在r软件中的实现的研究报告，用于基于模型的聚类、分类和密度估计。

R语言用假近邻长短期记忆人工神经网络FNN-LSTM模型进行时间序列深度学习预测4个案例

By tecdat9月 15, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术FNN, LSTM, 假近邻, 时间序列, 深度学习, 长短期记忆人工, 长短期记忆人工神经网络, 预测

在最近的一篇文章中，我们展示了一个LSTM模型，通过假近邻（FNN）损失进行正则化，可以用来重建一个非线性动态系统。

R语言用线性混合效应（多水平/层次/嵌套）模型分析声调高低与礼貌态度的关系

By tecdat9月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术多水平, 混合效应, 线性, 线性混合效应, 线性混合效应模型

最近我们被客户要求撰写关于线性混合效应模型的研究报告，包括一些图形和统计输出。线性混合效应模型与我们已经知道的线性模型有什么不同？

R语言Keras用RNN、双向RNNs递归神经网络、LSTM分析预测温度时间序列、 IMDB电影评分情感

By tecdat8月 30, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术IMDB, Keras, LSTM, RNN, 情感, 电影评分, 神经网络, 递归神经网络

在这篇文章中，我们将回顾三种提高循环神经网络的性能和泛化能力的高级方法。

Python用Keras神经网络序列模型回归拟合预测、准确度检查和结果可视化

By tecdat8月 26, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, python, 准确度, 可视化, 回归, 序列, 拟合

我们可以很容易地用Keras序列模型拟合回归数据并预测测试数据。

R语言用AR，MA，ARIMA 模型进行时间序列预测

By tecdat8月 25, 2021大数据部落, 数理统计, 机器学习arima, 时间序列, 预测

本文讨论用ARIMA模型进行预测。考虑一些简单的平稳的AR（1）模拟时间序列

R语言广义二次跳跃、非线性跳跃扩散过程转移函数密度的估计及其应用

By tecdat8月 25, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术密度, 广义二次跳跃, 跳跃, 跳跃扩散, 跳跃扩散过程, 转移函数, 非线性

扩散的意思是过程可以包含布朗运动的成份，甚至写成布朗运动的积分形式。同时，这样的过程可以包含跳跃。

基于机器学习的印度肝脏病诊断分析

By tecdat8月 23, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术决策树, 印度, 支持向量回归, 机器学习, 肝脏病, 诊断, 逻辑回归, 随机森林

肝脏病在早期可能没有任何症状，不容易被察觉，或者症状是模糊的。肝脏病的症状和肝脏病的类型和程度高度相关，肝脏病的一般是通过肝功能测试诊断。

Python决策树、随机森林、朴素贝叶斯、KNN（K-最近邻）分类分析银行拉新活动挖掘潜在贷款客户

By tecdat8月 23, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术K-最近邻居, knn, 决策树, 分类, 拉新, 挖掘, 朴素贝叶斯, 贝叶斯, 贷款, 银行, 随机森林

项目背景：银行的主要盈利业务靠的是贷款，这些客户中的大多数是存款大小不等的责任客户（存款人）。

R语言广义相加（加性）模型（GAMs）与光滑函数可视化

By tecdat8月 20, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, GAMs, 光滑函数, 可视化, 广义加性模型, 广义相加模型

我们在研究工作中使用广义加性模型（GAMs）。mgcv软件包是一套优秀的软件，可以为非常大的数据集指定、拟合和可视化GAMs。

SARIMA，神经网络，RNN-LSTM，SARIMA和RNN组合方法预测COVID-19每日新增病例

By tecdat8月 17, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, COVID, LSTM, RNN, SARIMA, 神经网络, 组合方法

WeChat Tencent QQ email print 由Enzo Li撰写开发一个预测模型，根据一

R语言逻辑回归Logistic回归分析预测股票涨跌

By tecdat8月 17, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融Logistic, 回归, 股票, 逻辑回归, 预测

本文回答了关于逻辑回归的问题：它与线性回归有什么不同，如何在R中用glm()函数拟合和评估这些模型等等？

R语言nlme、nlmer、lme4用（非）线性混合模型non-linear mixed model分析藻类数据实例

By tecdat8月 14, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术lme4, nlme, nlmer, non linear mixed model, non-linear mixed model, 线性混合模型, 藻类, 藻类数据, 非线性混合模型

本文中我们用（非）线性混合模型分析藻类数据。这个问题的参数是：已知截距（0日值）在各组和样本之间是相同的。

电力消耗模型构建、分析和预测

By tecdat8月 12, 2021大数据部落, 数理统计, 机器学习, 电气工程及自动化, 计算机科学与技术回归, 电力消耗

某制药公司每年要花费大量的资金在电费上，由于电力公司的业务改革，该药企可以在一年或月开始时向电力公司预购一定数量的电力，如果实际消耗大于该值，则每多消耗一度电要付比以前更多的电费，如果实际上没有消耗这么多，也不会退还多余的电费，因此该公司打算预测未来的电力消耗以节省资金消耗。

R语言高维数据惩罚回归方法：主成分回归PCR、岭回归、lasso、弹性网络elastic net分析基因数据

By tecdat8月 12, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Elastic Net, LASSO, 主成分, 主成分回归, 回归, 基因, 弹性网络, 惩罚, 惩罚回归, 高维数据

在本文中，我们将使用基因表达数据。这个数据集包含120个样本的200个基因的基因表达数据。

【视频讲解】R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集

By tecdat8月 11, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术R语言, 信用卡, 信贷, 信贷数据, 决策树, 回归, 违约, 逻辑回归, 随机森林

在许多网站上都可以找到一个流行的德国信贷数据集_german_credit_，其中包含了银行贷款申请人的信息。

R语言谱聚类、K-means聚类分析非线性环状数据比较

By tecdat8月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术k-means, 数据, 环状, 聚类, 谱聚类, 非线性

有些问题是线性的，但有些问题是非线性的。

R语言贝叶斯MCMC：用rstan建立线性回归模型分析汽车数据和可视化诊断

By tecdat8月 2, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术MCMC, Rstan, stan, 可视化, 回归, 汽车数据, 线性回归, 贝叶斯

本文将谈论Stan以及如何在R中使用rstan创建Stan模型。

R语言深度学习：用keras神经网络回归模型预测时间序列数据

By tecdat7月 30, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, 回归, 序列, 时间序列, 时间序列预测, 深度学习, 神经网络, 预测

回归数据可以用Keras深度学习API轻松拟合。

R语言样条曲线、泊松回归模型估计女性直肠癌患者标准化发病率（SIR）、标准化死亡率（SMR）

By tecdat7月 29, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术SIR, SMR, 回归, 女性, 患者, 标准化发病率, 样条曲线, 死亡率, 泊松, 泊松回归, 直肠癌

标准化发病率（SIR）或死亡率（SMR）是观察病例和期望病例的比率。

R语言贝叶斯MCMC：GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例

By tecdat7月 28, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Gibbs, MCMC, Metropolis Hastings, Rstan, 回归, 线性回归, 贝叶斯, 逻辑回归, 采样

在频率学派中，观察样本是随机的，而参数是固定的、未知的数量。

【视频讲解】R语言keras深度学习CNN卷积神经网络分类识别手写数字图像数据（MNIST）

By tecdat7月 26, 2021图像处理, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术CNN, Keras, MNIST, R语言, 分类, 卷积, 卷积神经网络, 图像, 手写数字, 深度学习, 神经网络, 识别

在本文中，我们将学习如何使用keras，用手写数字图像数据集（即MNIST）进行深度学习。

Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例

By tecdat7月 23, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LARS, LASSO, python, 住房, 回归, 最小角算法, 波士顿, 波士顿住房

回归算法最小角回归（LARS）通过高维数据的线性组合提供变量。

R语言使用虚拟变量(Dummy Variables) 回归分析工资影响因素

By tecdat7月 23, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Dummy Variable, Dummy Variables, 回归, 工资, 影响因素, 虚拟变量

本文与以下两个问题有关。你应该如何在回归中添加虚拟变量？你应该如何解释结果？

Matlab用深度学习长短期记忆（LSTM）神经网络对文本数据进行分类

By tecdat7月 21, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LSTM, matlab, 分类, 文本, 深度学习, 神经网络, 长短期记忆

这个例子展示了如何使用深度学习长短期记忆（LSTM）网络对文本数据进行分类。

MATLAB基于贝叶斯模型的随机森林预测方法分析汽车燃油经济性

By tecdat7月 16, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术matlab, 优化, 分析, 汽车, 贝叶斯, 随机森林, 预测

这个例子展示了如何用Matlab实现贝叶斯优化，使用分位数误差调整回归树随机森林的超参数。

Category Archives: 机器学习

关注我们，永远不要错过任何见解。