Category Archives: 机器学习

ARIMA模型预测CO2浓度时间序列-python实现

By tecdat2月 22, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, CO2, python, 时间序列, 预测

时间序列为预测未来数据提供了方法。根据先前的值，时间序列可用于预测经济，天气的趋势。

Python中的Lasso回归之最小角算法LARS

By tecdat2月 20, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LARS, LASSO, python, 回归, 最小角算法

假设我们期望因变量由潜在协变量子集的线性组合确定。

R语言基于递归神经网络RNN的温度时间序列预测

By tecdat2月 18, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术RNN, R语言, 时间序列, 温度, 神经网络, 递归神经网络, 预测

在本文中，我们将介绍三种提高循环神经网络性能和泛化能力的高级技术。

R语言神经网络模型预测车辆数量时间序列

By tecdat2月 8, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 文章标签： R语言混合时间预测时间序列点估计, 神经网络, 车辆, 车辆数量, 预测

具有单个隐藏层和滞后输入的前馈神经网络，可以用于预测单变量时间序列。

【视频讲解】R语言中的BP神经网络模型分析学生成绩

By tecdat2月 5, 2021大数据部落, 教育学, 数理统计, 机器学习, 特色视频, 计算机科学与技术BP, R语言, 学生成绩, 模型, 神经网络

在本教程中，您将学习如何在R中创建神经网络模型。

R语言使用Metropolis-Hastings采样算法自适应贝叶斯估计与可视化

By tecdat2月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Markov, Markov Chain, MCMC, Metropolis- Hasting, R语言, 蒙特卡洛, 贝叶斯, 采样, 马尔可夫链

如果您可以写出模型的似然函数，则 Metropolis-Hastings算法可以负责其余部分（即MCMC ）。

R语言量化交易RSI策略：使用支持向量机SVM

By tecdat2月 2, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融RSI, R语言, svm, 交易, 支持向量机, 策略, 量化, 量化交易

机器学习算法可用于找到最佳值来交易您的指标。

matlab使用长短期记忆（LSTM）神经网络对序列数据进行分类

By tecdat1月 28, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LSTM, matlab, uci, uci数据, 分类, 序列数据, 时间序列数据, 神经网络, 长短期记忆模型, 长短期记忆网络

本示例说明如何使用长短期记忆（LSTM）网络对序列数据进行分类。

R语言RStan贝叶斯示例：重复试验模型和种群竞争模型Lotka Volterra

By tecdat1月 27, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Lotka Volterra, Rstan, R语言, 种群竞争模型, 贝叶斯, 贝叶斯估计, 贝叶斯推断, 重复试验模型

Stan是一种用于指定统计模型的概率编程语言。Stan通过马尔可夫链蒙特卡罗方法（例如No-U-Turn采样器，一种汉密尔顿蒙特卡洛采样的自适应形式）为连续变量模型提供了完整的贝叶斯推断。

使用Python中Keras的LSTM递归神经网络进行时间序列预测

By tecdat1月 21, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, LSTM, python, 时间序列, 递归神经网络, 预测

最近我们被客户要求撰写关于时间序列预测的研究报告。时间序列预测问题是预测建模问题中的一种困难类型。

在Python和R中使用交叉验证方法提高模型性能

By tecdat1月 20, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术python, R, 交叉验证, 模型性能

模型表现差异很大的可能原因是什么？换句话说，为什么在别人评估我们的模型时会失去稳定性？

R语言自然语言处理（NLP）：情感分析新闻文本数据

By tecdat1月 8, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术nlp, R语言, 情感分析, 文本, 文本情感分析, 文本挖掘, 新闻文本数据, 自然语言处理

本文对R中的文本内容进行情感分析。此实现利用了各种现有的字典，此外，还可以创建自定义词典。自定义词典使用LAS

R语言中的SOM(自组织映射神经网络)对NBA球员聚类分析

By tecdat1月 7, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术nba, R语言, SOM, 球员, 神经网络, 聚类, 自组织映射, 自组织映射神经网络

自组织映射（SOM）是一种工具，通过生成二维表示来可视化高维数据中的模式，在高维结构中显示有意义的模式。 &

R语言:逻辑回归ROC曲线对角线分析过程及结果

By tecdat1月 6, 2021大数据部落, 机器学习, 计算机科学与技术ROC, ROC曲线, R语言, 回归, 逻辑回归

之前我们讨论了使用ROC曲线来描述分类器的优势，有人说它描述了“随机猜测类别的策略”。

bilibili视频流量数据潜望镜

By tecdat1月 6, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术bilibili, 数据, 流量数据, 视频数据, 视频流量

最新研究表明，中国有超过7亿人在观看在线视频内容。

R语言分位数回归预测筛选有上升潜力的股票

By tecdat1月 5, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融R语言, 分位数, 分位数回归, 回归, 股票

现在，分位数回归已被确立为重要的计量经济学工具。

R语言复杂网络分析：聚类（社区检测）和可视化

By tecdat12月 25, 2020可视化和设计, 数理统计, 机器学习, 计算机科学与技术R语言, 可视化, 复杂网络, 社区检测, 聚类

为了用R来处理网络数据，我们使用婚礼数据集。

R语言使用自组织映射神经网络（SOM）进行客户细分

By tecdat12月 24, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, SOM, 可视化, 客户细分, 无监督, 聚类, 自组织映射神经网络

自组织映射神经网络（SOM）是一种无监督的数据可视化技术，可用于可视化低维（通常为2维）表示形式的高维数据集。

R语言分位数回归Quantile Regression分析租房价格数据

By tecdat12月 16, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Quantile Regression, R语言, 价格, 分位数, 分位数回归, 回归, 数据, 租房, 租房价格

本文想在R软件中更好地了解分位数回归优化。在查看分位数回归之前，让我们从样本中计算中位数或分位数。

R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

By tecdat12月 15, 2020大数据部落, 数理统计, 机器学习, 机械工程及自动化, 电气工程及自动化, 计算机科学与技术GAM, R语言, SARIMA, SARIMAX, 分位数回归, 回归, 指数平滑, 时间序列, 样条曲线, 电力负荷, 预测

电力负荷预测是电网规划的基础，其水平的高低将直接影响电网规划质量的优劣。

R语言用Garch模型和回归模型对股票价格分析

By tecdat12月 10, 2020大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融GARCH, R语言, 价格, 分析, 回归, 模型, 股票

为了找出影响价格波动的主要因素，我们使用逐步回归法来剔除一些对于应变量即把对价格影响很小的自变量剔除出我们的模型

广义线性模型GLM、多项式回归和广义可加模型GAM预测泰坦尼克号幸存者

By tecdat12月 8, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, glm, R语言, 广义可加模型, 广义线性模型, 泰坦尼克号, 预测

本文通过R语言建立广义线性模型(GLM)、多项式回归和广义可加模型（GAM）来预测谁在1912年的泰坦尼克号沉没中幸存下来。

【视频讲解】R语言实现CNN（卷积神经网络）模型进行回归数据分析

By tecdat12月 3, 2020大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术CNN, R语言, 卷积神经网络, 回归, 深度学习, 神经网络

当我们将CNN（卷积神经网络）模型用于训练多维类型的数据（例如图像）时，它们非常有用。

R语言用多项式回归和ARIMA模型预测电力负荷时间序列数据

By tecdat11月 27, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, R语言, 多项式回归, 数据, 时间序列, 电力消耗, 电力负荷, 电力负荷预测

根据我们对温度的预测，我们可以预测电力消耗。

R语言主题模型LDA评估公司面临的风险领域与可视化

By tecdat11月 26, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, R语言, 主题模型, 可视化, 文本挖掘, 风险

随着越来越多的数据被数字化，获取信息变得越来越困难。我们在本文中重点关注的一个示例是评估公司面临的不同风险领域。

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

By tecdat11月 24, 2020大数据部落, 数据库, 数理统计, 机器学习, 经济, 计算机科学与技术R语言, 信贷数据, 决策树, 分类, 逻辑回归, 随机森林, 预测

在本文中，我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。

R语言网络分析友谊悖论案例

By tecdat11月 20, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 友谊悖论, 网络, 网络分析

本文简要介绍一下网络分析，我想提供一些有关“友谊悖论”的R语言例证。友谊悖论指出

SAS用K-Means 聚类最优k值的选取和分析

By 拓端tecdat11月 16, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术kmeans, SAS, 聚类

“聚类是将数据集分为几组的过程，其中包括相似的数据点”。聚类是一种无监督的机器学习，在您拥有未标记的数据时使用。

Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析

By tecdat11月 12, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术python, xgboost, 商店数据, 建模, 时间序列, 销售量, 预测

在数据科学学习之旅中，我经常处理日常工作中的时间序列数据集，并据此做出预测。

R语言计量经济学与有时间序列模式的机器学习预测

By tecdat11月 9, 2020大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术R语言, 时间, 时间序列, 机器学习, 计量经济学

由于目标是预测理赔频率（以评估保险费水平），因此他建议使用旧数据来训练该模型，并使用最新数据对其进行测试。问题在于该模型没有包含任何时间模式。

数据视域下图书馆话题情感分析

By tecdat10月 19, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, nlp, 主题分析, 图书馆, 情感分析, 数据

当前是大数据盛行的时代，各种用户信息行为数据分析的结果影响着人们的生活和学习，同时对图书馆的发展也有着影响。

用R语言中的神经网络预测时间序列：多层感知器和极限学习机

By tecdat9月 24, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术多层感知器, 时间序列, 极限学习机, 神经网络

对于此示例，我将对R中的时间序列进行建模。我将最后24个观察值保留为测试集，并将使用其余的观察值来拟合神经网络。

R语言关联挖掘实例（购物篮分析）

By tecdat9月 23, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Apriori, R语言, 关联挖掘, 购物篮, 购物篮分析

关联挖掘通常用于通过识别经常一起购买的产品来提出产品推荐。但是，如果您不小心，则规则在某些情况下可能会产生误导性的结果。

TensorFlow 2.0 keras开发深度学习模型实例：多层感知器（MLP），卷积神经网络（CNN）和递归神经网络（RNN）

By tecdat9月 16, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术CNN, Keras, MLP, RNN, TensorFlow, 多层感知器, 模型, 深度学习

在本文中，您将发现如何使用标准深度学习模型（包括多层感知器（MLP），卷积神经网络（CNN）和递归神经网络（RNN））开发，评估和做出预测。

Python安装TensorFlow 2、tf.keras和深度学习模型的定义

By tecdat9月 15, 2020大数据部落, 技术支持, 数理统计, 机器学习, 计算机科学与技术Keras, python, TensorFlow, 模型, 深度学习

深度学习的预测建模是现代开发人员需要了解的一项技能。

TensorFlow 2建立神经网络分类模型——以iris数据为例

By tecdat9月 14, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, TensorFlow, 分类, 模型, 神经网络

隐藏层和神经元的理想数量取决于问题和数据集。与机器学习的多个方面一样，选择最佳的神经网络形状需要一定的知识水平和实验基础。一般来说，增加隐藏层和神经元的数量通常会产生更强大的模型，而这需要更多数据才能有效地进行训练。

Matlab建立逻辑回归，决策树，SVM，KNN和朴素贝叶斯模型分类绘制ROC曲线

By tecdat9月 10, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术knn, matlab, ROC, svm, 决策树, 分类, 回归, 朴素贝叶斯, 逻辑回归

尽管对于较高的阈值，SVM可以产生更好的ROC值，但逻辑回归通常更擅长区分不同类别。朴素贝叶斯的ROC曲线通常低于其他两个ROC曲线，这表明样本内性能比其他两个分类器方法差。

【视频讲解】游记数据感知旅游目的地形象

By tecdat9月 2, 2020可视化和设计, 地理，运输，旅行和物流, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术LDA, nlp, 主题模型, 情感分析, 数据, 文本, 文本挖掘, 旅游, 游记, 驴友

越来越多的人愿意精神消费。旅游不仅可以提升人们对外地环境和外地人文的认知，也可以放松身心、愉悦心情，是一种受欢迎的精神消费。

Rapidminer关联规则和文本挖掘模型对评论数据进行分析

By tecdat8月 26, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Rapidminer, 关联规则, 文本, 文本挖掘, 模型

关联规则是if / then语句，可帮助发现看似无关的数据之间的关系。关联规则的一个示例是“如果客户购买鸡蛋，那么他有80％的可能性也购买牛奶”。

R语言中广义线性模型(GLM)中的分布和连接函数分析

By tecdat8月 21, 2020大数据部落, 数理统计, 机器学习glm, R语言, 分布, 广义线性模型, 线性, 连接函数

通常，GLM的连接函数可能比分布更重要。

在RapidMiner中建立决策树模型

By tecdat8月 11, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Rapidminer, 决策树

本教程的目的是介绍如何在RapidMiner中创建基本决策树。

用Rapidminer做文本挖掘的应用：情感分析

By tecdat8月 10, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Rapidminer, 情感, 情感分析, 文本挖掘

情感分析或观点挖掘是文本分析的一种应用，用于识别和提取源数据中的主观信息。

R语言中自编基尼系数的CART回归决策树的实现

By tecdat7月 10, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术CART, CART回归决策树, R语言, 决策树, 回归, 基尼系数

这里的想法是使距离最大化：想法是区分，所以我们希望样本尽可能不独立。要计算基尼系数。

sas神经网络：构建人工神经网络模型来识别垃圾邮件

By tecdat7月 8, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术SAS, 人工神经网络, 垃圾邮件, 神经网络

神经网络是一种非常通用的灵活预测模型，可用于解决各种问题，包括分类，降维和回归。

探析大数据期刊文章研究热点

By tecdat6月 3, 2020信息管理与信息系统, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术主题建模, 数据, 文本挖掘, 期刊, 期刊文章, 概率潜在语义分析, 研究, 语义分析

大数据已经成为变革和创新的技术力量和思维方式，成为当前研究的热门领域。

R语言随机森林模型中具有相关特征的变量重要性

By tecdat5月 20, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术, 软件工程R语言, 变量重要性, 模型, 特征, 随机森林

变量重要性图是查看模型中哪些变量有趣的好工具。

Python中基于网格搜索算法优化的深度学习模型分析糖尿病数据

By tecdat5月 8, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术, 软件工程python, 深度学习模型, 糖尿病数据, 网格搜索算法

在本教程中，我们将讨论一种非常强大的优化（或自动化）算法，即网格搜索算法。

疫情下的新闻数据观察

By tecdat5月 1, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术nlp, 情感分析, 文本挖掘, 新闻数据, 疫情, 自然语言处理, 观察

新冠肺炎的爆发让今年的春节与往常不同。与此同时，新闻记录下了这场疫情发展的时间轴。

【视频讲解】R语言马尔可夫区制转移模型Markov regime switching

By tecdat4月 25, 2020大数据部落, 数理统计, 机器学习, 特色视频, 经济, 计算机科学与技术, 软件工程, 金融Markov, Markov regime switching, R语言, 区制转移, 区制转移模型, 隐马尔可夫模型, 马尔可夫, 马尔可夫体制转换模型, 马尔可夫区制转移, 马尔可夫机制转换模型, 马尔科夫机制转换模型

本文简要介绍了一种简单的状态切换模型，该模型构成了隐马尔可夫模型（HMM）的特例。

R语言马尔可夫转换模型研究交通伤亡人数事故预测

By tecdat4月 21, 2020地理，运输，旅行和物流, 大数据部落, 数理统计, 机器学习, 计算机科学与技术, 软件工程R语言, 预测, 马尔可夫转换模型

本文描述了R语言中马尔克夫转换模型的分析过程。首先，对模拟数据集进行详细建模。接下来，将马尔可夫转换模型拟合到具有离散响应变量的真实数据集。用于验证对这些数据集建模的不同方法。

scrapy爬虫框架和selenium的使用：对优惠券推荐网站数据LDA文本挖掘

By tecdat4月 19, 20201 comment信息管理与信息系统, 大数据部落, 控制科学与工程, 数理统计, 机器学习, 机械工程及自动化, 计算机科学与技术, 软件工程LDA, python, scrapy, selenium, 文本挖掘, 爬虫

Groupon是一个优惠券推荐服务，您可以免费注册Groupon。

使用R语言进行Metroplis-in-Gibbs采样和MCMC运行分析

By tecdat4月 19, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Gibbs, MCMC, Metroplis, 采样

对于许多模型，例如逻辑模型，没有共轭先验分布。因此，吉布斯采样不适用。

R语言中的马尔可夫区制转移(Markov regime switching)模型

By tecdat4月 18, 2020大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 软件工程, 金融Markov, Markov regime switching, R语言, 区制转移, 模型, 马尔可夫, 马尔可夫区制转移

金融分析师通常关心市场何时“发生变化”：几个月或者几年内市场的典型行为可以立即转变为非常不同的行为。

已迁离北京外来人口的数据画像

By tecdat4月 11, 2020信息管理与信息系统, 可视化和设计, 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术关联分析, 外来人口, 数据画像, 机器学习

我们分析了已迁离北京的外来人口的月收入、性别、迁入北京和迁离北京的日期、教育程度和职业这些方面的数据。

R语言用神经网络改进Nelson-Siegel模型拟合收益率曲线分析

By tecdat4月 10, 2020信息管理与信息系统, 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融Nelson-Siegel, Nelson-Siegel模型, R语言, 收益率, 神经网络

我们要做的是：我们从一些收益率曲线开始，然后逐步地随机修改收益率，最后尝试拟合NS模型以新的收益。因此我们对此进行了模拟。

基于R语言实现LASSO回归分析

By tecdat2月 18, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, ols, R语言, 回归, 最小二乘法, 模拟

本文使用模拟数据比较了标准最小二乘法和lasso回归。

python机器学习：推荐系统实现（以矩阵分解来协同过滤）

By tecdat2月 17, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术python, 协同过滤, 推荐系统, 机器学习, 矩阵分解

用户和产品的潜在特征编写推荐系统矩阵分解工作原理使用潜在表征来找到类似的产品。

R语言使用最优聚类簇数k-medoids聚类进行客户细分

By tecdat12月 27, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术K-medoids, R语言, 最优聚类簇数, 聚类

k-medoids是另一种聚类算法，可用于在数据集中查找分组。

R语言基于树的方法：决策树，随机森林，Bagging，增强树

By tecdat12月 26, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Bagging, R语言, 决策树, 增强树, 套袋, 随机森林

本文是有关基于树的回归和分类方法的。

R语言逐步多元回归模型分析长鼻鱼密度影响因素

By tecdat12月 17, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 回归, 影响因素, 逐步, 逐步多元回归

我从马里兰州生物流调查中提取了一些数据，以进行多元回归分析。

R语言使用tf-idf描述NASA元数据的文本和关键字

By tecdat12月 13, 2019数理统计, 机器学习, 计算机科学与技术R语言, tf-idf, 数据, 文本挖掘

NASA有32,000多个数据集，有关NASA数据集的元数据可以JSON格式在线获得。

R语言随机搜索变量选择SSVS估计贝叶斯向量自回归（BVAR）模型

By tecdat12月 11, 20193 comments大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术BVAR, VAR模型, 向量自回归, 自回归, 贝叶斯, 贝叶斯向量自回归, 随机搜索变量选择

向量自回归（VAR）模型的一般缺点是，估计系数的数量与滞后的数量成比例地增加。

python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证

By tecdat12月 9, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, pandas, python, Scikit-learn, 交叉验证, 决策树, 分类, 鸢尾花数据

最近我们被客户要求撰写关于决策树分类的研究报告。将使用著名的iris数据集，该数据集对各种不同的iris类型进行各种测量。

CNN+ Auto-Encoder 实现无监督Sentence Embedding ( 基于Tensorflow)

By tecdat12月 9, 2019大数据部落, 机器学习, 计算机科学与技术CNN, TensorFlow

CNN+ Auto-Encoder 实现无监督Sentence Embedding ( 基于Tensorflow)

【视频】在r语言中使用GAM（广义相加模型）进行电力负荷时间序列分析

By tecdat11月 26, 20191 comment大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术GAM, R语言, 广义加法模型, 广义相加模型, 时间序列, 电力负荷, 电力负荷预测

在绘制的时间序列中可以看到两个主要的季节性：每日和每周。我们在一天中有48个测量值，在一周中有7天，因此这将是我们用来对响应变量进行建模的自变量–电力负荷。

R语言实现偏最小二乘回归法 partial least squares (PLS)回归

By tecdat11月 20, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术partial least squares, PLS, R语言, 偏最小二乘, 偏最小二乘回归, 回归, 最小二乘

偏最小二乘回归是一种回归形式。

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类

By tecdat11月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, LSTM, nlp, python, 分类, 文本, 神经网络

最近我们被客户要求撰写关于开发具有多个输出的文本分类模型的研究报告。

python爬虫进行Web抓取LDA主题语义数据分析

By tecdat11月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, python, Web抓取, 主题, 主题模型, 数据采集, 爬虫, 词云, 语义, 采集

从网站提取数据的方法称为网络抓取。

Category Archives: 机器学习

关注我们，永远不要错过任何见解。