Category Archives: 机器学习

In order to find out the main factors affecting price fluctuations, we use stepwise regression to eliminate some independent variables that have little impact on the dependent variable, that is, the price. The name of the variable is changed to x1, x2…

R语言如何做马尔可夫转换模型markov switching model

By tecdat9月 18, 2019大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融Markov, markov switching model, R语言, 时间序列, 马尔可夫, 马尔可夫区制转换, 马尔科夫转换

最近我们被客户要求撰写关于时间序列的研究报告。假设有时间序列数据，如下所示。经验表明，目标变量y似乎与解释变量x有关。

python主题建模可视化LDA和T-SNE交互式可视化

By tecdat9月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, python, t-SNE, 主题建模, 可视化

我尝试使用Latent Dirichlet分配LDA来提取一些主题。本教程以自然语言处理流程为特色，从原始数据开始，准备，建模，可视化论文。

R语言文本挖掘tf-idf,主题建模，情感分析,n-gram建模研究

By tecdat9月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术n-gram, 主题建模, 情感分析, 文本, 文本挖掘

最近我们被客户要求撰写关于文本挖掘的研究报告。我们对20个Usenet公告板的20,000条消息进行分析。

Python基于粒子群优化(PSO)的投资组合优化研究

By tecdat9月 16, 2019大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融PSO, python, 优化, 套利, 投资组合, 粒子群优化

我今年的研究课题是使用粒子群优化（PSO）的货币进行交易组合优化。

R语言使用Metropolis- Hasting抽样算法进行逻辑回归

By tecdat9月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Metropolis, Metropolis- Hasting, Metropolis–Hastings, 回归, 抽样, 抽样算法, 逻辑回归

在逻辑回归中，我们将二元因变量Y_i回归到协变量X_i上。

R语言文本挖掘NASA数据网络分析，tf-idf和主题建模

By tecdat9月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, tf-idf, 主题建模, 文本挖掘, 网络分析

NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。

R语言基于Keras的小数据集深度学习图像分类

By tecdat9月 15, 2019图像处理, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, R语言, 图像分类, 深度学习

必须使用非常少的数据训练图像分类模型是一种常见情况，如果您在专业环境中进行计算机视觉，则在实践中可能会遇到这种情况。

R语言实现拟合神经网络预测和结果可视化

By tecdat9月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 可视化, 神经网络, 预测

神经网络一直是迷人的机器学习模型之一

R语言用Rcpp加速Metropolis-Hastings抽样估计贝叶斯逻辑回归模型的参数

By tecdat9月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Hastings, Metropolis, Metropolis–Hastings, Rcpp, 回归, 抽样, 贝叶斯, 逻辑回归

在最近的一篇文章中，我描述了一个Metropolis-in-Gibbs采样器，用于估计贝叶斯逻辑回归模型的参数。

Python中利用长短期记忆模型LSTM进行时间序列预测分析 – 预测电力负荷数据

By tecdat9月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术LSTM, python, 时间序列, 电力消耗, 电力负荷, 电力负荷预测, 长短期记忆模型, 预测

LSTM（或长期短期存储器网络）允许分析具有长期依赖性的顺序或有序数据。当涉及到这项任务时，传统的神经网络不足，在这方面，LSTM将用于预测这种情况下的电力消耗模式。

如何用R语言在机器学习中建立集成模型？

By tecdat9月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 机器学习, 集成模型

在本文中，我将向您介绍集成建模的基础知识。另外，为了向您提供有关集合建模的实践经验。

R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

By tecdat9月 14, 2019可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术PCA, R语言, t-SNE, t-SNE算法, 主成分, 可视化, 降维, 高维数据

维度降低有两个主要用例：数据探索和机器学习。

R语言中不同类型的聚类方法比较

By tecdat9月 9, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 比较, 聚类

聚类方法用于识别从营销，生物医学和地理空间等领域收集的多变量数据集中的相似对象。

R语言中的划分聚类模型

By tecdat9月 9, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 划分聚类, 模型

划分聚类是用于基于数据集的相似性将数据集分类为多个组的聚类方法。

R语言stan进行基于贝叶斯推断的回归模型

By tecdat9月 4, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, stan, 回归, 贝叶斯, 贝叶斯推断, 贝叶斯推理分析

可以从许多统计软件包中运行Stan。到目前为止，我一直在从R运行Stan。

在PYTHON中进行主题模型LDA分析

By tecdat9月 3, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, nlp, python, 主题模型, 文本, 文本处理, 文本挖掘

主题建模是一种在大量文档中查找抽象主题的艺术方法。

基于模型的聚类和R语言中的高斯混合模型

By tecdat8月 23, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术GMM, R语言, 聚类, 高斯, 高斯混合模型

四种最常见的聚类方法模型是层次聚类，k均值聚类，基于模型的聚类和基于密度的聚类

R语言Kaggle泰坦尼克号性别阶级模型数据分析案例

By tecdat8月 19, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Kaggle, R语言, 泰坦尼克号

这场灾难以拯救“妇女和儿童第一”而闻名，所以让我们来看看性别和年龄变量。

用R语言实现神经网络预测股票实例

By tecdat8月 12, 2019大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融R语言, 神经网络, 股票, 预测

神经网络是一种基于现有数据创建预测的计算系统。

R语言线性判别分析（LDA），二次判别分析（QDA）和正则判别分析（RDA）

By tecdat8月 11, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, QDA, RDA, R语言, 二次判别分析, 判别分析, 正则判别分析, 线性判别分析

判别分析是可用于分类和降维的方法。

R语言社区主题检测算法应用案例

By tecdat8月 11, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 主题, 检测, 社区, 社区主题, 社区检测算法

通过分析文本和共同作者社交网络来研究社会科学、计算机和信息学方面的出版物。

R语言电信公司churn数据客户流失 k近邻（knn）模型预测分析

By tecdat8月 9, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术churn, churn数据, knn, k近邻, R语言, 客户流失, 电信公司

A telephone company is interested in determining which customer characteristics are useful for predicting churn, customers who will leave their service.