Search Results: 聚类

R语言中LDA模型：对文本数据进行主题模型topic modeling分析

By tecdat 8月 2, 2019 大数据部落, 数理统计, 机器学习, 计算机科学与技术 LDA, R语言, topic modeling, 主题模型, 文本, 文本数据

在文本挖掘中，我们经常收集一些文档集合，例如博客文章或新闻文章，我们希望将其分成组，以便我们可以分别理解它们。主题建模是对这些文档进行无监督分类的一种方法，类似于对数字数据进行聚类，即使我们不确定要查找什么，也可以找到分组。

python主题LDA建模和t-SNE可视化

By tecdat 8月 2, 2019 信息管理与信息系统, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术, 软件工程 LDA, python, t-SNE, 主题, 主题LDA, 可视化, 建模

我们将首先介绍主题建模和t-SNE，然后将这些技术应用于两个数据集：20个新闻组和推文。

Python用广义加性模型GAM进行时间序列分析

By tecdat 8月 1, 2019 大数据部落, 数理统计, 计算机科学与技术 GAM, python, 广义加性模型, 时间序列

每当你发现一个与时间对应的趋势时，你就会看到一个时间序列。

R语言之文本分析：主题建模LDA

By tecdat 7月 31, 2019 大数据部落, 数理统计, 机器学习, 计算机科学与技术 LDA, R语言, 主题建模, 文本分析

通常，当我们在线搜索信息时，有两种主要方法：关键字 – 使用搜索引擎并输入与我们想要查找的内容相关的单词
链接。链接的页面可能共享相似或相关的内容。

R语言预测期货波动率的实现：ARCH与HAR-RV与GARCH，ARFIMA模型比较

By tecdat 7月 31, 2019 1 comment 大数据部落, 数理统计, 经济, 计算机科学与技术, 金融 ARCH, ARCH模型, ARFIMA, GARCH, HAR, HAR-RV, HAR-RV模型, R语言, 时间序列, 期货, 模型, 波动率, 股市, 股票, 股票市场, 预测, 预测波动率

波动率是众多定价和风险模型中的关键参数，例如BS定价方法或风险价值的计算。

R语言：EM算法和高斯混合模型的实现

By tecdat 7月 27, 2019 大数据部落, 数理统计, 机器学习, 计算机科学与技术 EM算法, R语言, 高斯混合模型

本文考虑R语言的EM算法和高斯混合模型实现。

R语言GAM（广义相加模型）对物业耗电量进行预测

By tecdat 7月 23, 2019 大数据部落, 数理统计, 机器学习, 计算机科学与技术 GAM, R语言, 广义相加模型, 时间序列, 耗电量, 预测

我已经准备了一个文件，其中包含四个用电时间序列来进行分析。数据操作将由data.table程序包完成。

R语言多元Copula GARCH 模型时间序列预测

By tecdat 7月 23, 2019 大数据部落, 数理统计, 经济, 计算机科学与技术, 金融 copula, GARCH, R语言, 多元Copula GARCH 模型, 市场, 时间序列, 时间序列预测, 股市, 股票, 金融, 预测

和宏观经济数据不同，金融市场上多为高频数据，比如股票收益率序列。

NLP自然语言处理—主题模型LDA可视化案例：挖掘人民网留言板文本数据

By tecdat 8月 13, 2018 可视化和设计, 大数据部落, 数理统计, 机器学习 LDA, nlp, 主题模型, 人民网, 数据, 数据爬虫, 数据采集, 爬虫, 留言板

随着网民规模的不断扩大，互联网不仅是传统媒体和生活方式的补充，也是民意凸显的地带。

看推特数据如何”塑造”地区形象

By tecdat 8月 12, 2017 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术 LDA, nlp, 主题模型, 情感分析, 推特, 数据, 文本, 文本分析, 文本挖掘, 爬虫, 舆情分析, 采集

高度信息化的今天,社交媒体向我们提供直接认识外界的一个窗口,决定着大家对一个地区的认知，像是一双对地区形象“塑型”的“看不见”的手。

数据风控的探索实践:机器学习识别欺诈

By tecdat 7月 26, 2017 大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融机器学习, 欺诈, 风控

在信息爆炸时代，“信用”已成为越来越重要的无形财产。

用关联规则数据挖掘探索药物配伍中的规律

By tecdat 5月 25, 2017 医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术 R语言, 关联规则, 药物, 药物配伍

拓端数据使用数据挖掘技术对海量的在线医院药物复方历史数据进行智能分析，并从中找出药物配伍的规律，帮助客户解决独特的业务问题。

By tecdat 5月 8, 2017

反欺诈 tecdat反欺诈使商业企业和政府机构能够发现和消除复杂的犯罪活动，包括信用卡破产欺诈、洗钱、抵押欺诈

用机器学习的方法对物业耗电量预测

By tecdat 5月 3, 2017 大数据部落, 数理统计, 机器学习, 计算机科学与技术机器学习, 物业耗电量, 预测

我已经准备了一个文件，其中包含四个用电时间序列来进行分析。数据操作将由data.table程序包完成。

1
2
3
4
5

售前咨询热线

15121130882

售后咨询热线

0571-63341498