Category Archives: 数理统计

R语言中使用多重聚合预测算法（MAPA）进行时间序列分析

By tecdat1月 3, 2020大数据部落, 数理统计, 计算机科学与技术MAPA, 多重聚合, 多重聚合预测算法, 时间序列, 预测

第一估计模型在每个时间聚合级别的拟合度，还提供已识别ETS的可视化。

R语言使用最优聚类簇数k-medoids聚类进行客户细分

By tecdat12月 27, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术K-medoids, R语言, 最优聚类簇数, 聚类

k-medoids是另一种聚类算法，可用于在数据集中查找分组。

R语言中的岭回归、套索lasso回归、主成分回归：线性模型选择和正则化

By tecdat12月 26, 2019大数据部落, 数理统计, 计算机科学与技术LASSO, R语言, 主成分回归, 岭回归, 正则化

在本课程中，我们将考虑一些线性模型的替代拟合方法，除了通常的普通最小二乘法。

R语言基于树的方法：决策树，随机森林，Bagging，增强树

By tecdat12月 26, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Bagging, R语言, 决策树, 增强树, 套袋, 随机森林

本文是有关基于树的回归和分类方法的。

R语言无监督学习：PCA主成分分析可视化

By tecdat12月 25, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 无监督学习

R语言无监督学习：PCA主成分分析可视化

如何用r语言制作交互可视化报告

By tecdat12月 25, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术R语言, 交互可视化

如何用r语言制作交互可视化报告

R语言大数据分析纽约市的311万条投诉统计可视化与时间序列分析

By tecdat12月 25, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术R语言, 大数据分析, 时间序列, 纽约市, 统计可视化

R语言大数据分析纽约市的311万条投诉统计可视化与时间序列分析

R语言动态可视化：制作历史全球平均温度的累积动态折线图动画gif视频图

By tecdat12月 23, 2019可视化和设计, 大数据部落, 数理统计gif, R语言, 动态, 动态可视化, 动画, 可视化, 温度, 视频, 视频图

在某些情况下，你可能希望通过在每帧中添加数据并保留先前添加的数据来进行动画处理。

【视频讲解】R语言里的非线性模型：多项式回归、局部样条、平滑样条、广义相加模型GAM分析

By tecdat12月 20, 2019大数据部落, 数理统计, 特色视频, 计算机科学与技术GAM, R语言, 回归, 多项式, 多项式回归, 局部样条, 平滑样条, 广义加性模型, 广义相加模型, 样条, 非线性, 非线性模型

在这里，我们放宽了流行的线性技术的线性假设。

使用R语言进行机制检测的隐马尔可夫模型HMM

By tecdat12月 20, 2019大数据部落, 数理统计, 经济, 金融HMM, R语言, 市场收益, 机制检测, 隐马尔可夫模型, 马尔可夫

在本文中，将对“牛市”和“熊市”两个独立机制下的市场收益进行模拟。隐马尔可夫模型识别处于特定状态的概率。

基于R统计软件的三次样条和光滑样条模型数据拟合及预测

By tecdat12月 19, 2019大数据部落, 数理统计, 计算机科学与技术R, 三次样条, 平滑, 样条, 样条模型, 线性, 线性模型, 非线性

样条线是拟合非线性模型并从数据中学习非线性相互作用的一种方法。

R语言析因设计分析：线性模型中的对比

By tecdat12月 18, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 析因设计, 线性模型

R语言析因设计分析：线性模型中的对比

R语言逻辑回归、方差分析、伪R平方分析

By tecdat12月 17, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 伪R平方分析, 逻辑回归

R语言逻辑回归、方差分析、伪R平方分析

R语言多重比较方法

By tecdat12月 17, 2019大数据部落, 数理统计R语言, 多重比较

假设检验的基本原理是小概率原理，即我们认为小概率事件在一次试验中实际上不可能发生。

R语言逐步多元回归模型分析长鼻鱼密度影响因素

By tecdat12月 17, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 回归, 影响因素, 逐步, 逐步多元回归

我从马里兰州生物流调查中提取了一些数据，以进行多元回归分析。

R语言对回归模型进行协方差分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术协方差分析, 回归模型

R语言对回归模型进行协方差分析

R语言曲线回归：多项式回归、多项式样条回归、非线性回归数据分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 回归, 多项式样条回归, 非线性回归

本文将使用三种方法使模型适合曲线数据：1）多项式回归；2）用多项式样条进行B样条回归；3）进行非线性回归。

R语言中进行Spearman等级相关分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术R语言, Spearman, 相关分析, 等级相关分析

本文展示了r语言中如何进行Spearman等级相关分析的例子。

R语言相关分析和稳健线性回归分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 相关分析, 稳健线性回归

R语言相关分析和稳健线性回归分析

R语言使用tf-idf描述NASA元数据的文本和关键字

By tecdat12月 13, 2019数理统计, 机器学习, 计算机科学与技术R语言, tf-idf, 数据, 文本挖掘

NASA有32,000多个数据集，有关NASA数据集的元数据可以JSON格式在线获得。

R语言对NASA元数据进行文本挖掘的主题建模分析

By tecdat12月 13, 2019大数据部落, 数理统计, 计算机科学与技术NASA, R语言, 文本挖掘

R语言对NASA元数据进行文本挖掘的主题建模分析

R语言随机搜索变量选择SSVS估计贝叶斯向量自回归（BVAR）模型

By tecdat12月 11, 20193 comments大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术BVAR, VAR模型, 向量自回归, 自回归, 贝叶斯, 贝叶斯向量自回归, 随机搜索变量选择

向量自回归（VAR）模型的一般缺点是，估计系数的数量与滞后的数量成比例地增加。

R语言VAR向量自回归模型的不同类型的脉冲响应分析

By tecdat12月 11, 2019大数据部落, 数理统计, 经济, 计算机科学与技术R语言, VAR模型, 向量自回归, 模型, 脉冲响应

脉冲响应分析是采用向量自回归模型的计量经济学分析中的重要一步。

【视频讲解】R语言用向量自回归（VAR）进行经济数据脉冲响应研究分析

By tecdat12月 10, 2019大数据部落, 数理统计, 特色视频, 经济, 计算机科学与技术R语言, VAR模型, 向量自回归, 经济, 经济数据, 脉冲响应

自从Sims（1980）发表开创性的论文以来，向量自回归模型已经成为宏观经济研究中的关键工具。

R语言从经济时间序列中用HP滤波器，小波滤波和经验模态分解等提取周期性成分分析

By tecdat12月 10, 2019大数据部落, 数理统计, 经济, 计算机科学与技术emd, R语言, 周期, 小波滤波, 成分分析, 时间序列, 经济, 经济时间序列, 经验模式分解, 经验模态分解

经济时间序列的分析通常需要提取其周期性成分。

python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证

By tecdat12月 9, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, pandas, python, Scikit-learn, 交叉验证, 决策树, 分类, 鸢尾花数据

最近我们被客户要求撰写关于决策树分类的研究报告。将使用著名的iris数据集，该数据集对各种不同的iris类型进行各种测量。

R语言数据可视化分析案例：探索BRFSS数据数据分析报告

By tecdat12月 6, 2019可视化和设计, 数理统计, 计算机科学与技术BRFSS, R语言, 可视化, 数据可视化

R语言数据可视化分析案例：探索BRFSS数据数据分析报告

R语言探索BRFSS数据可视化

By tecdat12月 6, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术BRFSS, R语言, 数据可视化

R语言探索BRFSS数据可视化

数据把握电影市场需求

By tecdat12月 6, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术数据, 电影市场

电影产业是文化产业的重要支柱，作为一种文化产品，通过商业元素与艺术元素结合释放巨大价值，电影的票房能直观的体现电影的市场需求。

R语言在BRFSS数据中可视化分析探索糖尿病的影响因素

By tecdat12月 5, 2019医药生物, 可视化和设计, 大数据部落, 数理统计, 计算机科学与技术BRFSS, R语言, 可视化, 糖尿病

R语言在BRFSS数据中可视化分析探索糖尿病的影响因素

R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风

By tecdat12月 5, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术Logistic, R语言, 可视化, 回归, 逻辑回归

R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风

R语言对BRFSS数据探索回归数据分析

By tecdat12月 4, 2019大数据部落, 数理统计, 计算机科学与技术BRFSS, R语言, 回归数据分析, 数据探索

R语言对BRFSS数据探索回归数据分析

【视频】在r语言中使用GAM（广义相加模型）进行电力负荷时间序列分析

By tecdat11月 26, 20191 comment大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术GAM, R语言, 广义加法模型, 广义相加模型, 时间序列, 电力负荷, 电力负荷预测

在绘制的时间序列中可以看到两个主要的季节性：每日和每周。我们在一天中有48个测量值，在一周中有7天，因此这将是我们用来对响应变量进行建模的自变量–电力负荷。

用Python进行图像模糊处理和特征提取

By tecdat11月 26, 2019图像处理, 大数据部落, 数理统计, 计算机科学与技术python, 图像处理, 图像模糊处理, 特征, 特征提取

特征提取。但是这里我们需要更深入的数据清理。数据清理是在数据集，表格，文本等上完成的。如何在图像上完成？

R语言中的偏最小二乘回归PLS-DA

By tecdat11月 22, 2019医药生物, 大数据部落, 数理统计, 计算机科学与技术PLS, PLS—DA, R语言, 偏最小二乘, 偏最小二乘回归, 回归, 最小二乘

主成分回归（PCR）的方法本质上是使用第一个方法的普通最小二乘（OLS）拟合来自预测变量的主成分（PC）。

R语言实现偏最小二乘回归法 partial least squares (PLS)回归

By tecdat11月 20, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术partial least squares, PLS, R语言, 偏最小二乘, 偏最小二乘回归, 回归, 最小二乘

偏最小二乘回归是一种回归形式。

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类

By tecdat11月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, LSTM, nlp, python, 分类, 文本, 神经网络

最近我们被客户要求撰写关于开发具有多个输出的文本分类模型的研究报告。

python爬虫进行Web抓取LDA主题语义数据分析

By tecdat11月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, python, Web抓取, 主题, 主题模型, 数据采集, 爬虫, 词云, 语义, 采集

从网站提取数据的方法称为网络抓取。

Python使用神经网络进行简单文本分类

By tecdat11月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术python, 文本分类, 神经网络

深度学习无处不在。在本文中，我们将使用Keras进行文本分类。

在Python中自然语言处理生成词云WordCloud

By tecdat11月 15, 2019大数据部落, 数理统计, 计算机科学与技术python, WordCloud, 自然语言处理, 词云

在Python中自然语言处理生成词云WordCloud

使用Python中的ImageAI进行对象检测

By tecdat11月 13, 2019信息与通信工程, 图像处理, 大数据部落, 控制科学与工程, 数理统计, 机器学习, 机械工程及自动化, 计算机科学与技术ImageAI, python, 对象检测

在本文中，您将看到如何在Python中执行对象检测。

适用于NLP自然语言处理的Python：使用Facebook FastText库

By tecdat11月 12, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术FastText, nlp, python, 自然语言处理

在本文中，我们将研究FastText，它是用于单词嵌入和文本分类的另一个极其有用的模块。

R语言ISLR工资数据进行多项式回归和样条回归分析

By tecdat11月 11, 20191 comment大数据部落, 数理统计, 计算机科学与技术ISLR, R语言, 回归, 多项式回归, 工资数据, 样条回归

使用交叉验证为多项式选择最佳次数。选择了什么程度，这与使用进行假设检验的结果相比如何ANOVA？对所得多项式拟合数据进行绘图。

Python中用PyTorch机器学习神经网络分类预测银行客户流失模型

By tecdat11月 8, 2019大数据部落, 数据库, 数理统计, 机器学习, 计算机科学与技术PyTorch, 分类, 分类预测, 客户流失模型, 机器学习, 深度学习, 神经网络, 银行, 预测

分类问题属于机器学习问题的类别，其中给定一组特征，任务是预测离散值。

回归分析与相关分析的区别和联系

R语言OutliersO3软件包异常值检测方法比较

By tecdat11月 8, 2019大数据部落, 数理统计, 计算机科学与技术OutliersO3, R语言, 异常值检测

R语言OutliersO3软件包异常值检测方法比较

基于keras平台CNN神经网络模型的服装图像识别分析

By tecdat11月 8, 2019图像处理, 大数据部落, 数理统计, 机器学习, 计算机科学与技术CNN, Keras, 神经网络

在许多介绍图像识别任务的介绍中，通常使用着名的MNIST数据集。

主成分分析(PCA)原理及R语言实现及分析实例

By tecdat11月 8, 2019大数据部落, 数理统计, 计算机科学与技术PCA, R语言, 主成分分析

主成分分析（PCA）是一种数据降维技巧，它能将大量相关变量转化为一组很少的不相关变量，这些无关变量称为主成分。

R语言实现向量自回归VAR模型

By tecdat11月 7, 2019大数据部落, 数理统计, 经济, 计算机科学与技术R语言, VAR模型, 向量自回归, 时变VAR模型, 模型

澳大利亚在2008 – 2009年全球金融危机期间，政府发布了一揽子刺激计划，其中包括2008年12月的现金支付，恰逢圣诞节支出。

python在Keras中使用LSTM解决序列问题

By tecdat11月 6, 2019大数据部落, 数理统计, 计算机科学与技术Keras, LSTM, python, 序列问题, 时间序列, 神经网络

时间序列预测是指我们必须根据时间相关的输入来预测结果的问题类型。

python使用MongoDB，Seaborn和Matplotlib文本分析和可视化API数据

By tecdat11月 6, 2019大数据部落, 数理统计, 计算机科学与技术API数据, Matplotlib, MongoDB, seaborn

python使用MongoDB，Seaborn和Matplotlib文本分析和可视化API数据

用于NLP的Python：使用Keras进行深度学习文本生成

By tecdat11月 6, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, nlp, python, 人工智能, 文本, 文本生成, 深度学习

深度学习技术已用于各种文本生成任务，例如写作诗歌，生成电影脚本甚至创作音乐。

用Python的Numpy求解线性方程组

By tecdat11月 6, 2019大数据部落, 数理统计, 计算机科学与技术Numpy, python, 线性混合效应模型, 解线性方程组

在本文中，您将看到如何使用Python的Numpy库解决线性方程组。

python用于NLP的seq2seq模型实例:用Keras实现神经网络机器翻译

By tecdat11月 6, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, LSTM, nlp, python, seq2seq, 机器翻译, 神经机器翻译, 神经网络

在本文中，我们将看到如何创建语言翻译模型，这也是神经机器翻译的非常著名的应用。

使用Python和Keras进行主成分分析、神经网络构建图像重建的自动编码器

By tecdat11月 5, 2019图像处理, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, python, 主成分分析, 图像重建, 神经网络, 自动编码器

如今，几乎我们使用的每个应用程序中都有大量数据- 听音乐，浏览朋友的图像，或者观看新的预告片

python使用Flask，Redis和Celery的异步任务

By tecdat11月 4, 2019信息管理与信息系统, 大数据部落, 数理统计, 计算机科学与技术, 软件工程Celery, Flask, python, 异步任务

随着Web应用程序的发展和使用的增加，用例也变得多样化。

解读出租房市场的数据密码

By tecdat11月 4, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术出租房市场, 数据, 机器学习

租赁市场正在发生变化。随着越来越多的行业巨头涌入，金融的、互联网的、房地产的，租赁地产成为炙手可热的风口。

【视频讲解】在R语言中进行缺失值填充：估算缺失值

By tecdat11月 1, 2019大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术R语言, 估算缺失值, 回归, 填充, 多元插补, 多重插补, 插补, 缺失值, 随机森林, 非参数回归

缺失值被认为是预测建模的首要障碍。因此，掌握克服这些问题的方法很重要。

用R语言模拟混合制排队随机服务排队系统

By tecdat10月 30, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 排队系统, 模拟, 混合制排队系统, 随机, 随机服务排队系统

在本文中我们用R语言模拟混合制排队随机服务排队系统。

用R语言模拟M / M / 1随机服务排队系统

By tecdat10月 30, 2019大数据部落, 数理统计, 计算机科学与技术M / M / 1, 排队系统, 模拟, 运筹学, 随机服务

本文中我在R中构造一个简单的M / M / 1队列的_离散事件_模拟。

用R语言模拟随机服务排队系统

By tecdat10月 29, 2019大数据部落, 数理统计R语言, 排队系统, 模拟, 随机服务

用R语言模拟随机服务排队系统

在Python中使用LSTM和PyTorch进行时间序列预测

By tecdat10月 29, 20191 comment信息管理与信息系统, 地理，运输，旅行和物流, 大数据部落, 数理统计, 计算机科学与技术, 软件工程LSTM, python, PyTorch, 时间序列, 预测

诸如长期短期记忆网络（LSTM）之类的高级深度学习模型能够捕获时间序列数据中的模式，因此可用于对数据的未来趋势进行预测。

Tableau 数据可视化：探索性图形分析新生儿死亡率数据

By tecdat10月 28, 2019可视化和设计, 数理统计tableau, 数据可视化

Tableau 数据可视化：探索性图形分析新生儿死亡率数据今天，我们将与Tableau Public合作，使

R、Python、Open Refine采集pdf数据，清理数据和格式化数据

By tecdat10月 28, 2019大数据部落, 数理统计Open Refine, python, 采集pdf数据

R、Python、Open Refine采集pdf数据，清理数据和格式化数据

r语言绘制动态统计图：世界各国的人均GDP，期望寿命和人口气泡图动画gif图

By tecdat10月 24, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术GDP, gif, R语言, 动态, 动态gif图, 可视化, 气泡图

我们制作了以下图表，显示了2016年世界各国的人均GDP，出生时的期望寿命和人口。

matlab贝叶斯隐马尔可夫HMM模型实现

By tecdat10月 23, 2019大数据部落, 数理统计, 计算机科学与技术HMM, matlab, 概率模型, 模型, 贝叶斯, 隐马尔可夫, 马尔可夫

贝叶斯隐马尔可夫模型是一种用于分割连续多变量数据的概率模型。

matlab中的隐马尔可夫模型(HMM)实现

By tecdat10月 23, 2019大数据部落, 数理统计, 经济, 计算机科学与技术HMM, matlab

matlab中的隐马尔可夫模型(HMM)实现

matlab使用贝叶斯优化的深度学习：卷积神经网络CNN

By tecdat10月 22, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术matlab, 深度学习, 贝叶斯

此示例说明如何将贝叶斯优化应用于深度学习，以及如何为卷积神经网络找到最佳网络超参数和训练选项。