Category Archives: 计算机科学与技术

R语言中的多类别问题的绩效衡量：F1-score 和广义AUC

By tecdat2月 21, 2020大数据部落, 数理统计, 计算机科学与技术AUC, F1, R语言, 分类, 绩效衡量

对于分类问题，通常根据与分类器关联的混淆矩阵来定义分类器性能。

python中使用马尔可夫决策过程(MDP)动态编程来解决最短路径强化学习问题

By tecdat2月 20, 2020大数据部落, 数理统计, 计算机科学与技术MDP, python, 动态编程, 强化学习, 最短路径, 马尔可夫

在强化学习中，我们有兴趣确定一种最大化获取奖励的策略。假设环境是马尔可夫决策过程（MDP）的理想模型，我们可以应用动态编程方法来解决强化学习问题。

基于R语言实现LASSO回归分析

By tecdat2月 18, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, ols, R语言, 回归, 最小二乘法, 模拟

本文使用模拟数据比较了标准最小二乘法和lasso回归。

R语言画ROC曲线总结

By tecdat2月 18, 2020医药生物, 大数据部落, 数理统计, 计算机科学与技术ROC, ROC曲线, R语言

在本文中，我描述了如何在CRAN中搜索用于绘制ROC曲线的包，并重点介绍了六个有用的包。

R语言使用贝叶斯层次模型进行空间数据分析

By tecdat2月 17, 2020地理，运输，旅行和物流, 大数据部落, 数理统计, 计算机科学与技术R语言, 空间数据分析, 贝叶斯, 贝叶斯层次模型

在本节中，我将重点介绍使用集成嵌套拉普拉斯近似方法的贝叶斯推理。

python机器学习：推荐系统实现（以矩阵分解来协同过滤）

By tecdat2月 17, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术python, 协同过滤, 推荐系统, 机器学习, 矩阵分解

用户和产品的潜在特征编写推荐系统矩阵分解工作原理使用潜在表征来找到类似的产品。

使用SAS，Stata，HLM，R，SPSS和Mplus的多层线性模型HLM

By tecdat2月 15, 2020大数据部落, 教育学, 数理统计, 计算机科学与技术HLM, Mplus, R, SAS, SPSS, stata, 分层线性模型, 多层线性模型, 线性

本文档用于比较六个不同统计软件程序（SAS，Stata，HLM，R，SPSS和Mplus）的两级多层（也称分层或层次）线性模型的过程和输出。

R语言基于协方差的结构方程拟合的卡方检验

By tecdat2月 4, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 协方差, 卡方检验, 结构方程, 结构方程模型

在评估结构方程模型的拟合，很常见的应用是研究χ2进行测试

【视频讲解】R语言中的生存分析Survival analysis晚期肺癌患者4例

By tecdat1月 31, 2020医药生物, 大数据部落, 数理统计, 特色视频, 计算机科学与技术Survival analysis, 患者, 生存分析, 肺癌

本教程介绍了生存分析，以及如何在R中进行生存分析

R语言异方差回归模型建模：用误差方差解释异方差

By tecdat1月 23, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 异方差回归

R语言异方差回归模型建模：用误差方差解释异方差

R语言使用二进制回归将序数数据建模为多元GLM

By tecdat1月 22, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 二进制回归, 多元GLM

R语言使用二进制回归将序数数据建模为多元GLM

R语言基于协方差的SEM结构方程模型中的拟合指数

By tecdat1月 18, 2020大数据部落, 数理统计, 计算机科学与技术R语言, SEM, 协方差, 拟合, 结构方程, 结构方程模型

在实践中，因子负载较低（或测量质量较差）的模型的拟合指数要好于因子负载较高的模型。

Stata中的治疗效果：RA：回归调整、 IPW：逆概率加权、 IPWRA、 AIPW

By tecdat1月 18, 2020医药生物, 大数据部落, 数理统计, 计算机科学与技术IPW, RA, stata, 治疗效果, 逆概率加权

今天的主题是Stata中的治疗效果。我们将讨论四种治疗效果估计量：

RA：回归调整
IPW：逆概率加权
IPWRA：具有回归调整的逆概率加权
AIPW：增强的逆概率加权

R语言中的Theil-Sen回归分析

By tecdat1月 13, 2020大数据部落, 数理统计, 计算机科学与技术R语言, Theil-Sen回归, 回归分析

R语言中的Theil-Sen回归分析

R语言关于回归系数的解释

By tecdat1月 13, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 回归系数

R语言关于回归系数的解释

R语言中使用多重聚合预测算法（MAPA）进行时间序列分析

By tecdat1月 3, 2020大数据部落, 数理统计, 计算机科学与技术MAPA, 多重聚合, 多重聚合预测算法, 时间序列, 预测

第一估计模型在每个时间聚合级别的拟合度，还提供已识别ETS的可视化。

R语言使用最优聚类簇数k-medoids聚类进行客户细分

By tecdat12月 27, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术K-medoids, R语言, 最优聚类簇数, 聚类

k-medoids是另一种聚类算法，可用于在数据集中查找分组。

R语言中的岭回归、套索lasso回归、主成分回归：线性模型选择和正则化

By tecdat12月 26, 2019大数据部落, 数理统计, 计算机科学与技术LASSO, R语言, 主成分回归, 岭回归, 正则化

在本课程中，我们将考虑一些线性模型的替代拟合方法，除了通常的普通最小二乘法。

R语言基于树的方法：决策树，随机森林，Bagging，增强树

By tecdat12月 26, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Bagging, R语言, 决策树, 增强树, 套袋, 随机森林

本文是有关基于树的回归和分类方法的。

R语言无监督学习：PCA主成分分析可视化

By tecdat12月 25, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 无监督学习

R语言无监督学习：PCA主成分分析可视化

如何用r语言制作交互可视化报告

By tecdat12月 25, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术R语言, 交互可视化

如何用r语言制作交互可视化报告

R语言大数据分析纽约市的311万条投诉统计可视化与时间序列分析

By tecdat12月 25, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术R语言, 大数据分析, 时间序列, 纽约市, 统计可视化

R语言大数据分析纽约市的311万条投诉统计可视化与时间序列分析

【视频讲解】R语言里的非线性模型：多项式回归、局部样条、平滑样条、广义相加模型GAM分析

By tecdat12月 20, 2019大数据部落, 数理统计, 特色视频, 计算机科学与技术GAM, R语言, 回归, 多项式, 多项式回归, 局部样条, 平滑样条, 广义加性模型, 广义相加模型, 样条, 非线性, 非线性模型

在这里，我们放宽了流行的线性技术的线性假设。

基于R统计软件的三次样条和光滑样条模型数据拟合及预测

By tecdat12月 19, 2019大数据部落, 数理统计, 计算机科学与技术R, 三次样条, 平滑, 样条, 样条模型, 线性, 线性模型, 非线性

样条线是拟合非线性模型并从数据中学习非线性相互作用的一种方法。

R语言析因设计分析：线性模型中的对比

By tecdat12月 18, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 析因设计, 线性模型

R语言析因设计分析：线性模型中的对比

R语言逻辑回归、方差分析、伪R平方分析

By tecdat12月 17, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 伪R平方分析, 逻辑回归

R语言逻辑回归、方差分析、伪R平方分析

R语言逐步多元回归模型分析长鼻鱼密度影响因素

By tecdat12月 17, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 回归, 影响因素, 逐步, 逐步多元回归

我从马里兰州生物流调查中提取了一些数据，以进行多元回归分析。

R语言对回归模型进行协方差分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术协方差分析, 回归模型

R语言对回归模型进行协方差分析

R语言曲线回归：多项式回归、多项式样条回归、非线性回归数据分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 回归, 多项式样条回归, 非线性回归

本文将使用三种方法使模型适合曲线数据：1）多项式回归；2）用多项式样条进行B样条回归；3）进行非线性回归。

R语言中进行Spearman等级相关分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术R语言, Spearman, 相关分析, 等级相关分析

本文展示了r语言中如何进行Spearman等级相关分析的例子。

R语言相关分析和稳健线性回归分析

By tecdat12月 16, 2019大数据部落, 数理统计, 计算机科学与技术R语言, 相关分析, 稳健线性回归

R语言相关分析和稳健线性回归分析

R语言使用tf-idf描述NASA元数据的文本和关键字

By tecdat12月 13, 2019数理统计, 机器学习, 计算机科学与技术R语言, tf-idf, 数据, 文本挖掘

NASA有32,000多个数据集，有关NASA数据集的元数据可以JSON格式在线获得。

R语言对NASA元数据进行文本挖掘的主题建模分析

By tecdat12月 13, 2019大数据部落, 数理统计, 计算机科学与技术NASA, R语言, 文本挖掘

R语言对NASA元数据进行文本挖掘的主题建模分析

R语言随机搜索变量选择SSVS估计贝叶斯向量自回归（BVAR）模型

By tecdat12月 11, 20193 comments大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术BVAR, VAR模型, 向量自回归, 自回归, 贝叶斯, 贝叶斯向量自回归, 随机搜索变量选择

向量自回归（VAR）模型的一般缺点是，估计系数的数量与滞后的数量成比例地增加。

R语言VAR向量自回归模型的不同类型的脉冲响应分析

By tecdat12月 11, 2019大数据部落, 数理统计, 经济, 计算机科学与技术R语言, VAR模型, 向量自回归, 模型, 脉冲响应

脉冲响应分析是采用向量自回归模型的计量经济学分析中的重要一步。

【视频讲解】R语言用向量自回归（VAR）进行经济数据脉冲响应研究分析

By tecdat12月 10, 2019大数据部落, 数理统计, 特色视频, 经济, 计算机科学与技术R语言, VAR模型, 向量自回归, 经济, 经济数据, 脉冲响应

自从Sims（1980）发表开创性的论文以来，向量自回归模型已经成为宏观经济研究中的关键工具。

R语言从经济时间序列中用HP滤波器，小波滤波和经验模态分解等提取周期性成分分析

By tecdat12月 10, 2019大数据部落, 数理统计, 经济, 计算机科学与技术emd, R语言, 周期, 小波滤波, 成分分析, 时间序列, 经济, 经济时间序列, 经验模式分解, 经验模态分解

经济时间序列的分析通常需要提取其周期性成分。

python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证

By tecdat12月 9, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Iris, pandas, python, Scikit-learn, 交叉验证, 决策树, 分类, 鸢尾花数据

最近我们被客户要求撰写关于决策树分类的研究报告。将使用著名的iris数据集，该数据集对各种不同的iris类型进行各种测量。

CNN+ Auto-Encoder 实现无监督Sentence Embedding ( 基于Tensorflow)

By tecdat12月 9, 2019大数据部落, 机器学习, 计算机科学与技术CNN, TensorFlow

CNN+ Auto-Encoder 实现无监督Sentence Embedding ( 基于Tensorflow)

R语言数据可视化分析案例：探索BRFSS数据数据分析报告

By tecdat12月 6, 2019可视化和设计, 数理统计, 计算机科学与技术BRFSS, R语言, 可视化, 数据可视化

R语言数据可视化分析案例：探索BRFSS数据数据分析报告

R语言探索BRFSS数据可视化

By tecdat12月 6, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术BRFSS, R语言, 数据可视化

R语言探索BRFSS数据可视化

数据把握电影市场需求

By tecdat12月 6, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术数据, 电影市场

电影产业是文化产业的重要支柱，作为一种文化产品，通过商业元素与艺术元素结合释放巨大价值，电影的票房能直观的体现电影的市场需求。

R语言在BRFSS数据中可视化分析探索糖尿病的影响因素

By tecdat12月 5, 2019医药生物, 可视化和设计, 大数据部落, 数理统计, 计算机科学与技术BRFSS, R语言, 可视化, 糖尿病

R语言在BRFSS数据中可视化分析探索糖尿病的影响因素

R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风

By tecdat12月 5, 2019可视化和设计, 大数据部落, 数理统计, 计算机科学与技术Logistic, R语言, 可视化, 回归, 逻辑回归

R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风

R语言对BRFSS数据探索回归数据分析

By tecdat12月 4, 2019大数据部落, 数理统计, 计算机科学与技术BRFSS, R语言, 回归数据分析, 数据探索

R语言对BRFSS数据探索回归数据分析

【视频】在r语言中使用GAM（广义相加模型）进行电力负荷时间序列分析

By tecdat11月 26, 20191 comment大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术GAM, R语言, 广义加法模型, 广义相加模型, 时间序列, 电力负荷, 电力负荷预测

在绘制的时间序列中可以看到两个主要的季节性：每日和每周。我们在一天中有48个测量值，在一周中有7天，因此这将是我们用来对响应变量进行建模的自变量–电力负荷。

用Python进行图像模糊处理和特征提取

By tecdat11月 26, 2019图像处理, 大数据部落, 数理统计, 计算机科学与技术python, 图像处理, 图像模糊处理, 特征, 特征提取

特征提取。但是这里我们需要更深入的数据清理。数据清理是在数据集，表格，文本等上完成的。如何在图像上完成？

R语言中的偏最小二乘回归PLS-DA

By tecdat11月 22, 2019医药生物, 大数据部落, 数理统计, 计算机科学与技术PLS, PLS—DA, R语言, 偏最小二乘, 偏最小二乘回归, 回归, 最小二乘

主成分回归（PCR）的方法本质上是使用第一个方法的普通最小二乘（OLS）拟合来自预测变量的主成分（PC）。

R语言实现偏最小二乘回归法 partial least squares (PLS)回归

By tecdat11月 20, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术partial least squares, PLS, R语言, 偏最小二乘, 偏最小二乘回归, 回归, 最小二乘

偏最小二乘回归是一种回归形式。

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类

By tecdat11月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, LSTM, nlp, python, 分类, 文本, 神经网络

最近我们被客户要求撰写关于开发具有多个输出的文本分类模型的研究报告。

python爬虫进行Web抓取LDA主题语义数据分析

By tecdat11月 18, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, python, Web抓取, 主题, 主题模型, 数据采集, 爬虫, 词云, 语义, 采集

从网站提取数据的方法称为网络抓取。

Python使用神经网络进行简单文本分类

By tecdat11月 15, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术python, 文本分类, 神经网络

深度学习无处不在。在本文中，我们将使用Keras进行文本分类。

在Python中自然语言处理生成词云WordCloud

By tecdat11月 15, 2019大数据部落, 数理统计, 计算机科学与技术python, WordCloud, 自然语言处理, 词云

在Python中自然语言处理生成词云WordCloud

使用Python中的ImageAI进行对象检测

By tecdat11月 13, 2019信息与通信工程, 图像处理, 大数据部落, 控制科学与工程, 数理统计, 机器学习, 机械工程及自动化, 计算机科学与技术ImageAI, python, 对象检测

在本文中，您将看到如何在Python中执行对象检测。

适用于NLP自然语言处理的Python：使用Facebook FastText库

By tecdat11月 12, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术FastText, nlp, python, 自然语言处理

在本文中，我们将研究FastText，它是用于单词嵌入和文本分类的另一个极其有用的模块。

R语言ISLR工资数据进行多项式回归和样条回归分析

By tecdat11月 11, 20191 comment大数据部落, 数理统计, 计算机科学与技术ISLR, R语言, 回归, 多项式回归, 工资数据, 样条回归

使用交叉验证为多项式选择最佳次数。选择了什么程度，这与使用进行假设检验的结果相比如何ANOVA？对所得多项式拟合数据进行绘图。

Python中用PyTorch机器学习神经网络分类预测银行客户流失模型

By tecdat11月 8, 2019大数据部落, 数据库, 数理统计, 机器学习, 计算机科学与技术PyTorch, 分类, 分类预测, 客户流失模型, 机器学习, 深度学习, 神经网络, 银行, 预测

分类问题属于机器学习问题的类别，其中给定一组特征，任务是预测离散值。

回归分析与相关分析的区别和联系

R语言OutliersO3软件包异常值检测方法比较

By tecdat11月 8, 2019大数据部落, 数理统计, 计算机科学与技术OutliersO3, R语言, 异常值检测

R语言OutliersO3软件包异常值检测方法比较

基于keras平台CNN神经网络模型的服装图像识别分析

By tecdat11月 8, 2019图像处理, 大数据部落, 数理统计, 机器学习, 计算机科学与技术CNN, Keras, 神经网络

在许多介绍图像识别任务的介绍中，通常使用着名的MNIST数据集。

主成分分析(PCA)原理及R语言实现及分析实例

By tecdat11月 8, 2019大数据部落, 数理统计, 计算机科学与技术PCA, R语言, 主成分分析

主成分分析（PCA）是一种数据降维技巧，它能将大量相关变量转化为一组很少的不相关变量，这些无关变量称为主成分。

R语言实现向量自回归VAR模型

By tecdat11月 7, 2019大数据部落, 数理统计, 经济, 计算机科学与技术R语言, VAR模型, 向量自回归, 时变VAR模型, 模型

澳大利亚在2008 – 2009年全球金融危机期间，政府发布了一揽子刺激计划，其中包括2008年12月的现金支付，恰逢圣诞节支出。

python在Keras中使用LSTM解决序列问题

By tecdat11月 6, 2019大数据部落, 数理统计, 计算机科学与技术Keras, LSTM, python, 序列问题, 时间序列, 神经网络

时间序列预测是指我们必须根据时间相关的输入来预测结果的问题类型。

python使用MongoDB，Seaborn和Matplotlib文本分析和可视化API数据

By tecdat11月 6, 2019大数据部落, 数理统计, 计算机科学与技术API数据, Matplotlib, MongoDB, seaborn

python使用MongoDB，Seaborn和Matplotlib文本分析和可视化API数据

用于NLP的Python：使用Keras进行深度学习文本生成

By tecdat11月 6, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, nlp, python, 人工智能, 文本, 文本生成, 深度学习

深度学习技术已用于各种文本生成任务，例如写作诗歌，生成电影脚本甚至创作音乐。

用Python的Numpy求解线性方程组

By tecdat11月 6, 2019大数据部落, 数理统计, 计算机科学与技术Numpy, python, 线性混合效应模型, 解线性方程组

在本文中，您将看到如何使用Python的Numpy库解决线性方程组。

python用于NLP的seq2seq模型实例:用Keras实现神经网络机器翻译

By tecdat11月 6, 2019大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, LSTM, nlp, python, seq2seq, 机器翻译, 神经机器翻译, 神经网络

在本文中，我们将看到如何创建语言翻译模型，这也是神经机器翻译的非常著名的应用。

使用Python和Keras进行主成分分析、神经网络构建图像重建的自动编码器

By tecdat11月 5, 2019图像处理, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Keras, python, 主成分分析, 图像重建, 神经网络, 自动编码器

如今，几乎我们使用的每个应用程序中都有大量数据- 听音乐，浏览朋友的图像，或者观看新的预告片

Category Archives: 计算机科学与技术

关注我们，永远不要错过任何见解。