R语言文本挖掘NASA数据网络分析,tf-idf和主题建模
NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。
NASA托管和/或维护了超过32,000个数据集; 这些数据集涵盖了从地球科学到航空航天工程到NASA本身管理的主题。
必须使用非常少的数据训练图像分类模型是一种常见情况,如果您在专业环境中进行计算机视觉,则在实践中可能会遇到这种情况。
神经网络一直是迷人的机器学习模型之一
本文使用R语言进行stan泊松回归Poisson regression。
R语言旅行推销员问题TSP
R语言有RStan的多维验证性因子分析(CFA)
本文使用R语言对mtcar数据进行相关矩阵分析及其可视化
在R语言中显示美丽的数据摘要summary统计信息
在Amazon Web Services中使用R语言运行模拟
用SAS进行泊松,零膨胀泊松和有限混合Poisson模型分析
R语言实现有限混合建模分析
混合模型是k个分量分布的混合,它们共同形成混合分布
根据生存曲线的估计,可以推断出相比组之间存活时间的差异,因此生存曲线非常有用,几乎可以在每个生存分析中看到。
R语言混合时间预测对时间序列进行点估计
Python使用矩阵分解法找到类似的音乐
在本文中,我将介绍ARMA,ARIMA(Box-Jenkins),SARIMA和ARIMAX模型如何用于预测给定的时间序列数据。
代写python assignment经常用到的“万能”词汇分享!3天入门!
神经网络是一种基于现有数据创建预测的计算系统。
对于我的可视化类,选择文本作为我的最终项目“数据集”是一个简单的选择。该文有大约175,000个单词,分为42章。我在网上找到了这本书的原始文本版本并开始工作。
matlab利用PLSR和支持向量回归分析红树林叶面化学的高光谱分析
A telephone company is interested in determining which customer characteristics are useful for predicting churn, customers who will leave their service.
R语言做复杂金融产品的几何布朗运动的模拟
Python用PyMC3实现贝叶斯线性回归模型
R语言实现:混合正态分布EM最大期望估计法
r语言中使用Bioconductor 分析芯片数据
R语言填补缺失的数据
从海量数据中发现潜在标志指标, 需要借助多变量模式识别方法。
R语言使用特征工程泰坦尼克号数据分析应用案例
我们将首先介绍主题建模和t-SNE,然后将这些技术应用于两个数据集:20个新闻组和推文。
尽管航空业强劲,但为了保持持续增长以及作为跨地区行业领导者的持续地位,必须时刻保持警惕,以跟上客户需求。
当时间序列数据的频率高于季度或月度时,许多预测程序在分析季节性影响方面遇到了障碍。
每当你发现一个与时间对应的趋势时,你就会看到一个时间序列。
R语言中的偏最小二乘PLS回归算法
通常,当我们在线搜索信息时,有两种主要方法:关键字 – 使用搜索引擎并输入与我们想要查找的内容相关的单词
链接。链接的页面可能共享相似或相关的内容。
加速R语言代码的策略
使用基于分类的递归分区算法来拟合基于树的模型得到的模型类似于推荐的ř包rpart包产生的模型支持分类型树和回归型树。
最近我们被客户要求撰写关于时间序列的研究报告。分析时间序列数据的第一件事就是将其读入R,并绘制时间序列。
这里向您展示如何在R中使用glmnet包进行岭回归(使用L2正则化的线性回归),并使用模拟来演示其相对于普通最小二乘回归的优势。
我们最近有一个很棒的机会与一位伟大的客户合作,要求Business Science构建一个适合他们需求的开源异常检测算法。
R语言中的Wilcoxon符号秩检验与配对学生t检验
最近我们被客户要求撰写关于混合模型的研究报告。由于我们发现自己在工作中越来越多地使用这些模型,我们开发了一套R shiny工具来简化和加速与对象交互的lme4常见任务。
python用遗传算法 神经网络 模糊逻辑控制算法对乐透进行预测
R语言 线性混合效应模型实战案例
聚类分析算法很多,比较经典的有k-means和层次聚类法。
本文的目的是对如何在R中进行生存分析进行简短而全面的评估。
本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响。
“预测非常困难,特别是关于未来”。-丹麦物理学家尼尔斯·波尔(Neils Bohr)
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。
此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性。
可以使用逐步回归过程确定多元逻辑回归。此函数选择模型以最小化AIC。
本文考虑由具有明显频率变化的正弦波组成的非平稳连续信号。
互联网无疑是当今最热门的行业。这个行业高薪资的背后也是大量的加班和激烈的竞争。
豆瓣高分影视数据洞察:热门影视十年演变
高度信息化的今天,社交媒体向我们提供直接认识外界的一个窗口,决定着大家对一个地区的认知,像是一双对地区形象“塑型”的“看不见”的手。
家电产业和消费者升级悄然地展开。 市场的这种变化使消费者对家用电器的期望不再仅仅是一个简单的功能满足,而是更多的细节体验和技术创新。
拓端数据使用数据挖掘技术对海量的在线医院药物复方历史数据进行智能分析,并从中找出药物配伍的规律,帮助客户解决独特的业务问题。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds