R语言文本挖掘:kmeans聚类分析上海玛雅水公园景区五一假期评论词云可视化
互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中
互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中
临床决策(clinical decision making)是医务人员在临床实践过程中,根据国内外医学科研的最新进展,不断提出新方案,与传统方案进行比较后,取其最优者付诸实施,从而提高疾病诊治水平的过程。
随着社会的发展,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。
本文通过分析电子商务平台的用户购物行为,帮助客户构建了一个基于决策树模型的用户购物行为预测分析模型。
指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。
凯恩斯相关理论主要是美国20世纪30年代的经济危机而提出的,主张政府干预经济,实行宏观调控。
WeChat Tencent QQ email print 由Yanlin Li撰写 解决方案 任务/目标 搭
多元时间序列建模一直是吸引了来自经济,金融和交通等各个领域的研究人员的主题。
单位根的随机性趋势与协整关系对实证分析中时间序列的影响是不容小觑的。
新型冠状病毒肺炎COVID-19 给中国乃至全世界都带来了深重的灾难,对世界经济也造成了不可逆的影响。
本文通过建立空载率的数学模型,帮助客户来分析出租车的空载率,从而对出租车补贴政策能否提高高峰期的实载率,缓解打车难问题进行了说明。
假如你有一个购物类的网站,那么你如何给你的客户来推荐产品呢?
2015年以来,通货膨胀越来越成为我国的重要经济现象。
我们一般把一件事情发生,对另一件事情也会产生影响的关系叫做关联。
本文以多因素模型在股票交易中的应用为背景,帮助客户针对Logistic选股模型的理论基础以及模型原理方面分析Logistic选股模型的可行性与稳定性。为保证模型的可靠和稳定,使用过去五年的历史数据来检测模型。
电力系统源源不断向各用户提供持续稳定的电能,本文通过对数据的提取。
stratified cox model是针对协变量不满足PHA提出的,这里的思想是对协变量分层。
支持向量机(SVM)是一种机器学习方法,基于结构风险最小化原则,即通过少量样本数据,得到尽可能多的样本数据。
随着社会经济的快速发展和交通基础设施的不断完善,我国汽车市场也得到了迅速增长。
本文以iris数据和模拟数据为例,帮助客户了比较R语言Kmeans聚类算法、PAM聚类算法、 DBSCAN聚类算法、 AGNES聚类算法、 FDP聚类算法、 PSO粒子群聚类算法在 iris数据结果可视化分析中的优缺点。
GAMLSS模型是一种半参数回归模型,参数性体现在需要对响应变量作参数化分布的假设,非参数性体现在模型中解释变量的函数可以涉及非参数平滑函数,非参数平滑函数不预先设定函数关系,各个解释变量的非线性影响结果完全取决于样本数据。
股指期货的套利交易有助于股指期货实现其价格发现以及风险规避的功能。
我国有大量的资金都流入了房地产行业,同时与其他行业有着千丝万缕的联系,可以说房地产行业对推动我国深化改革、经济发展、工业化和城市化具有不可磨灭的作用。
本文利用R语言的独立成分分析(ICA)、谱聚类(CS)和支持向量回归 SVR 模型帮助客户对商店销量进行预测。
以苏州商品房房价为研究对象,帮助客户建立了灰色预测模型 GM (1,1)、 BP神经网络房价预测模型,利用R语言分别实现了 GM (1,1)和 BP神经网络房价预测可视化。
本项目目标为水泥生产关键生产数据的回归及预测(某一关键温度点的预测)。
本文通过 SQL Server Analysis Services数据挖掘的分析模块,帮助客户对一个职业、地区、餐饮消费水平的数据挖掘,并用可视化分析图表显示数据。
随着大数据概念的兴起,以数据为基础的商业模式越来越流行,用所收集到的因素去预测用户的可能产生的行为,并根据预测做出相应反应成为商业竞争的核心要素之一。
WeChat Tencent QQ email print 由Kaizong Ye,Sherry Deng撰写
为解决城市交通拥堵问题,本文提出了一种基于 Matlab决策树的交通预测方法
>随着大学的普及教育,大学生就业形势变得更加困难,很多学生都意识到这个问题。
投资者最关心的两个问题就是收益率和股息,两者作为公司经营状况的两个重要方面,往往同时出现在投资报告中,二者之间具有较强的关联性。
近几年来,各家商业银行陆续推出多种贷款业务,如何识别贷款违约因素已经成为各家商业银行健康有序发展贷款业务的关键。
Copula方法是测度金融市场间尾部相关性比较有效的方法,而且可用于研究非正态、非线性以及尾部非对称等较复杂的相依特征关系。
随着金融市场全球化的发展,金融产品逐渐受到越来越多的关注,而金融产品的风险度量成为投资者最关心的问题。
情感分析,就是根据一段文本,分析其表达情感的技术。
最近,有一种说法:“中国经济发展的命脉就是石油和航线”。因此,航线的重要性不言而喻。
网络购物模式已成为越来越重要的产品销售模式,亚马逊网站早在1995年就开始邀请产品消费者发表在线评论,此举带来了良好的效果,目前几乎所有的网站都采用了同样的方式。
随着天气预报技术的发展,数值预报产品日益丰富,预报方法多种多样。
基于当前统计的股票数据选择最优的选股方案和投资组合方案,以及预测股票价格未来一段时间的走向趋势以及波动程度,具有很大的实用价值
借着二胎政策的开放与家庭消费升级的东风,母婴市场迎来了生机盎然的春天,尤其是母婴电商行业,近年来发展迅猛。
普通的模型对于两个序列的波动分析一般是静态的,但是dcc-garch模型可以实现他们之间动态相关的波动分析
我们最近有一个很棒的机会与一位伟大的客户合作,要求构建一个适合他们需求的持向量机回归模型。
Google Trends, 即谷歌趋势。
WeChat Tencent QQ email print 由Kaizong Ye,Liao Bao撰写 谷歌
以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等 8 个指标数据为依据
在网络技术高速发展的背景下,信息纷乱繁杂,如何能够获得需要的文本信息,成了许多企业或组织关注的问题。
本课题着眼于谱聚类在社会化推荐挖掘中的应用研究。
我国以前一直以来都是世界上大豆生产的第一大国。
机器学习在环境监测领域的应用,着眼于探索全球范围内的环境演化规律,人类与自然生态之间的关系以及环境变化对人类生存的影响。
我们围绕进化树技术进行一些咨询,分析生物类群在时间上的多样性是如何变化的。
CT技术伴随着一定剂量的辐射,会对患者的身体健康造成影响,而且 高剂量的辐射会损害人体的遗传物质,甚至造成不可逆的损伤,进而诱发癌症。
目前主流的轻量化路面平整度检测技术方案为:使用车载加速度传感器采集车辆在路面上行驶时的竖向振动数据,并按照每100米计算竖向振动数据统计指标:均方根值RMS,并建立RMS与路面平整度指标:IRI之间的回归模型。
随着互联网的普及和移动端的应用的飞速发展,消费者在各大电商平台进行活动交易时产生了大量的行为数据,在线评论文本就是其中一种。
摘要:此报告首先将dataset进行数据清洗,得到dataset_new。
As I first came to the University, I found SAT scores for my friends at Oxford are among 1450.
本文做SV模型,选取马尔可夫蒙特卡罗法(MCMC)、正则化广义矩估计法和准最大似然估计法估计。
对于电力公司来说,对局部放电的准确预测可以显著降低人力物力成本。
让个人购买人员了解美国国债期货的特性,以便于进行个人投资及管理。
作为衡量通货膨胀的基本指标,消费者价格指数CPI和生产者价格指数PPI的作用关系与传导机制一直是宏观经济研究的核心问题。
我们和一位客户讨论过如何在R软件中实现稀疏主成分分析。
最近,在贝叶斯统计实验中,我们向客户演示了用R的朴素贝叶斯分类器可以提供的内容。
我们最近有一个很棒的机会与一位伟大的客户合作,要求构建一个耐克微博聚类算法。本文利用R语言完成对微博相应分析。
我们曾经为一位客户进行了短暂的咨询工作,他正在构建一个主要基于安卓包分类的分析应用程序。
我们和一位客户讨论如何在R软件中处理GARCH族模型。
Box-Behnken设计的优良在于,可以将其应用于分析2至5个因子的实验。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds