Category Archives: 大数据部落

R语言Kmeans均值聚类、PAM、DBSCAN、AGNES、FDP、PSO粒子群聚类分析iris数据结果可视化比较

本文以iris数据和模拟数据为例,帮助客户了比较R语言Kmeans聚类算法、PAM聚类算法、 DBSCAN聚类算法、 AGNES聚类算法、 FDP聚类算法、 PSO粒子群聚类算法在 iris数据结果可视化分析中的优缺点。

R语言无套利区间模型期货期现研究:正向套利和反向套利次数、收益率分析华泰柏瑞300ETF可视化

股指期货的套利交易有助于股指期货实现其价格发现以及风险规避的功能。

Python互联网大数据爬虫的武汉市二手房价格数据采集分析:Linear Regression模型、XGBoost模型和LightGBM模型

我国有大量的资金都流入了房地产行业,同时与其他行业有着千丝万缕的联系,可以说房地产行业对推动我国深化改革、经济发展、工业化和城市化具有不可磨灭的作用。

R语言独立成分分析fastICA、谱聚类、支持向量回归SVR模型预测商店销量时间序列可视化

本文利用R语言的独立成分分析(ICA)、谱聚类(CS)和支持向量回归 SVR 模型帮助客户对商店销量进行预测。

SQL Server Analysis Services数据挖掘聚类分析职业、地区、餐饮消费水平数据

本文通过 SQL Server Analysis Services数据挖掘的分析模块,帮助客户对一个职业、地区、餐饮消费水平的数据挖掘,并用可视化分析图表显示数据。

Python对中国电信消费者特征预测:随机森林、朴素贝叶斯、神经网络、最近邻分类knn、逻辑回归、支持向量回归(SVR)

随着大数据概念的兴起,以数据为基础的商业模式越来越流行,用所收集到的因素去预测用户的可能产生的行为,并根据预测做出相应反应成为商业竞争的核心要素之一。

R语言两阶段最小二乘法2SLS回归、工具变量法分析股息收益、股权溢价和surfaces曲面图可视化

投资者最关心的两个问题就是收益率和股息,两者作为公司经营状况的两个重要方面,往往同时出现在投资报告中,二者之间具有较强的关联性。

R语言地理可视化:中国国内航线航班信息统计、绘制分布夜景图

最近,有一种说法:“中国经济发展的命脉就是石油和航线”。因此,航线的重要性不言而喻。

python基于评论情感分析和回归、arima销量预测的购物网站选品

网络购物模式已成为越来越重要的产品销售模式,亚马逊网站早在1995年就开始邀请产品消费者发表在线评论,此举带来了良好的效果,目前几乎所有的网站都采用了同样的方式。

Python、MATLAB股票投资:ARIMA模型最优的选股方案和投资组合方案与预测

基于当前统计的股票数据选择最优的选股方案和投资组合方案,以及预测股票价格未来一段时间的走向趋势以及波动程度,具有很大的实用价值

R语言CART决策树、随机森林、chaid树预测母婴电商平台用户寿命、流失可视化

借着二胎政策的开放与家庭消费升级的东风,母婴市场迎来了生机盎然的春天,尤其是母婴电商行业,近年来发展迅猛。

R语言SVR支持向量机多元回归、网格搜索超参数优化预测猪粮比价格变动率数据

我们最近有一个很棒的机会与一位伟大的客户合作,要求构建一个适合他们需求的持向量机回归模型。

R语言、SPSS基于主成分分析PCA的中国城镇居民消费结构研究可视化分析

以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等 8 个指标数据为依据

R语言PCA主成分、lasso、岭回归降维分析全球气候变化对各国土地面积影响

机器学习在环境监测领域的应用,着眼于探索全球范围内的环境演化规律,人类与自然生态之间的关系以及环境变化对人类生存的影响。

MATLAB基于深度学习U-net神经网络模型的能谱CT的基物质分解技术研究

CT技术伴随着一定剂量的辐射,会对患者的身体健康造成影响,而且 高剂量的辐射会损害人体的遗传物质,甚至造成不可逆的损伤,进而诱发癌症。

Python路面平整度检测车辆数据——速度修正

目前主流的轻量化路面平整度检测技术方案为:使用车载加速度传感器采集车辆在路面上行驶时的竖向振动数据,并按照每100米计算竖向振动数据统计指标:均方根值RMS,并建立RMS与路面平整度指标:IRI之间的回归模型。

Python酒店评论文本数据分析:tf-idf、贝叶斯、逻辑回归,支持向量机SVM、K最邻近算法KNN、随机森林、LDA主题模型

随着互联网的普及和移动端的应用的飞速发展,消费者在各大电商平台进行活动交易时产生了大量的行为数据,在线评论文本就是其中一种。

R语言随机波动模型SV:马尔可夫蒙特卡罗法MCMC、正则化广义矩估计GMM和准最大似然估计QMLE上证指数收益时间序列

本文做SV模型,选取马尔可夫蒙特卡罗法(MCMC)、正则化广义矩估计法和准最大似然估计法估计。

R语言EG(Engle-Granger)两步法协整检验、RESET、格兰杰因果检验、VAR模型分析消费者价格指数CPI和生产者价格指数PPI时间序列关系

作为衡量通货膨胀的基本指标,消费者价格指数CPI和生产者价格指数PPI的作用关系与传导机制一直是宏观经济研究的核心问题。

R语言对耐克Nikeid新浪微博数据k均值(k-means)聚类文本挖掘和词云可视化

我们最近有一个很棒的机会与一位伟大的客户合作,要求构建一个耐克微博聚类算法。本文利用R语言完成对微博相应分析。

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498

关注有关新文章的微信公众号


永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。

技术干货

最新洞察

This will close in 0 seconds