R语言改进关联规则挖掘Apriori在超市销售数据可视化
超市业已成为商业领域最具活力的商业业态,竞争也变得日益激烈。
超市业已成为商业领域最具活力的商业业态,竞争也变得日益激烈。
证券及其它风险资产的投资首先需要解决的是两个核心问题:即预期收益与风险。
在现代组织管理中,员工的满意度对于组织的运行和绩效起着至关重要的作用。
员工满意度对于组织绩效和竞争力具有重要影响,因此准确了解员工满意度的影响因素和有效管理成为管理者的关键任务。
本文用逻辑回归和lasso算法医学上的疾病的相关因素,帮助客户确定哪种模型可用于某种疾病的相关因素分析。
气候变化和空气污染对现代社会产生了越来越大的影响。
随着经济的快速发展和城市化进程的不断推进,土地资源的利用和管理成为了一项极为重要的任务。
股票市场波动性模型一直是金融领域研究的热点之一。
近年来电子商务发展迅速,随之而来的信用问题给消费者带来诸多困扰,造成电子商务网上各种交易问题产生的原因是多方面的,但总的来说是缺乏有效的信用评价体系。
本文的研究目的是基于R语言的k-prototype算法,帮助客户对新能源汽车行业上市公司进行混合型数据集的聚类分析。
WeChat Tencent QQ email print 由Kaizong Ye,Liao Bao撰写 航班
随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。
在金融市场中,债券的流动性风险一直是一个备受关注的问题。
WeChat Tencent QQ email print 由Li Yu撰写 进而起到降维的目的,还可检验变量
研究黄金价格的动态演变过程至关重要。
肿瘤是近年来严重威胁人类的健康的疾病,据统计,目前大部分种类的肿瘤都呈现不同程度的上升趋势,中国因患肿瘤而死亡的人数约占全球肿瘤死亡总人数的1/4左右,人类正面临着肿瘤防治的新挑战。
物流发货明细数据在现代物流业中扮演着至关重要的角色。
在当今信息爆炸的时代,电影作为人们生活中不可或缺的娱乐方式,受到了越来越多的关注。
聚类分析是一种常见的数据挖掘方法,已经广泛地应用在模式识别、图像处理分析、地理研究以及市场需求分析。
时间序列模型的理论已经非常丰富,模型的应用也相当广泛。 WeChat Tencent QQ email pri
人口流动与迁移,作为人类产生以来就存在的一种社会现象,伴随着人类文明的不断进步从未间断。
大量数据中具有”相似”特征的数据点或样本划分为一个类别。
分类是把某个对象划分到某个具体的已经定义的类别当中,而聚类是把一些对象按照具体特征组织到若干个类别里。
本文深入分析了国内外关于股权结构与公司绩效的影响因素
我们常说的中药挖掘,一般是用药挖掘,还有穴位的挖掘,主要是想找出一些用药的规律。
互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中
临床决策(clinical decision making)是医务人员在临床实践过程中,根据国内外医学科研的最新进展,不断提出新方案,与传统方案进行比较后,取其最优者付诸实施,从而提高疾病诊治水平的过程。
随着社会的发展,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。
本文通过分析电子商务平台的用户购物行为,帮助客户构建了一个基于决策树模型的用户购物行为预测分析模型。
多元时间序列建模一直是吸引了来自经济,金融和交通等各个领域的研究人员的主题。
单位根的随机性趋势与协整关系对实证分析中时间序列的影响是不容小觑的。
新型冠状病毒肺炎COVID-19 给中国乃至全世界都带来了深重的灾难,对世界经济也造成了不可逆的影响。
本文通过建立空载率的数学模型,帮助客户来分析出租车的空载率,从而对出租车补贴政策能否提高高峰期的实载率,缓解打车难问题进行了说明。
2015年以来,通货膨胀越来越成为我国的重要经济现象。
我们一般把一件事情发生,对另一件事情也会产生影响的关系叫做关联。
本文以多因素模型在股票交易中的应用为背景,帮助客户针对Logistic选股模型的理论基础以及模型原理方面分析Logistic选股模型的可行性与稳定性。为保证模型的可靠和稳定,使用过去五年的历史数据来检测模型。
电力系统源源不断向各用户提供持续稳定的电能,本文通过对数据的提取。
支持向量机(SVM)是一种机器学习方法,基于结构风险最小化原则,即通过少量样本数据,得到尽可能多的样本数据。
本文以iris数据和模拟数据为例,帮助客户了比较R语言Kmeans聚类算法、PAM聚类算法、 DBSCAN聚类算法、 AGNES聚类算法、 FDP聚类算法、 PSO粒子群聚类算法在 iris数据结果可视化分析中的优缺点。
GAMLSS模型是一种半参数回归模型,参数性体现在需要对响应变量作参数化分布的假设,非参数性体现在模型中解释变量的函数可以涉及非参数平滑函数,非参数平滑函数不预先设定函数关系,各个解释变量的非线性影响结果完全取决于样本数据。
股指期货的套利交易有助于股指期货实现其价格发现以及风险规避的功能。
我国有大量的资金都流入了房地产行业,同时与其他行业有着千丝万缕的联系,可以说房地产行业对推动我国深化改革、经济发展、工业化和城市化具有不可磨灭的作用。
本文利用R语言的独立成分分析(ICA)、谱聚类(CS)和支持向量回归 SVR 模型帮助客户对商店销量进行预测。
以苏州商品房房价为研究对象,帮助客户建立了灰色预测模型 GM (1,1)、 BP神经网络房价预测模型,利用R语言分别实现了 GM (1,1)和 BP神经网络房价预测可视化。
WeChat Tencent QQ email print 由Kaizong Ye,Sherry Deng撰写
为解决城市交通拥堵问题,本文提出了一种基于 Matlab决策树的交通预测方法
>随着大学的普及教育,大学生就业形势变得更加困难,很多学生都意识到这个问题。
投资者最关心的两个问题就是收益率和股息,两者作为公司经营状况的两个重要方面,往往同时出现在投资报告中,二者之间具有较强的关联性。
Copula方法是测度金融市场间尾部相关性比较有效的方法,而且可用于研究非正态、非线性以及尾部非对称等较复杂的相依特征关系。
随着金融市场全球化的发展,金融产品逐渐受到越来越多的关注,而金融产品的风险度量成为投资者最关心的问题。
情感分析,就是根据一段文本,分析其表达情感的技术。
最近,有一种说法:“中国经济发展的命脉就是石油和航线”。因此,航线的重要性不言而喻。
网络购物模式已成为越来越重要的产品销售模式,亚马逊网站早在1995年就开始邀请产品消费者发表在线评论,此举带来了良好的效果,目前几乎所有的网站都采用了同样的方式。
借着二胎政策的开放与家庭消费升级的东风,母婴市场迎来了生机盎然的春天,尤其是母婴电商行业,近年来发展迅猛。
普通的模型对于两个序列的波动分析一般是静态的,但是dcc-garch模型可以实现他们之间动态相关的波动分析
以全国31个省、市、自治区的城镇居民家庭平均每人全年消费性支出的食品、衣着、居住、家庭设备用品及服务、医疗保健、交通与通讯、娱乐教育文化服务、其它商品和服务等 8 个指标数据为依据
在网络技术高速发展的背景下,信息纷乱繁杂,如何能够获得需要的文本信息,成了许多企业或组织关注的问题。
本课题着眼于谱聚类在社会化推荐挖掘中的应用研究。
我国以前一直以来都是世界上大豆生产的第一大国。
机器学习在环境监测领域的应用,着眼于探索全球范围内的环境演化规律,人类与自然生态之间的关系以及环境变化对人类生存的影响。
CT技术伴随着一定剂量的辐射,会对患者的身体健康造成影响,而且 高剂量的辐射会损害人体的遗传物质,甚至造成不可逆的损伤,进而诱发癌症。
目前主流的轻量化路面平整度检测技术方案为:使用车载加速度传感器采集车辆在路面上行驶时的竖向振动数据,并按照每100米计算竖向振动数据统计指标:均方根值RMS,并建立RMS与路面平整度指标:IRI之间的回归模型。
随着互联网的普及和移动端的应用的飞速发展,消费者在各大电商平台进行活动交易时产生了大量的行为数据,在线评论文本就是其中一种。
本文做SV模型,选取马尔可夫蒙特卡罗法(MCMC)、正则化广义矩估计法和准最大似然估计法估计。
对于电力公司来说,对局部放电的准确预测可以显著降低人力物力成本。
作为衡量通货膨胀的基本指标,消费者价格指数CPI和生产者价格指数PPI的作用关系与传导机制一直是宏观经济研究的核心问题。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds