R语言、WEKA关联规则、决策树、聚类、回归分析工业企业创新情况影响因素数据
为了解某市规模以上工业企业创新情况,对该市企业的创新活动进行调查,分别得出三组数据testl(企业财务情况
为了解某市规模以上工业企业创新情况,对该市企业的创新活动进行调查,分别得出三组数据testl(企业财务情况
通过对某移动通信公司客户的流失数据分析,了解客户流失规律,建立流失预警系统,为客户关系管理服务。
SPSS modeler用关联规则Apriori模型对笔记本电脑购买事务销量研究
泊松分布是概率论中最重要的分布之一,在历史上泊松分布是由法国数学家泊松引人的。
金融市场的波动性一直是投资者和决策者关注的焦点之一。
本次调查旨在了解文汇路咖啡店的市场状况,以便为学校周边咖啡店的经营发展提供积极的引导意义。
客户流失是一个存在于各个行业的严重问题,这一问题也同样受到众多电信服务提供商的关注——因为获得一个新客户的成本远远超过保留一个老客户的成本。
逻辑回归具有适合于解决复杂的非线性问题的特点,因此,在这里根据鲍鱼的多个生理特征,如性别、重量、直径等信息,采用逻辑回归的方法,对鲍鱼的年龄进行分类预测,以满足商家对鲍鱼的分类。
大数据时代的来临,为创新资助工作方式提供了新的理念和技术支持,也为高校利用大数据推进快速、便捷、高效精准资助工作带来了新的机遇。
上海市近年来不断增长的高峰出行车辆数,带来了交通负荷严重等城市问题,本项目主要探究开放封闭式小区能否实现对道路交通状况的改善。
这些包括用于将多态模型拟合为面板数据的msm和SemiMarkov,用于生存分析应用的mstate,用于估计3状态进行性疾病模型的转移概率的TPmsm,用于将马尔科夫模型应用于健康护理经济应用的hemod,用于拟合隐马尔可夫模型和mcmc与蒙特Carlo马尔科夫链使用。
蒙特卡罗方法的常见用途是对可能难以通过解析积分的函数执行数值积分。
WeChat Tencent QQ email print 由Kaizong Ye,Liao Bao撰写 例如
如何精准定位目标客户,准确量化客户需求来开发新的产品组合,并预测其可能的市场份额。
数据显示2019年全国城镇私营单位就业人员年平均工资为53604元,比上年增长8.1%。
信用风险建模是金融领域的重要课题,通过建立合理的信用风险模型,可以帮助金融机构更好地评估借款人的信用状况,从而有效降低信贷风险。
是什么让一个电影受欢迎? 也许是影片的总收入(影院条目和DVD sellings)。
本文以R语言为工具,帮助客户对汽车网站的口碑数据进行抓取,并基于文本数据分词技术进行数据清理和统计。
数据变得越来越重要,其核心应用“预测”也成为各个行业以及产业变革的重要力量。
离职率是企业保留人才能力的体现。分析预测职员是否有离职趋向有利于企业的人才管理,提升组织职员的心理健康,从而更有利于企业未来的发展。
本文使用R语言进行了贝叶斯模型预测电影评分,并对数据进行了可视化和分析。
这是一种拟合稀疏广义加性模型(GAM)的新方法。
科学技术的发展为各个领域都带来了深刻的变革,在生物学领域,随着计算机的应用,生物学与信息学的结合诞生了一门新的融合学科——生物信息学。
PLS,即偏最小二乘(Partial Least Squares),是一种广泛使用的回归技术,用于帮助客户分析近红外光谱数据。
众自20世纪80年代至今,随着改革开放的深入以及中国最终加入WTO,我国的对外贸易实现了跨越式的发展,中国已经成为世界第一大出口国和第二大进口国,中国经济对世界经济做出了重大贡献。
COVID-19对航空网络的拓扑结构和属性都有很大的影响,其影响的结果表现在网络鲁棒性、连通性和活动性的下降,以及疫情区域的航空网络状态的变化。
本文通过利用回归模型帮助客户对电影的票房数据(以及放映场数,观影人数)进行了研究,确定了决定电影的票房的重要因素。
作为中国古典文学的瑰宝,《红楼梦》具有极高的文学价值和丰富的主题内涵。
数据挖掘和分析的最核心也最重要的问题就是“预测”。
如何处理庞大的数据集,并对数据进行可视化展示。
在农业科学领域,对糯稻品种的研究一直备受关注。
关联规则挖掘作为数据挖掘的一个重要分支,对于发现数据之间的潜在关联和规律具有重要意义。
比较多种机器学习方法优劣性,分析二手车价格影响因素,训练模型预测二手车价格。
集成电路板等电子产品生产中,控制回焊炉各部分保持工艺要求的温度对产品质量至关重要。
本文使用Matlab编程语言中的决策树和模糊C-均值聚类算法,帮助客户对大学教师职称、学历与评分之间的关系进行深入分析。
近年来,环境污染问题已经成为全球性的关注焦点。
虽然中国股票市场日益完善,但还不完全是弱有效市场,因此中国股票市场存在比较明显的通过技术分析达到的套利机会。
追求信贷规模的扩张,往往会导致贷款逾期率的不断增加,如何在当今社会运用数据识别用户特征进行风险管控成为了银行放贷的重点依据。
在常规的马尔可夫链模型中,我们通常感兴趣的是找到一个平衡分布。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
KNN是一种非参数学习算法,这意味着它不会对底层数据做出任何假设。
这篇文章展示了自激励阈值自回归SETAR的使用,用于分析经常被客户研究的太阳黑子数据集。
WeChat Tencent QQ email print 由Kaizong Ye,Sherry Deng撰写
面板数据回归可以缓解省略变量偏误的问题,特别是当没有既与感兴趣的回归变量相关又与依赖变量相关的变量信息时,并且这些变量在时间或实体维度上是恒定的。
“失业”是 Covid-19 疫情的许多负面影响之一,几乎每个国家都受到了影响
传统时间序列模型允许包含过去观察到的系列信息,但不允许客户包含其他可能相关的信息。
混合模型是另一种生成模型,它将数据点的分布建模为多个单独分布的组合(”混合”)。
随机波动模型(Stochastic volatility models)经常被客户用来对股票价格随时间的变动性进行建模。
在这篇文章中,我将尝试介绍从简单的线性回归到使用神经网络构建非线性概率模型的步骤。
我们使用广义线性模型(Generalized Linear Models,简称GLM)来研究客户的非正态数据,并探索非线性关系。
众所周知,心脏疾病是目前全球最主要的死因。
在选择最佳拟合实验数据的方程时,可能需要一些经验。当我们没有文献信息时该怎么办?
点模式分析(点格局分析)是一组用于分析空间点数据的技术。
行为风险因素监测系统(BRFSS)是一项年度电话调查。
机器学习模型的表现不佳通常是由于过度拟合或欠拟合引起的,我们将重点关注客户经常遇到的过拟合情况。
Reaven和Miller(1979)研究了145名非肥胖成年人的葡萄糖耐量和胰岛素血液化学指标之间的关系。
生成对抗网络(GAN)是一种神经网络,可以生成类似于人类产生的材料,如图像、音乐、语音或文本。
尽管贝叶斯方法相对于频率主义方法的理论优势已经在其他地方进行了详细讨论,但其更广泛采用的主要障碍是“可用性”。
在这里,我们将帮助客户将 PyMC3 用于两个贝叶斯推理案例研究:抛硬币和保险索赔发生。
金融市场的股票价格时间序列分析一直以来都是投资者和研究者关注的主题之一。
随着全球经济的不断发展,污染物的排放和环境污染问题日益严重。
超市业已成为商业领域最具活力的商业业态,竞争也变得日益激烈。
自行车共享系统是新一代的传统自行车租赁,从会员,租赁到归还的整个过程已经自动化。
The NHEFS survey was designed to investigate the relationships between clinical
Let X1 and X2 constitute a random sample of size 2 from the population given by
本文通过利用回归模型对天猫商品流行度进行了研究,确定了决定天猫商品流行度的重要因素。
本文通过利用回归模型对电影的票房(以及放映场数,观影人数)进行了研究,确定了决定电影的票房的重要因素。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds