R语言混合SVD模型IBCF协同过滤推荐算法研究——以母婴购物平台为例
随着用户数量和项目数量的增加,数据的稀疏性成为影响推荐质量的重要因素。对此,本文帮助客户提出了一种基于混合SVD矩阵填充技术的协同过滤算法。
随着用户数量和项目数量的增加,数据的稀疏性成为影响推荐质量的重要因素。对此,本文帮助客户提出了一种基于混合SVD矩阵填充技术的协同过滤算法。
本课题着眼于谱聚类在社会化推荐挖掘中的应用研究。
对于电力公司来说,对局部放电的准确预测可以显著降低人力物力成本。
纪录片能够真实、详尽地反映一个地区的风貌,展示经济发展和社会进步。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
在之前的文章中,我们研究了许多使用 多输出回归分析的方法。
. 您想知道它是否与(例如)零显着不同。一般来说,人们会查看他们选择的软件报告的统计数据或 p.value。问题是,这个 p.value 计算依赖于因变量的分布。如果没有不同的说明,您的软件假定为正态分布,那是怎么回事?
我们围绕Lasso技术进行一些咨询,帮助客户解决独特的业务问题。使用各种方法从指数分布生成 200 个五维数据 X 样本。
通过训练具有小中心层的多层神经网络重构高维输入向量,可以将高维数据转换为低维代码。
分类树的一个常见用途是预测抵押贷款申请人是否会拖欠贷款。
世界卫生组织估计全世界每年有 1200 万人死于心脏病。
谱聚类是一种将数据的相似矩阵的谱应用于降维的技术。
WeChat Tencent QQ email print 由Kaizong Ye,Coin Ge撰写 使用l
有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。
WeChat Tencent QQ email print 由Kaizong Ye,Weilong Zhang
我们在心理学网络论文中看到的一个问题是,作者有时会对其数据的可视化进行过度解释。
最近,copula 在仿真模型中变得流行起来。
本文通过一些指数对散点图矩阵和平行坐标显示中的面板进行排序,并根据其数值水平对面板进行着色。
Boosting指的是机器学习元算法系列,它将许多 “弱 “分类器的输出合并成一个强大的 “集合”,其中每个弱分类器单独的错误率可能只比随机猜测好一点。
在这篇文章中,我们讨论了基于gensim 包来可视化主题模型 (LDA) 的输出和结果的技术 。
本文介绍简化模型构建和评估过程。
Boosting 是一类集成机器学习算法,涉及结合许多弱学习器的预测。
本教程使用R介绍了具有非信息先验的贝叶斯 GLM(广义线性模型)。
《世界幸福报告》是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。
在这篇文章中,我将集中讨论一个给定一个短数据序列的推断概率的例子。
什么是PCR?(PCR = PCA + MLR)
特别是在经济学/计量经济学中,建模者不相信他们的模型能反映现实。
铁和泛酸的极好来源,是澳大利亚、美国和东亚的营养食品资源和农业。100 克鲍鱼可提供超过 20% 的每日推荐摄入量。鲍鱼的经济价值与其年龄呈正相关。因此,准确检测鲍鱼的年龄对于养殖者和消费者确定其价格非常重要。
此示例说明如何使用逻辑回归模型进行贝叶斯推断。
最近我们被客户要求撰写关于抗哮喘药物茶碱动力学研究的报告。茶碱数据文件报告来自抗哮喘药物茶碱动力学研究。
此示例基于电视节目的在线收视率。我们将从抓取数据开始。
本文的目标是使用各种预测模型预测Google的未来股价,然后分析各种模型。
T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。
最近我们被客户要求撰写关于谷歌Google Analytics分析的研究报告。在等距时间段内以一系列点获得的数据通常称为时间序列数据。
关联规则学习 在机器学习中用于发现变量之间的有趣关系。
时间序列是以固定时间_区间_记录的观察序列。
本文描述了训练支持向量回归模型的过程,该模型用于预测基于几个天气变量、一天中的某个小时、以及这一天是周末/假日/在家工作日还是普通工作日的用电量。
递归神经网络被用来分析序列数据。
可以使用环状图形展示基因数据比较。可以添加多种图展信息,如热图、散点图等。
决策树是对例子进行分类的一种简单表示。
我们使用R中的igraph包,产生了网络的图形。
最近我们被客户要求撰写关于有限正态混合模型在r软件中的实现的研究报告,用于基于模型的聚类、分类和密度估计。
在最近的一篇文章中,我们展示了一个LSTM模型,通过假近邻(FNN)损失进行正则化,可以用来重建一个非线性动态系统。
最近我们被客户要求撰写关于线性混合效应模型的研究报告,包括一些图形和统计输出。线性混合效应模型与我们已经知道的线性模型有什么不同?
在这篇文章中,我们将回顾三种提高循环神经网络的性能和泛化能力的高级方法。
我们可以很容易地用Keras序列模型拟合回归数据并预测测试数据。
本文讨论用ARIMA模型进行预测。考虑一些简单的平稳的AR(1)模拟时间序列
扩散的意思是过程可以包含布朗运动的成份,甚至写成布朗运动的积分形式。同时,这样的过程可以包含跳跃。
肝脏病在早期可能没有任何症状,不容易被察觉,或者症状是模糊的。肝脏病的症状和肝脏病的类型和程度高度相关,肝脏病的一般是通过肝功能测试诊断。
项目背景:银行的主要盈利业务靠的是贷款,这些客户中的大多数是存款大小不等的责任客户(存款人)。
我们在研究工作中使用广义加性模型(GAMs)。mgcv软件包是一套优秀的软件,可以为非常大的数据集指定、拟合和可视化GAMs。
WeChat Tencent QQ email print 由Enzo Li撰写 开发一个预测模型,根据一
本文回答了关于逻辑回归的问题:它与线性回归有什么不同,如何在R中用glm()函数拟合和评估这些模型等等?
本文中我们用(非)线性混合模型分析藻类数据。这个问题的参数是:已知截距(0日值)在各组和样本之间是相同的。
某制药公司每年要花费大量的资金在电费上,由于电力公司的业务改革,该药企可以在一年或月开始时向电力公司预购一定数量的电力,如果实际消耗大于该值,则每多消耗一度电要付比以前更多的电费,如果实际上没有消耗这么多,也不会退还多余的电费,因此该公司打算预测未来的电力消耗以节省资金消耗。
在本文中,我们将使用基因表达数据。这个数据集包含120个样本的200个基因的基因表达数据。
在许多网站上都可以找到一个流行的德国信贷数据集_german_credit_,其中包含了银行贷款申请人的信息。
有些问题是线性的,但有些问题是非线性的。
本文将谈论Stan以及如何在R中使用rstan创建Stan模型。
回归数据可以用Keras深度学习API轻松拟合。
标准化发病率(SIR)或死亡率(SMR)是观察病例和期望病例的比率。
在频率学派中,观察样本是随机的,而参数是固定的、未知的数量。
在本文中,我们将学习如何使用keras,用手写数字图像数据集(即MNIST)进行深度学习。
回归算法最小角回归(LARS)通过高维数据的线性组合提供变量。
本文与以下两个问题有关。你应该如何在回归中添加虚拟变量?你应该如何解释结果?
这个例子展示了如何使用深度学习长短期记忆(LSTM)网络对文本数据进行分类。
这个例子展示了如何用Matlab实现贝叶斯优化,使用分位数误差调整回归树随机森林的超参数。
这个数据集可以追溯到1988年,由四个数据库组成。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds