R语言公交地铁路线进出站数据挖掘网络图可视化
对于庞大的公交地铁路线信息的数据挖掘,一般软件遇到的问题主要有两点:1.对于文本信息的挖掘,特别是中文词汇的挖掘,缺乏成熟的工具或者软件包,2.对于大数据量,一般软件的读取和处理会遇到问题。
对于庞大的公交地铁路线信息的数据挖掘,一般软件遇到的问题主要有两点:1.对于文本信息的挖掘,特别是中文词汇的挖掘,缺乏成熟的工具或者软件包,2.对于大数据量,一般软件的读取和处理会遇到问题。
这个例子说明了一个函数拟合的神经网络如何根据测量结果来估计脂肪百分比。
关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。
贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯。
虽然我对高频噪音中出现信号的有效性有一些怀疑,但我还是决定使用GARCH模型研究一下收益率的统计模型。与每日和较低频率的收益不同,日内高频数据有某些特殊的特点,使得使用标准的建模方法是无效的。
就香水市场份额而言,亚洲占全球销售额的8%,仅占拉丁美洲的20%,而中国仅占全球销售额的0.8%。
本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究?
新零售,顾名思义,就是与 传统零售 完全不同的,一种新的零售模式。
在大数据的趋势下,我们经常需要做预测性分析来帮助我们做决定。
标准的ARIMA(移动平均自回归模型)模型允许只根据预测变量的过去值进行预测。
最近我们被客户要求撰写关于混合效应逻辑回归的研究报告。
最近我们被客户要求撰写关于心脏病数据的研究报告。在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量)。
线性回归时若数据不服从正态分布,会给线性回归的最小二乘估计系数的结果带来误差,所以需要对数据进行结构化转换。
本文考虑一下基于核方法进行分类预测。注意,在这里,我们不使用标准逻辑回归,它是参数模型。
本文将介绍如何在R中做贝叶斯回归分析,R中有不少包可以用来做贝叶斯回归分析,比如最早的(同时也是参考文献和例子最多的)R2WinBUGS包。
这是我们最近的一项护士职业满意度线上调查中关注的一个问题。遗憾的是,对护士工作满意的只有约27%。为何这么多人不愿意再次选择做护士?
最近我们被客户要求撰写关于预测销量时间序列的研究报告。指数平滑模型是基于对数据趋势和季节性的描述,而ARIMA模型则是为了描述数据的自相关性。
本文演示了在时间序列分析中应用分布滞后线性和非线性模型(DLMs和DLNMs)。
环境科学中的许多数据不适合简单的线性模型,最好用广义相加模型(GAM)来描述。<
本文使用lasso或非凸惩罚拟合线性回归,GLM和Cox回归模型的正则化
人工神经网络最初是由研究人员开发的,他们试图模仿人脑的神经生理学。
2019年,全球八个主要国家的18岁以上男女共诊断出72,164例急性髓细胞白血病(AML)。
本文将说明单变量和多变量金融时间序列的不同模型,特别是条件均值和条件协方差矩阵、波动率的模型。
在移动广告领域,移动APP广告因其独特的价值而受到广告商的青睐。
本示例说明如何使用长短期记忆(LSTM)网络对序列数据进行分类。
最近我们被客户要求撰写关于ARMA-GARCH模型的研究报告。工业指数(DIJA)的价值基于每个组成公司的每股股票价格之和。
随着新型冠状病毒COVID-19的威胁遍及世界,我们生活在一个日益担忧的时代,本文用matlab分析COVID-19数据集。
最近我们被客户要求撰写关于分析高频金融数据波动率的研究报告。在学术界和金融界,分析高频财务数据的经济价值现在显而易见。
最新研究表明,中国有超过7亿人在观看在线视频内容。
用于动量策略中所谓的动量(Momentum),是指某一对象所具有的一种倾向于保持其原有属性或特征的性质,也可以简单理解成一种惰性(Inertia)。
本文想在R软件中更好地了解分位数回归优化。在查看分位数回归之前,让我们从样本中计算中位数或分位数。
在国内疫情稳定的新常态下,“双十一”点燃了消费者的购物热情,在购物热潮中,消费热点、消费者理念与行为将出现哪些变化?
当我们将CNN(卷积神经网络)模型用于训练多维类型的数据(例如图像)时,它们非常有用。
根据我们对温度的预测,我们可以预测电力消耗。
利率衍生证券的定价依赖于描述基本过程的模型。这些利率模型取决于您必须通过将模型预测与市场上可用的现有数据进行匹配来确定的一个或多个参数。
在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。
在数据科学学习之旅中,我经常处理日常工作中的时间序列数据集,并据此做出预测。
随着现代社会的进步,以男权为主的传统观念正在被颠覆,女性意识逐渐觉醒,并付诸行动,不遗余力地寻求真正的性别平等。
当前是大数据盛行的时代,各种用户信息行为数据分析的结果影响着人们的生活和学习,同时对图书馆的发展也有着影响。
从这个XML文件中,我想创建一个具有ID,name 列的R数据框。请注意,name和ID应包含变量的所有级别。
隐藏层和神经元的理想数量取决于问题和数据集。与机器学习的多个方面一样,选择最佳的神经网络形状需要一定的知识水平和实验基础。一般来说,增加隐藏层和神经元的数量通常会产生更强大的模型,而这需要更多数据才能有效地进行训练。
越来越多的人愿意精神消费。旅游不仅可以提升人们对外地环境和外地人文的认知,也可以放松身心、愉悦心情,是一种受欢迎的精神消费。
关联规则是if / then语句,可帮助发现看似无关的数据之间的关系。关联规则的一个示例是“如果客户购买鸡蛋,那么他有80%的可能性也购买牛奶”。
回归分析是一种十分常见的数据分析方法,通过观测数据确定变量间的相互关系。传统回归分析以点数据为研究对象,预测结果也是点数据,而真实数据往往在一定范围内变动的。
大数据背景下各种数据相关的岗位变得炙手可热,长期处于供不应求的状态。近年来随着人工智能的发展,数据分析岗也越发火热。
R语言提供了丰富的功能,可用于绘制R中的时间序列数据。
我们生活在互联网时代,越来越多的人选择在网上贷款消费 ,投资理财早已成为一门学问,一些有头脑的人通过小额的贷款让钱生钱也成为了一种可能,贷款消费的公司越来越多。
使用Chain Ladder方法完成流量三角形,即计算我们认为未来几年将支付的平均金额
大数据已经成为变革和创新的技术力量和思维方式,成为当前研究的热门领域。
我们将使用整容手术数据说明两种中心化类型,并对其进行等级线性模型分析。
在本教程中,我们将讨论一种非常强大的优化(或自动化)算法,即网格搜索算法。
新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴。
最近我们一直在探索空间数据。事实证明,有一些很棒的R包可用于可视化此类数据。
我们进行了MIDAS回归分析,以预测季度GDP增长以及每月非农就业人数的增长。
Groupon是一个优惠券推荐服务,您可以免费注册Groupon。
我们分析了已迁离北京的外来人口的月收入、性别、迁入北京和迁离北京的日期、教育程度和职业这些方面的数据。
我想研究如何使用pymc3在贝叶斯框架内进行线性回归。根据从数据中学到的知识进行推断。
由于新型冠状病毒感染的肺炎疫情影响,剧烈增长的市场需求助推了在线教育的发展,同时也暴露了一些问题。
尽管线性模型是最简单的机器学习技术之一,但它们仍然是进行预测的强大工具。
在本节中,我将重点介绍使用集成嵌套 拉普拉斯近似方法的贝叶斯推理。
R语言使用二进制回归将序数数据建模为多元GLM
R语言大数据分析纽约市的311万条投诉统计可视化与时间序列分析
样条线是拟合非线性模型并从数据中学习非线性相互作用的一种方法。
本文将使用三种方法使模型适合曲线数据:1)多项式回归;2)用多项式样条进行B样条回归;3) 进行非线性回归。
NASA有32,000多个数据集,有关NASA数据集的元数据 可以JSON格式在线获得。
R语言对NASA元数据进行文本挖掘的主题建模分析
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds