R语言分层线性模型案例
有许多分层数据的例子。例如,地理数据通常按层次分组,可能是全球数据,然后按国家和地区分组 。一个生物学的例子是按物种分组的动物或植物的属性,或者属于一个级别的属性,然后是家族。一个商业例子可能是业务部门和细分的员工满意度。
有许多分层数据的例子。例如,地理数据通常按层次分组,可能是全球数据,然后按国家和地区分组 。一个生物学的例子是按物种分组的动物或植物的属性,或者属于一个级别的属性,然后是家族。一个商业例子可能是业务部门和细分的员工满意度。
这次,我们将使用k-Shape时间序列聚类方法检查与我们有业务关系的公司的股票收益率的时间序列。
R语言参数检验 :需要多少样本?如何选择样本数量
R语言检验独立性:卡方检验(Chi-square test)和费舍尔精确检验分析案例报告
使用基于分类的递归分区算法来拟合基于树的模型得到的模型类似于推荐的ř包rpart包产生的模型支持分类型树和回归型树。
最近我们被客户要求撰写关于时间序列的研究报告。分析时间序列数据的第一件事就是将其读入R,并绘制时间序列。
ImageMagick库具有大量功能。本文简要介绍了最重要的入门概念。
本文考虑R语言的EM算法和高斯混合模型实现。
优化是一种为所有可能的解决方案找到给定问题的最佳解决方案的技术。
R语言用Backfitting MCMC抽样算法进行贝叶斯推理案例
R语言离群值处理分析
最近我们被要求撰写关于金融时间序列的arma-garch-copula的调查报告。
这里向您展示如何在R中使用glmnet包进行岭回归(使用L2正则化的线性回归),并使用模拟来演示其相对于普通最小二乘回归的优势。
数据预处理之异常值处理
信用记分卡一直是信用评分的标准模型,因为它们易于理解,使您能够轻松评分新数据-即计算新客户的信用评分。
概率编程使我们能够实现统计模型,而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用。
我们最近有一个很棒的机会与一位伟大的客户合作,要求Business Science构建一个适合他们需求的开源异常检测算法。
银行信用数据SOM神经网络聚类实现
多层线性模型(Hierarchical Linear Model,HLM),也叫多水平模型(Multilevel Model,MLM),是社会科学常用的高级统计方法之一。
时变参数VAR随机模型是一种新的计量经济学方法
本文在iris数据集上展示了如何使用R软件来建立Hierarchical Cluster Analysis层次聚类分析(更好的可视化和灵敏度分析)。
最近我们被客户要求撰写关于ARMA-GARCH-VaR模型的研究报告。
R语言中的Wilcoxon符号秩检验与配对学生t检验
最近我们被客户要求撰写关于混合模型的研究报告。由于我们发现自己在工作中越来越多地使用这些模型,我们开发了一套R shiny工具来简化和加速与对象交互的lme4常见任务。
R语言用rle,svm和rpart进行时间序列预测
对于熟悉线性回归拟合结构方程模型的分析师来说,在R环境中,拟合结构方程模型涉及学习新的建模语法,新的绘图语法以及通常是新的数据输入方法。
在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。
处理分组数据和复杂层次结构的分析师,从嵌入在参与者中的测量,嵌套在州内的县或嵌套在教室内的学生,经常发现他们需要建模工具来反映他们数据的这种结构。
R语言CRAN软件包Meta分析
python用遗传算法 神经网络 模糊逻辑控制算法对乐透进行预测
R语言 线性混合效应模型实战案例
聚类分析算法很多,比较经典的有k-means和层次聚类法。
风险价值是衡量与投资组合相关的风险水平的统计方法。
线性回归在财务中被广泛应用于众多应用程序中。
本文的目的是对如何在R中进行生存分析进行简短而全面的评估。
本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响。
我已经准备了一个文件,其中包含四个用电时间序列来进行分析。数据操作将由data.table程序包完成。
此示例显示MATLAB如何从复合条件均值和方差模型预测 和条件差异。
之前在某社区中看到一篇帖子《一张价值几十万个跌停的统计表》,主要是预测即将被ST的股票,虽然有些标题党,但是还有有一些参考价值的。
有正必有反,在个人信贷业务规模不断扩大的同时,信贷的违约等风险问题也日益突出,一定程度上制约着我国的信贷市场的健康发展。
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。
最近我们被客户要求撰写关于马尔可夫链蒙特卡罗MCMC模型的研究报告。这只是众多算法之一。这个术语代表“马尔可夫链蒙特卡洛”,因为它是一种使用“马尔可夫链”(我们将在后面讨论)的“蒙特卡罗”(即随机)方法。
让我们看一个经济学的例子:假设你想购买一定数量q的特定产品。
此示例显示如何在matlab中应用偏最小二乘回归(PLSR)和主成分回归(PCR),并讨论这两种方法的有效性。
本文显示了如何基于潜在的ARMA-GARCH过程(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。
线性混合效应模型Linear Mixed-Effects Models的部分折叠Gibbs采样
逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x)。
可以使用逐步回归过程确定多元逻辑回归。此函数选择模型以最小化AIC。
和宏观经济数据不同,金融市场上多为高频数据,比如股票收益率序列。
这个问题涉及马蹄蟹研究的数据。
混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对因变量的影响。
本文显示了如何基于潜在的ARMA-GARCH模型(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。
汽车共享”最早出现于上个世纪四十年代的瑞士,他们发明了“自驾车合作社”,后来日本、英国等国争相效仿,但都未形成规模。
弹幕数据测评:情绪制造机
五一小长假将至,很多人都打算要带上自己的家人出去旅游放松一下,这是一个令人很幸福的事情,但同时也是会有一些焦虑的,焦虑什么呢?
口罩网购数据解惑
网约车评论的数字辞典
高校排名中的数字基因
隐形眼镜是一种戴在眼球角膜上,用以矫正视力或保护眼睛的镜片。与框架眼镜相比,隐形眼镜不仅佩戴方便、美观,而且视觉效果好。拓端数据(tecdat)研究人员根据电商网站交易数据从多个角度进行数据分析,对眼镜类型、价格、产地及消费满意度进行数据洞察。
评价数据下的酒店预订“避坑指南”
数据诊断电梯“安全之殇 物业工程肩负着维持项目各类设施设备的正常运作,保障全体业主的正常生活,令物业保值升值,是项目的心脏部门。拓端数据(tecdat)研究人员根据全国电梯故障上报汇总数据,从多个角度进行数据分析。
早在1995年比尔·盖茨就在《未来之路》里说过:未来没有配套智能家居的房子,就是毛坯房。
随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带。
互联网无疑是当今最热门的行业。这个行业高薪资的背后也是大量的加班和激烈的竞争。
豆瓣高分影视数据洞察:热门影视十年演变
微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。
小红书作为网友的“种草基地”,里面有来自全国各地婚礼策划企业,新人们会选择在平台上进行了解,收集自己想要的服务。
论坛为有相同爱好的网友提供了广阔的互动交流平台,而由此积累下来的庞大数据和复杂的用户互动场景也蕴含着有价值的信息,本文对虎扑论坛的帖子、个人信息展开分析,探索虎扑论坛用户有哪些特点?
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds