R语言谱聚类社会化推荐挖掘协同过滤电影社交网站Flixster数据集应用研究
本课题着眼于谱聚类在社会化推荐挖掘中的应用研究。
本课题着眼于谱聚类在社会化推荐挖掘中的应用研究。
机器学习在环境监测领域的应用,着眼于探索全球范围内的环境演化规律,人类与自然生态之间的关系以及环境变化对人类生存的影响。
我们围绕进化树技术进行一些咨询,分析生物类群在时间上的多样性是如何变化的。
As I first came to the University, I found SAT scores for my friends at Oxford are among 1450.
本文做SV模型,选取马尔可夫蒙特卡罗法(MCMC)、正则化广义矩估计法和准最大似然估计法估计。
作为衡量通货膨胀的基本指标,消费者价格指数CPI和生产者价格指数PPI的作用关系与传导机制一直是宏观经济研究的核心问题。
我们和一位客户讨论过如何在R软件中实现稀疏主成分分析。
最近,在贝叶斯统计实验中,我们向客户演示了用R的朴素贝叶斯分类器可以提供的内容。
我们最近有一个很棒的机会与一位伟大的客户合作,要求构建一个耐克微博聚类算法。本文利用R语言完成对微博相应分析。
我们曾经为一位客户进行了短暂的咨询工作,他正在构建一个主要基于安卓包分类的分析应用程序。
我们和一位客户讨论如何在R软件中处理GARCH族模型。
Box-Behnken设计的优良在于,可以将其应用于分析2至5个因子的实验。
《精品购物指南》是中国本土经营规模最大、最具影响力的时尚媒体品牌
为了分析电视台时间关系形态变化,我们获取了电视台合播电视剧数量数据
读取工资数据 在excel中选取数据,复制。
Limit Order Book Pricer
Humans around the world are uploading increasing amounts of information to social media servicessuch as Twitter and Flickr.
我们正和一位朋友讨论如何在R软件中用GLM模型处理全国的气候数据。
WeChat Tencent QQ email print 由LE PHUONG撰写 × 现在提到了代写服务,
Plant performance is based on pulp brightness as measured by a reflective meter.
For this coursework you are required to download a dataset personal to you.
The file lungfunction.dat contains data from 50 people. Lung function can be measured by a forced out breath of air into a device called a spirometer and is used as a marker for lung health.
Consider the following density:(a) Devise and implement two efficient algorithms for simulating from f(x).
Twenty tobacco budworm moths of each sex were exposed to different doses of the insecticide trans-cypermethrin.
地图本身就是可视化的产品,并在发展过程中形成了一系列的理论与方法。
您想构建一个没有太多训练数据的机器学习模型吗?
在存在缺失数据的情况下,需要根据缺失数据的机制和用于处理缺失数据的统计方法定制变量选择方法。
这是一份有关消费者对电影市场看法及建议的调查报告
从Engle在1982发表自回归条件异方差(ARCH)模型的论文以来,金融时间序列数据的波动性就倍受关注。
Use the R environment to do data exploration and data preparation.
方法检索治疗抑郁症中药专利复方,排除外用中药及中西药物合用的复方。最近我们被要求撰写关于用药规律的研究报告,包括一些图形和统计输出。
最近我们被要求解决时间序列异常检验的问题。
复杂网络是大量真实复杂系统的拓扑关系。本文中我们被要求对上海公交路线进行可视化。
开源软件存储库上有数千个开源软件,可以从中免费使用该软件。
本文基于 CPV 模型, 对房地产信贷风险进行了度量与预测。
Directions: Complete the following exercises using the code discussed during computer lab.
Complete the following exercises using the code discussed during computer lab. Save your work in an R script as well as a Word document containing the necessary output and comments.
随着网络的迅速发展,依托于网络的购物作为一种新型的消费方式,在全国乃至全球范围内飞速发展。
团队需要分析一个来自在线零售商的数据集。
动态时间扭曲算法何时、如何以及为什么可以有力地取代常见的欧几里得距离,以更好地对时间序列数据进行分类
最近我们被客户要求撰写关于上海空气质量指数的研究报告。
最近我们被客户要求撰写关于蛋白质组学的研究报告。
在应用的设置中,我们经常遇到分类数据类型和连续数据类型的组合。
我们将利用每日数据制定简单的交易策略 我们将涵盖以下内容。
在本工作表中,我们将研究价格、收益率和波动性。波动性通常用收益率的均方差来衡量,例如夏普比率的分母,它被用作风险的衡量标准。
主题模型允许对文档中的术语频率发生进行概率建模。
采样地点:淮河流域一带,昭平台水库、白龟山水库、燕山水库、石漫滩水库、板桥水库、宿鸭湖水库、博山水库、南湾水库、石山口水库、五岳水库、泼河水库、鲶鱼山水库。
一些标准的图形工具可以极大地帮助理解数据集并评估所建议模型的质量。
传统上,协整的测试是在非常长的时间内进行的,本案例研究A测试了1960-2010年期间T-Bill利率和国债收益率之间的平衡。
最近我们被客户要求撰写关于逻辑回归混合效应模型的研究报告。吸烟、喝酒和赌博被认为是由许多因素造成的。 WeCh
近段时间,美国总统大选引起了世界各国的关注。
数据量大,数据要进行清洗以及预处理,同时要多方面可视化,要探索多变量对因变量的影响。
我们如何回答它:估计从标准柯西分布(t 分布 w/df = 1)生成的大小为 20 的随机样本的水平 \(k\) 修剪均值的 MSE。
本文将探讨 Fisher 和 Anderson 鸢尾花数据集中呈现的三个变量之间的关系,特别是virginica 和 versicolor 级别的因变量变量物种对预测变量花瓣长度和花瓣宽度的逻辑回归。
如果_真实_模型包括_X_ 1 和_X_ 2 ,但我们忘记了_X_ 2,那么 – 在某些情况下 – 对_X_的估计将会有偏差。OVB 需要:cor( X 1, X 2)!= 0 和 cor( X 1, y ) != 0
本文展示了如何通过矩量的广义方法和广义经验似然来估计模型。
本文用爬虫采集了汽车销售数据,后来对其进行了扩展,创建这个数据集,其中包括境内的所有二手车辆或者经销商车辆条目数据。
市场风险指的是由金融市场中资产的价格下跌或价格波动增加所导致的可能损失。
建立重庆市经济指标发展体系,以重庆市一小时经济圈作为样本,运用因子分析方法进行实证分析
本文展示了如何使用 R 构建Bootstrap自举置信区间的示例。
本文应用R软件技术,通过在世界银行网站上查阅的世界人口历史数据,分别利用logistic模型、ARFMA模型、ARIMA模型、时间序列模型对从2016到2100年的世界人口进行预测。
考虑我们从实验、事件等中观察到一些数据 y 的情况。
在拟合 GLM(并检查残差)之后,可以使用 z 检验一一检验估计参数的显着性,即将估计值与其标准误差进行比较。
数据包含有关葡萄牙“Vinho Verde”葡萄酒的信息。该数据集有1599个观测值和12个变量,分别是固定酸度、挥发性酸度、柠檬酸、残糖、氯化物、游离二氧化硫、总二氧化硫、密度、pH值、硫酸盐、酒精和质量。
本文开发和应用用于生物序列分析的隐马尔可夫模型和HMM。
本文包含一些直观的示例来说明 copula 理论的核心概念。
实现一个简单的 Metropolis-Hastings MCMC 从该模型的后验分布中采样。
永远不要错过任何见解。当新文章发表时,我们会通过微信公众号向您推送。
技术干货
最新洞察
This will close in 0 seconds