Category Archives: 数理统计

R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

By tecdat6月 7, 2021数理统计, 机器学习, 计算机科学与技术LASSO, 分位数, 分位数回归, 回归, 自适应, 贝叶斯

贝叶斯回归分位数在最近的文献中受到广泛关注，本文实现了贝叶斯系数估计和回归分位数（RQ）中的变量选择，带有lasso和自适应lasso惩罚的贝叶斯。

R语言乘法GARCH模型对高频交易数据进行波动性预测

By tecdat6月 4, 2021大数据部落, 数理统计, 经济, 金融GARCH, 乘法, 交易, 波动, 波动性, 预测, 高频, 高频交易, 高频交易数据

虽然我对高频噪音中出现信号的有效性有一些怀疑，但我还是决定使用GARCH模型研究一下收益率的统计模型。与每日和较低频率的收益不同，日内高频数据有某些特殊的特点，使得使用标准的建模方法是无效的。

Python中用Prophet模型对天气时间序列进行预测与异常检测

By tecdat6月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Prophet, python, 天气, 异常, 异常检测, 时间序列, 预测

基本的Prophet模型是一个可分解的单变量时间序列模型，结合了趋势、季节性和节假日效应。

R语言状态空间模型和卡尔曼滤波预测酒精死亡人数时间序列

By tecdat6月 2, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术卡尔曼滤波, 时间序列, 死亡人数, 状态空间模型, 酒精, 预测

状态空间建模是一种高效、灵活的方法，用于对大量的时间序列和其他数据进行统计推断。本文介绍了状态空间建模，其观测值来自指数族，即高斯、泊松、二项、负二项和伽马分布。

数据挖掘：香水电商销售策略分析

By tecdat6月 1, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Apriori, 关联规则, 决策树, 数据, 数据挖掘, 电商, 策略, 销售, 香水

就香水市场份额而言，亚洲占全球销售额的8%，仅占拉丁美洲的20%，而中国仅占全球销售额的0.8%。

R语言用LOESS(局部加权回归)季节趋势分解（STL）进行时间序列异常检测

By tecdat6月 1, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LOESS, STL, 分解, 回归, 季节趋势, 季节趋势分解, 局部加权回归, 异常检测, 时间序列, 趋势分解

这篇文章描述了一种对涉及季节性和趋势成分的时间序列的中点进行建模的方法。

Python用时变马尔可夫区制转换（Markov regime switching）自回归模型分析经济时间序列

By tecdat5月 28, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融Markov, Markov regime switching, 区制, 区制转换, 时变, 时间序列, 经济, 自回归, 马尔, 马尔可夫, 马尔可夫区制转换

本文提供了一个在统计模型中使用马可夫转换模型模型的例子，来复现Kim和Nelson（1999）中提出的一些结果。

R语言有限混合模型(FMM,finite mixture model)及其EM算法聚类分析间歇泉喷发时间

By tecdat5月 27, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术EM, finite mixture model, FMM, 数据, 有限混合模型, 聚类, 间歇泉

既包括传统的方法，如单变量和多变量正态混合的EM算法，也包括反映有限混合模型的一些最新研究的方法。许多算法都是EM算法或基于类似EM的思想，因此本文包括有限混合模型的EM算法的概述。

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

By tecdat5月 26, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Logisitc, RandomForest, 可视化, 回归, 心脏病, 逻辑回归, 随机森林, 预测

本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说，我们的目标是在心脏研究的数据集上建立一些预测模型，并建立探索性和建模方法。但什么是心脏研究？

R语言计算资本资产定价模型(CAPM)中的Beta值和可视化

By tecdat5月 25, 2021可视化和设计, 大数据部落, 数理统计, 经济, 计算机科学与技术Beta, CAPM, 可视化, 资本资产定价模型

今天我们将计算投资组合收益的CAPM贝塔。这需要拟合一个线性模型，得到可视化，从资产收益的角度考虑我们的结果的意义。

R语言极值推断：广义帕累托分布GPD使用极大似然估计、轮廓似然估计、Delta法

By tecdat5月 24, 2021大数据部落, 数理统计, 经济, 计算机科学与技术Delta, GPD, 帕累托, 广义帕累托, 广义帕累托分布, 极值, 极值推断, 极大似然, 极大似然估计, 轮廓似然估计

本文是极端值推断的内容。我们在广义帕累托分布上使用最大似然方法。

新零售消费者特征的数据视野

By tecdat5月 23, 2021信息管理与信息系统, 可视化和设计, 大数据部落, 数理统计, 计算机科学与技术数据, 新零售, 消费者, 特征

新零售,顾名思义,就是与传统零售完全不同的,一种新的零售模式。

【视频讲解】Python随机波动率(SV)模型对标普500指数时间序列波动性预测

By tecdat5月 21, 2021大数据部落, 数理统计, 特色视频, 经济, 计算机科学与技术, 金融SV, 时间序列, 标普500指数, 波动性, 波动率, 随机波动率, 预测

资产价格具有随时间变化的波动性（逐日收益率的方差）。

使用R语言进行多项式回归、非线性回归模型曲线拟合

By tecdat5月 19, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术回归, 多项式, 拟合, 曲线, 非线性, 非线性回归

对于线性关系，我们可以进行简单的线性回归。对于其他关系，我们可以尝试拟合一条曲线。

R语言使用ARIMAX预测失业率经济时间序列数据

By tecdat5月 18, 2021大数据部落, 数理统计, 经济, 计算机科学与技术arima, ARIMAX, 失业率, 时间序列, 经济, 预测

在大数据的趋势下，我们经常需要做预测性分析来帮助我们做决定。

R语言用ARIMA模型，ARIMAX模型预测冰淇淋消费时间序列数据

By tecdat5月 17, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, ARIMAX, 冰淇淋, 时间序列, 模型, 消费, 预测

标准的ARIMA（移动平均自回归模型）模型允许只根据预测变量的过去值进行预测。

【视频讲解】R语言主成分分析（PCA）葡萄酒可视化：主成分得分散点图和载荷图

By tecdat5月 14, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术PCA, 主成分, 主成分分析, 可视化

我们将使用葡萄酒数据集进行主成分分析。

【视频讲解】R语言生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素

By tecdat5月 13, 2021大数据部落, 数理统计, 机器学习, 特色视频, 生态、气象学, 计算机科学与技术BRT, 增强回归树, 影响, 影响因素, 生存分布, 生态学, 预测

本文是一个简短的教程，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。

matlab实现扩展卡尔曼滤波(EKF)进行故障检测

By tecdat5月 12, 2021大数据部落, 控制科学与工程, 数理统计, 机器学习, 机械工程及自动化, 电气工程及自动化, 计算机科学与技术EKF, matlab, 卡尔曼, 卡尔曼滤波, 扩展卡尔曼滤波, 故障检测, 滤波

本文展示了如何使用扩展卡尔曼滤波器进行故障检测。本文使用扩展的卡尔曼滤波器对一个简单的直流电机的摩擦力进行在线估计。

R语言经济学：动态模型平均(DMA)、动态模型选择(DMS)预测原油价格时间序列

By tecdat5月 11, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融DMA, DMS, 动态模型平均, 动态模型选择, 原油, 时间序列, 经济, 预测

简要地提供了在经济学中使用模型平均和贝叶斯方法的论据，使用了动态模型平均法（DMA），并与ARIMA、TVP等方法进行比较。希望对经济和金融领域的从业人员和研究人员有用。

R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者

By tecdat5月 10, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Bagging, Logistic, logistic regression, 决策树, 分类, 回归, 心脏病, 森林, 逻辑回归

通常，bagging 与树有关，用于生成森林。但实际上，任何类型的模型都有可能使用bagging 。

R语言多项式回归拟合非线性关系

By tecdat5月 8, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术回归, 多项式回归, 非线性关系

多项式回归是独立x变量和因果y变量之间的非线性关系。

R语言生存分析: 时变竞争风险模型分析淋巴瘤患者

By tecdat5月 7, 2021医药生物, 大数据部落, 数理统计患者, 时变, 淋巴瘤, 生存分析, 竞争风险模型

在本文中，我们描述了灵活的竞争风险回归模型。回归模型被指定为转移概率，也就是竞争性风险设置中的累积发生率。 &

【视频讲解】R语言逻辑回归（Logistic回归）模型分类预测病人冠心病风险

By tecdat5月 6, 2021大数据部落, 数据库, 数理统计, 机器学习, 特色视频, 计算机科学与技术Logistic, 冠心病, 分类, 回归, 病人, 逻辑回归, 预测

本文的目的是完成一个逻辑回归分析。使你对分析步骤和思维过程有一个基本概念。

R语言时间序列GARCH模型分析股市波动率

By tecdat4月 29, 2021大数据部落, 数理统计, 经济, 金融GARCH, 时间序列, 波动率, 股市

在这篇文章中，我们将学习一种在价格序列中建立波动性模型的标准方法，即广义自回归条件异方差（GARCH）模型。

R语言时变向量自回归（TV-VAR）模型分析时间序列和可视化

By tecdat4月 28, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术TV-VAR, VAR模型, 可视化, 向量自回归, 时变, 时间序列

在心理学研究中，个人主体的模型正变得越来越流行。原因之一是很难从人之间的数据推断出个人过程。另一个原因是，由于移动设备无处不在，从个人获得的时间序列变得越来越多。

R语言用样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

By tecdat4月 27, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术Adaboost, boosting, GBM, 决策树, 分类, 动态可视化, 可视化, 回归, 样条曲线, 梯度提升

Boosting算法是一种把若干个分类器整合为一个分类器的方法，也就是一种集成分类方法（Ensemble Method）。

R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析

By tecdat4月 26, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术Logistic, LOWESS, 回归, 回归诊断, 局部加权回归, 残差, 诊断, 逻辑回归

目前，回归诊断不仅用于一般线性模型的诊断，还被逐步推广应用于广义线性模型领域（如用于logistic回归模型）。

Matlab中的偏最小二乘法（PLS）回归模型，离群点检测和变量选择

By tecdat4月 23, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术PLS, 偏最小二乘, 偏最小二乘法, 变量选择, 回归, 最小二乘, 最小二乘法, 离群点, 离群点检测

最近我们被客户要求撰写关于PLS的研究报告。本文建立偏最小二乘法（PLS）回归（PLSR）模型，以及预测性能评估。

R语言混合效应逻辑回归（mixed effects logistic）模型分析肺癌数据

By tecdat4月 22, 2021大数据部落, 数据库, 数理统计, 机器学习, 计算机科学与技术Logistic, 混合效应, 肺癌, 逻辑回归

最近我们被客户要求撰写关于混合效应逻辑回归的研究报告。

R语言用LASSO，adaptive LASSO 预测通货膨胀时间序列

By tecdat4月 21, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术adaLASSO, adaptive LASSO, LASSO, 时间序列, 通货膨胀, 预测

如果你了解数据科学领域，你可能听说过LASSO。LASSO是一个对目标函数中的参数大小进行惩罚的模型，试图将不相关的变量从模型中排除。

【视频讲解】R语言进行数据结构化转换：Box-Cox变换、“凸规则”变换方法

By tecdat4月 19, 2021大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术“凸规则”变换, Box-Cox, 凸规则, 变换, 数据结构化转换, 数据转换

线性回归时若数据不服从正态分布，会给线性回归的最小二乘估计系数的结果带来误差，所以需要对数据进行结构化转换。

R语言用Copulas模型的尾部相依性分析损失赔偿费用

By tecdat4月 16, 2021保险, 大数据部落, 数理统计, 经济, 金融copula, Copulas, 尾部相依性, 损失, 相依性, 赔偿

两个随机变量之间的相依性问题备受关注,相依性(dependence)是反映两个随机变量之间关联程度的一个概念。

R语言如何用潜类别混合效应模型（lcmm）分析抑郁症状

By tecdat4月 14, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术lcmm, R语言, 混合效应, 混合效应模型, 潜类别混合效应模型

每一个动态现象都可以用一个潜过程(Λ(t)来描述，这个潜过程在连续的时间t内演化。

R语言非参数方法：使用核回归平滑估计和K-NN(k近邻算法)分类预测心脏病数据

By tecdat4月 13, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术K-NN, k近邻, R语言, 分类, 回归, 平滑估计, 心脏病, 心脏病数据, 数据, 核回归, 核方法, 算法, 非参数, 非参数方法, 预测

本文考虑一下基于核方法进行分类预测。注意，在这里，我们不使用标准逻辑回归，它是参数模型。

matlab使用分位数随机森林（QRF）回归树检测异常值

By tecdat4月 12, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术matlab, QRF, 分位数, 去除异常值, 回归, 回归树, 异常, 异常值, 异常值处理, 异常值检测, 随机森林

这个例子展示了如何使用分位数随机林来检测异常值。

R语言arima，向量自回归（VAR），周期自回归(PAR)模型分析温度时间序列

By tecdat4月 9, 2021大数据部落, 数理统计, 计算机科学与技术arima, PAR, R语言, VaR, 向量自回归, 周期自回归, 时间序列, 温度

至少有两种非平稳时间序列：具有趋势的时间序列和具有单位根的时间序列（称为单整时间序列）。

【视频讲解】R语言改进的股票配对交易策略分析SPY-TLT组合和中国股市投资组合

By tecdat4月 8, 2021大数据部落, 数理统计, 特色视频, 经济, 金融交易策略, 投资, 投资组合, 股市, 股票, 配对交易策略

相信大家都听说过股票和债券的多元化投资组合。

R语言和Stan,JAGS：用rstan,rjag建立贝叶斯多元线性回归预测数据

By tecdat4月 7, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术JAGS, rjag, Rstan, stan, 回归, 多元, 线性回归, 贝叶斯, 预测

本文将介绍如何在R中做贝叶斯回归分析，R中有不少包可以用来做贝叶斯回归分析，比如最早的（同时也是参考文献和例子最多的）R2WinBUGS包。

R语言信用风险回归模型中交互作用的分析及可视化

By tecdat4月 6, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术交互, 交互作用, 信用, 信用风险, 可视化, 回归

多元统计分析中，交互作用是指某因素作用随其他因素水平的不同而不同，两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。

R语言多重比较示例：Bonferroni校正法和Benjamini & Hochberg法

By tecdat4月 2, 2021医药生物, 大数据部落, 数理统计Benjamini, Benjamini & Hochberg, Bonferroni, Familywise error rate, Hochberg, R语言, 多重比较, 校正

假设检验的基本原理是小概率原理，即我们认为小概率事件在一次试验中实际上不可能发生。

调查数据聚焦护士职业满意度

By tecdat4月 2, 2021医药生物, 可视化和设计, 大数据部落, 数理统计护士, 数据, 职业, 职业满意度, 聚焦, 调查, 调查数据

这是我们最近的一项护士职业满意度线上调查中关注的一个问题。遗憾的是，对护士工作满意的只有约27%。为何这么多人不愿意再次选择做护士？

【视频讲解】Python和R语言使用指数加权平均(EWMA)，ARIMA自回归移动平均模型预测时间序列

By tecdat4月 1, 2021大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术arima, EWMA, python, R, 指数加权平均, 时间序列, 自回归移动平均模型, 预测

本文学习创建时间序列预测的步骤，关注Dickey-Fuller检验、指数加权平均(EWMA)和ARIMA（自回归移动平均）模型，从理论上学习这些概念以及它们在python和R中的实现。

R语言时间序列平稳性几种单位根检验（ADF，KPSS，PP）及比较分析

By tecdat3月 30, 2021大数据部落, 数理统计, 经济, 计算机科学与技术ADF, KPSS, PP, 单位根, 单位根检验, 平稳性, 时间序列, 检验

WeChat Tencent QQ email print 由Kaizong Ye，Liao Bao撰写 μ是

R语言贝叶斯线性回归和多元线性回归构建工资预测模型

By tecdat3月 29, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 回归, 多元线性回归, 工资, 线性回归, 贝叶斯, 预测

在劳动经济学领域，收入和工资的研究为从性别歧视到高等教育等问题提供了见解。

【视频讲解】R语言基于Bootstrap的线性回归预测置信区间估计方法

By tecdat3月 26, 2021大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术bootstrap, R语言, 估计, 回归, 线性回归, 置信区间, 预测

我们知道参数的置信区间的计算，这些都服从一定的分布(t分布、正态分布），因此在标准误前乘以相应的t分值或Z分值。

R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析

By tecdat3月 25, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, 回归, 多项式回归, 岭回归, 自适应, 逻辑回归

正则化路径是在正则化参数lambda的值网格上计算套索LASSO或弹性网路惩罚的正则化路径。

Python用ARIMA和SARIMA模型预测销量时间序列数据

By tecdat3月 24, 2021大数据部落, 数理统计, 计算机科学与技术arima, python, SARIMA, 时间序列, 预测

最近我们被客户要求撰写关于预测销量时间序列的研究报告。指数平滑模型是基于对数据趋势和季节性的描述，而ARIMA模型则是为了描述数据的自相关性。

R语言分段线性回归分析预测车辆的制动距离

By tecdat3月 23, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术分段线性回归, 制动距离, 回归, 线性回归, 车辆, 预测

分段回归( piecewise regression )，顾名思义，回归式是“分段”拟合的。

R语言贝叶斯推断与MCMC：实现Metropolis-Hastings 采样算法示例

By tecdat3月 22, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术MCMC, Metropolis-Hastings, 贝叶斯, 贝叶斯推断, 采样, 采样算法

任何MCMC方案的目标都是从“目标”分布产生样本。

R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响

By tecdat3月 19, 2021大数据部落, 数理统计, 经济, 计算机科学与技术PSTR, R语言, TV-PSTR, 债务, 投资, 时变, 时变面板平滑转换回归, 面板平滑转换回归, 面板平滑转换回归模型

最近我们被客户要求撰写关于面板平滑转换回归(PSTR)的研究报告。建模过程包括三个阶段：表述，估计和评估。当采用两种状态时，单转换函数PSTR模型具有两个变量：

R语言线性回归和时间序列分析北京房价影响因素可视化案例

By tecdat3月 18, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术可视化, 回归, 影响, 房价, 时间序列

房价有关的数据可能反映了中国近年来的变化：

R语言惩罚logistic逻辑回归（LASSO,岭回归）高维变量选择的分类模型案例

By tecdat3月 17, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术LASSO, Logistic, 分类, 变量选择, 回归, 岭回归, 惩罚l, 模型, 逻辑回归, 高维

WeChat Tencent QQ email print 由Kaizong Ye，Weilong Zhang

【视频讲解】R语言极值理论EVT：基于GPD模型的火灾损失分布分析

By tecdat3月 16, 2021数理统计, 特色视频, 经济, 计算机科学与技术, 金融EVT, GPD, R语言, 损失, 损失分布, 极值理论

极值理论关注风险损失分布的尾部特征,通常用来分析概率罕见的事件,它可以依靠少量样本数据,在总体分布未知的情况下,得到总体分布中极值的变化情况,具有超越样本数据的估计能力。

R语言用普通最小二乘OLS，广义相加模型GAM ，样条函数进行逻辑回归LOGISTIC分类

By tecdat3月 15, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, Logistic, ols, R语言, 分类, 广义相加模型, 标准最小二乘, 样条函数, 逻辑回归

本文我们对逻辑回归和样条曲线进行介绍。

【视频讲解】R语言分布滞后非线性模型（DLNM）研究发病率，死亡率和空气污染示例

By tecdat3月 12, 2021医药生物, 大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术DLNM, R语言, 分布滞后非线性模型, 发病率, 死亡率, 空气污染

本文提供了运行分布滞后非线性模型的示例，同时描述了预测变量和结果之间的非线性和滞后效应，这种相互关系被定义为暴露-滞后-反应关联。

R语言基于温度对城市层次聚类、kmean聚类、PCA主成分分析和Voronoi图可视化

By tecdat3月 11, 2021可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术kmean, kmean聚类, PCA, R语言, Voronoi, Voronoi图, 主成分分析, 可视化, 城市, 层次聚类, 温度, 聚类

最近我们被客户要求撰写关于聚类技术的研究报告。为了说明层次聚类技术和k-均值，我使用了了城市温度数据集，其中包括几个城市的月平均气温。

R语言分布滞后线性和非线性模型（DLMs和DLNMs）分析时间序列数据

By tecdat3月 10, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术DLM, DLMs, DLNM, DLNMs, R语言, 分布滞后线性, 时间序列, 非线性模型

本文演示了在时间序列分析中应用分布滞后线性和非线性模型（DLMs和DLNMs）。

R语言广义相加模型 (GAMs)分析预测CO2时间序列数据

By tecdat3月 9, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术CO2, GAM, R语言, 广义相加模型, 数据, 预测

环境科学中的许多数据不适合简单的线性模型，最好用广义相加模型（GAM）来描述。<

R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归

By tecdat3月 8, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, ols, R语言, 广义相加模型, 普通最小二乘

这篇文章探讨了为什么使用广义相加模型是一个不错的选择。为此，我们首先需要看一下线性回归，看看为什么在某些情况下它可能不是最佳选择。

R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据

By tecdat3月 5, 2021医药生物, 大数据部落, 数理统计, 机器学习, 计算机科学与技术glm, LASSO, MCP, R语言, SCAD, 前列腺, 非凸惩罚函数回归

本文使用lasso或非凸惩罚拟合线性回归，GLM和Cox回归模型的正则化

SAS使用鸢尾花(iris)数据集训练人工神经网络(ANN)模型

By tecdat3月 4, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术ANN, Iris, SAS, 人工神经网络, 神经网络, 鸢尾花

人工神经网络最初是由研究人员开发的，他们试图模仿人脑的神经生理学。

Python | ARIMA时间序列预测模型

By tecdat3月 3, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, python, 时间序列, 预测

时间序列被定义为一系列按时间顺序索引的数据点。时间顺序可以是每天，每月或每年。

Python使用GARCH，EGARCH，GJR-GARCH模型和蒙特卡洛模拟进行股价预测

By tecdat3月 2, 2021大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融EGARCH, GARCH, GJR-GARCH, python, 模拟, 股价, 股市, 蒙特卡洛, 预测

预测股价已经受到了投资者，政府，企业和学者广泛的关注。然而，数据的非线性和非平稳性使得开发预测模型成为一项复杂而具有挑战性的任务。

数据分析促进白血病预测诊断

By tecdat3月 2, 2021医药生物, 大数据部落, 数理统计数据, 数据分析, 白血病, 诊断, 预测

2019年,全球八个主要国家的18岁以上男女共诊断出72,164例急性髓细胞白血病(AML)。

【视频讲解】R语言中生存分析模型与时间依赖性ROC曲线可视化

By tecdat3月 1, 2021医药生物, 可视化和设计, 大数据部落, 数理统计, 特色视频ROC, ROC曲线, 可视化, 时间依赖性, 生存分析

人们通常使用接收者操作特征曲线（ROC）进行二元结果逻辑回归。但是，流行病学研究中感兴趣的结果通常是事件发生时间。使用随时间变化的时间相关ROC可以更全面地描述这种情况下的预测模型。

R语言建立和可视化混合效应模型mixed effect model

By tecdat2月 26, 2021大数据部落, 数理统计, 机器学习, 计算机科学与技术mixed effect model, R语言, 可视化, 混合效应, 混合效应模型

最近我们被客户要求撰写关于混合效应模型的研究报告。我们已经学习了如何处理混合效应模型。

R语言建模收入不平等：分布函数拟合及洛伦兹曲线(Lorenz curve)

By tecdat2月 25, 2021大数据部落, 数理统计, 经济Lorenz, 不平等, 分布, 分布函数, 收入, 洛伦兹, 洛伦兹曲线

洛伦兹曲线来源于经济学，用于描述社会收入不均衡的现象。

Category Archives: 数理统计

关注我们，永远不要错过任何见解。