Tag Archives: R语言

R语言泊松Poisson回归模型预测人口死亡率和期望寿命

By tecdat12月 25, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术Poisson, R语言, 人口死亡率, 回归, 期望寿命, 死亡率, 泊松, 泊松Poisson回归

本文我们讨论了期望寿命的计算，人口统计模型的起点是死亡率表。

R语言复杂网络分析：聚类（社区检测）和可视化

By tecdat12月 25, 2020可视化和设计, 数理统计, 机器学习, 计算机科学与技术R语言, 可视化, 复杂网络, 社区检测, 聚类

为了用R来处理网络数据，我们使用婚礼数据集。

R语言使用自组织映射神经网络（SOM）进行客户细分

By tecdat12月 24, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, SOM, 可视化, 客户细分, 无监督, 聚类, 自组织映射神经网络

自组织映射神经网络（SOM）是一种无监督的数据可视化技术，可用于可视化低维（通常为2维）表示形式的高维数据集。

R语言分布滞后线性和非线性模型（DLM和DLNM）建模

By tecdat12月 23, 2020医药生物, 大数据部落, 数理统计DLM, DLNM, R语言, 分布滞后线性模型, 非线性模型

本文说明了R语言中实现分布滞后线性和非线性模型（DLM和DLNM）的建模。

R语言动量交易策略分析调整后股市数据

By tecdat12月 22, 2020大数据部落, 数理统计, 经济, 金融R语言, 交易策略, 动量交易, 股市

用于动量策略中所谓的动量（Momentum），是指某一对象所具有的一种倾向于保持其原有属性或特征的性质，也可以简单理解成一种惰性（Inertia）。

R语言对Hull White短期利率模型仿真

By tecdat12月 21, 2020大数据部落, 数理统计, 经济Hull White, HullWhite, R语言, 仿真, 利率模型, 短期利率

在这篇文章中，我使用 R 建立著名的Hull-White利率模型并进行仿真。

R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量

By tecdat12月 18, 2020大数据部落, 数理统计, 计算机科学与技术GAM, Poisson, R语言, 回归, 样条曲线, 泊松, 泊松Poisson回归, 预测

我根据泊松Poisson回归、GAM样条曲线模型对一个十字路口的骑自行车者的数量进行预测

R语言ARIMA集成模型预测时间序列分析

By tecdat12月 17, 2020大数据部落, 数理统计, 计算机科学与技术arima, R语言, 时间序列, 集成模型, 预测

本文我们使用4个时间序列模型对每周的温度序列建模。

R语言分位数回归Quantile Regression分析租房价格数据

By tecdat12月 16, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Quantile Regression, R语言, 价格, 分位数, 分位数回归, 回归, 数据, 租房, 租房价格

本文想在R软件中更好地了解分位数回归优化。在查看分位数回归之前，让我们从样本中计算中位数或分位数。

R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

By tecdat12月 15, 2020大数据部落, 数理统计, 机器学习, 机械工程及自动化, 电气工程及自动化, 计算机科学与技术GAM, R语言, SARIMA, SARIMAX, 分位数回归, 回归, 指数平滑, 时间序列, 样条曲线, 电力负荷, 预测

电力负荷预测是电网规划的基础，其水平的高低将直接影响电网规划质量的优劣。

R语言多项式线性模型：最大似然估计二次曲线

By tecdat12月 14, 2020大数据部落, 数理统计R语言, 二次曲线, 多项式, 最大似然估计, 线性模型

“应用线性模型”中，我们打算将一种理论（线性模型理论）应用于具体案例。

R语言用Garch模型和回归模型对股票价格分析

By tecdat12月 10, 2020大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术, 金融GARCH, R语言, 价格, 分析, 回归, 模型, 股票

为了找出影响价格波动的主要因素，我们使用逐步回归法来剔除一些对于应变量即把对价格影响很小的自变量剔除出我们的模型

R语言混合图形模型MGM的网络可预测性分析

By tecdat12月 9, 2020医药生物, 可视化和设计, 大数据部落, 数理统计, 计算机科学与技术MGM, R语言, 可预测性, 混合图形模型, 网络, 预测

网络模型已经成为抽象复杂系统，是深入了解许多科学领域中观测变量之间的关系模式的流行方法。

广义线性模型GLM、多项式回归和广义可加模型GAM预测泰坦尼克号幸存者

By tecdat12月 8, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术GAM, glm, R语言, 广义可加模型, 广义线性模型, 泰坦尼克号, 预测

本文通过R语言建立广义线性模型(GLM)、多项式回归和广义可加模型（GAM）来预测谁在1912年的泰坦尼克号沉没中幸存下来。

R语言对股票风险“溃疡指数”（ Ulcer Index）曲面图可视化

By tecdat12月 7, 2020保险, 可视化和设计, 大数据部落, 经济R语言, Ulcer Index, 可视化, 曲面图, 溃疡指数, 股票, 风险

目标函数的平滑度对于优化的成功至关重要。可视化目标函数是一种检查平滑度的简便方法。

R语言逻辑回归分析连续变量和分类变量之间的“相关性“

By tecdat12月 4, 2020数理统计, 计算机科学与技术R语言, 分类变量, 回归, 相关性, 连续变量, 逻辑回归

比如说分类变量为是否幸存、是因变量，连续变量为年龄、是自变量，这两者可以做相关分析吗？两者又是否可以做回归分析？

【视频讲解】R语言实现CNN（卷积神经网络）模型进行回归数据分析

By tecdat12月 3, 2020大数据部落, 数理统计, 机器学习, 特色视频, 计算机科学与技术CNN, R语言, 卷积神经网络, 回归, 深度学习, 神经网络

当我们将CNN（卷积神经网络）模型用于训练多维类型的数据（例如图像）时，它们非常有用。

R语言中的多项式回归、B样条曲线(B-spline Curves)回归

By tecdat12月 2, 2020大数据部落, 数理统计, 计算机科学与技术B-spline Curves, B样条曲线, R语言, 回归, 多项式, 样条曲线

我们首先讨论多项式回归，进一步，我们会想到分段线性或分段多项式函数，可能还有附加的连续性约束，这些是样条曲线回归的基础。

R语言方差分析（ANOVA）学生参加辅导课考试成绩差异

By tecdat12月 1, 2020大数据部落, 教育学, 数理统计, 计算机科学与技术ANOVA, R语言, 学生

方差分析是一种常见的统计模型，顾名思义，方差分析的目的是比较平均值。 WeChat Tencent QQ em

R语言人口期望寿命统计预测方法

By tecdat12月 1, 2020保险, 数理统计, 经济R语言, 期望寿命, 统计预测, 预测

本文对人口统计预测方法进行讨论。

R语言用多项式回归和ARIMA模型预测电力负荷时间序列数据

By tecdat11月 27, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术arima, R语言, 多项式回归, 数据, 时间序列, 电力消耗, 电力负荷, 电力负荷预测

根据我们对温度的预测，我们可以预测电力消耗。

R语言主题模型LDA评估公司面临的风险领域与可视化

By tecdat11月 26, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术LDA, R语言, 主题模型, 可视化, 文本挖掘, 风险

随着越来越多的数据被数字化，获取信息变得越来越困难。我们在本文中重点关注的一个示例是评估公司面临的不同风险领域。

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

By tecdat11月 24, 2020大数据部落, 数据库, 数理统计, 机器学习, 经济, 计算机科学与技术R语言, 信贷数据, 决策树, 分类, 逻辑回归, 随机森林, 预测

在本文中，我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。

R语言动量和马科维茨Markowitz投资组合模型实现

By tecdat11月 23, 2020大数据部落, 数理统计, 经济, 金融R语言, 动量, 投资组合, 模型, 马科维茨

动量和马科维茨投资组合模型使均值方差优化组合成为可行的解决方案。

R语言网络分析友谊悖论案例

By tecdat11月 20, 2020可视化和设计, 大数据部落, 数理统计, 机器学习, 计算机科学与技术R语言, 友谊悖论, 网络, 网络分析

本文简要介绍一下网络分析，我想提供一些有关“友谊悖论”的R语言例证。友谊悖论指出

R语言股市可视化相关矩阵：最小生成树

By tecdat11月 18, 2020可视化和设计, 数理统计, 经济, 金融R语言, 可视化, 最小生成树, 相关矩阵

本文在股市可视化中可视化相关矩阵：最小生成树

R语言中使用RCPP并行计算指数加权波动率

By tecdat11月 17, 2020大数据部落, 数理统计, 经济, 金融Rcpp, R语言, 波动率

指数加权波动率是一种波动率的度量，它使最近的观察结果有更高权重。

R语言使用Bass模型进行市场产品周期预测

By tecdat11月 11, 2020大数据部落, 数理统计, 经济Bass, R语言, 巴斯, 市场, 预测

巴斯Bass扩散模型已成功地用于预测各种新推出的产品以及成熟产品的市场份额。

R语言计量经济学与有时间序列模式的机器学习预测

By tecdat11月 9, 2020大数据部落, 数理统计, 机器学习, 经济, 计算机科学与技术R语言, 时间, 时间序列, 机器学习, 计量经济学

由于目标是预测理赔频率（以评估保险费水平），因此他建议使用旧数据来训练该模型，并使用最新数据对其进行测试。问题在于该模型没有包含任何时间模式。

R语言网络和网络流的可视化实践：通勤者流动网络

By tecdat11月 6, 2020可视化和设计, 大数据部落, 数理统计, 计算机科学与技术R语言, 可视化, 流动网络, 网络, 网络流, 通勤者

在现实世界中，我们的生活受到大量网络的支配。网络流可以表示很多模型，比如管道中的石油、高压线中电流，或者计算机网络中的数据。

R语言最大流最小割定理和最短路径算法分析交通网络流量拥堵问题

By tecdat11月 5, 2020地理，运输，旅行和物流, 大数据部落, 数理统计, 计算机科学与技术R语言, 交通网络, 最大流最小割定理, 最短路径, 流量, 算法

今天早上，我们使用一些论文中提到的示例，使用最大流最小割定理将流量拥塞降至最低，并应用了最短路径分析了交通瓶颈。

R语言时间序列：ARIMA / GARCH模型的交易策略在外汇市场预测应用

By tecdat11月 4, 2020大数据部落, 数理统计, 经济, 计算机科学与技术, 金融arima, GARCH, R语言, 交易策略, 外汇, 市场, 时间序列, 模型, 预测

最近，我们继续对时间序列建模进行探索，研究时间序列模型的自回归和条件异方差族。我们想了解自回归移动平均值（ARIMA）和广义自回归条件异方差（GARCH）模型。它们在量化金融文献中经常被引用。

【视频】R语言中的隐马尔可夫HMM模型实例

By tecdat11月 2, 2020大数据部落, 数理统计, 特色视频, 计算机科学与技术HMM, R语言, 模型, 隐马尔可夫, 马尔, 马尔可夫

最近，我们使用隐马尔可夫模型开发了一种解决方案，并被要求解释这个方案。

R语言基于Garch波动率预测的区制转移交易策略

By tecdat10月 28, 2020大数据部落, 数理统计, 经济, 金融GARCH, R语言, 交易策略, 区制转移, 波动, 波动率, 策略, 预测

本文提出了一种算法，可以根据市场波动性在均值回归和趋势跟随策略之间进行切换。

R语言有极值（EVT）依赖结构的马尔可夫链(MC)对洪水极值分析

By tecdat10月 22, 2020大数据部落, 数理统计, 计算机科学与技术EVT, MC, R语言, 极值, 极值分析, 洪水, 马尔可夫链

为了帮助客户正确使用POT模型，本指南包含有关使用此模型的实用示例。本文快速介绍了极值理论（EVT）、一些基本示例，最后则通过案例对河流的极值进行了具体的统计分析。

R语言Lee-Carter模型对年死亡率建模预测期望寿命

By tecdat10月 21, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术Lee-Carter, R语言, 寿命, 年死亡率, 建模, 预测

正如有配偶的寿命之间存在很强的相关性，我们可能会问，孩子和孙子的出生是否具有对一个人的剩余生命的影响（或者我们是否可以像这样假设独立性）。

R语言使用灰色关联分析中国经济社会发展指标

By tecdat10月 19, 2020数理统计, 经济, 计算机科学与技术R语言, 发展指标, 灰色关联分析, 社会, 经济

灰色关联分析包括两个重要功能。
第一项功能：灰色关联度，与correlation系数相似，如果要评估某些单位，在使用此功能之前转置数据。第二个功能：灰色聚类，如层次聚类。

R语言POT超阈值模型和极值理论分析

By 拓端tecdat10月 14, 2020大数据部落, 数理统计, 计算机科学与技术POT, R语言, 极值, 极值理论, 超阈值模型

POT模型其主要动机是为高洪水流量的概率模型提供实用工具。但是，EVT的优势在于结果不取决于要建模的过程。因此，人们可以使用POT来分析降水，洪水，金融时间序列，地震等。

如何从xml文件创建R语言数据框dataframe

By 拓端tecdat10月 12, 2020大数据部落, 技术支持, 数理统计dataframe, R语言, xml, 数据框

从这个XML文件中，我想创建一个具有ID，name 列的R数据框。请注意，name和ID应包含变量的所有级别。

Mac系统R语言升级后无法加载包报错 package or namespace load failed in dyn.load(file, DLLpath = DLLpath, …):

By 拓端tecdat10月 8, 2020大数据部落, 技术支持Mac, R语言, 加载包, 报错

我需要安装R软件包stochvol，该软件包仅适用于3.6.0版的R。

基于R语言股票市场收益的统计可视化分析

By tecdat9月 25, 2020可视化和设计, 大数据部落, 数理统计, 经济, 计算机科学与技术, 金融R语言, 可视化, 市场, 收益, 统计, 股票

最近我们被客户要求撰写关于分析各种投资的历史收益的研究报告。要执行此分析，我们需要资产的历史数据。数据提供者很多，有些是免费的，大多数是付费的。

R语言关联挖掘实例（购物篮分析）

By tecdat9月 23, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术Apriori, R语言, 关联挖掘, 购物篮, 购物篮分析

关联挖掘通常用于通过识别经常一起购买的产品来提出产品推荐。但是，如果您不小心，则规则在某些情况下可能会产生误导性的结果。

R语言POT超阈值模型在洪水频率分析中的应用研究

By tecdat9月 7, 2020地理，运输，旅行和物流, 大数据部落, 数理统计POT, R语言, 巨灾, 巨灾风险, 超阈值模型, 频率, 风险

结合POT模型的洪水风险评估能够从有限的实测资料中获取更多的洪水风险信息。

R语言使用bootstrap和增量法计算广义线性模型（GLM）预测置信区间

By tecdat9月 3, 2020大数据部落, 数理统计, 计算机科学与技术bootstrap, glm, R语言, 增量法, 广义线性模型, 置信区间

增量法使我们具有（渐近）正态性，因此一旦有了标准偏差，便可以得到置信区间。

R语言作图不显示中文解决办法，如何使用中文字体

By tecdat9月 1, 2020大数据部落, 技术支持, 计算机科学与技术R语言, 不显示中文, 中文, 作图

R语言绘图中的中文默认字体宋体，希望用其他字体绘图，保存成PDF格式不能识别中文。

使用markdown，knitr和pandoc在R语言中编写可重现的报告

By tecdat8月 25, 2020大数据部落, 技术支持, 计算机科学与技术, 软件工程markdown, pandoc, R语言, 报告

在本指南中，我们想向您展示如何使用现在提供的一些奇妙，免费的工具和软件包编写美观，可重复的报告。这些工具将帮助您交流科学知识，并希望您再也不会复制和粘贴R输出。

R语言中广义线性模型(GLM)中的分布和连接函数分析

By tecdat8月 21, 2020大数据部落, 数理统计, 机器学习glm, R语言, 分布, 广义线性模型, 线性, 连接函数

通常，GLM的连接函数可能比分布更重要。

R语言自适应平滑样条回归分析

By tecdat8月 19, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 回归, 平滑样条回归, 样条

一种类型的平滑称为样条平滑。柔性金属（通常是铅），可以用作绘制平滑曲线的参考。将选择一组点（称为结），然后将样条线压在特定的x，y点，然后弯曲以通过下一个点，依此类推。

R语言区间数据回归分析

By tecdat8月 19, 2020R语言辅导, 大数据部落, 数理统计, 计算机科学CS辅导R语言, 区间, 回归

回归分析是一种十分常见的数据分析方法,通过观测数据确定变量间的相互关系。传统回归分析以点数据为研究对象,预测结果也是点数据,而真实数据往往在一定范围内变动的。

R语言ggsurvplot绘制生存曲线报错 : object of type ‘symbol‘ is not subsettable

By tecdat8月 17, 2020大数据部落, 技术支持, 数理统计ggsurvplot, R语言, 报错, 生存曲线

WeChat Tencent QQ email print 由Kaizong Ye，Qing Li撰

R语言使用蒙特卡洛模拟进行正态性检验及可视化

By tecdat8月 14, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 可视化, 模拟, 正态, 蒙特卡洛

如何使用蒙特卡洛模拟来推导随机变量可能的分布，我们回到统计数据（无协变量）进行说明。

R软件SIR模型网络结构扩散过程模拟

By tecdat8月 13, 2020大数据部落, 数理统计, 计算机科学与技术R, R语言, R软件, SIR模型, 模型, 模拟, 网络

与普通的扩散研究不同，网络扩散开始考虑网络结构对于扩散过程的影响。这里介绍一个使用R模拟网络扩散的例子。

R语言缺失值的处理：线性回归模型插补

By tecdat8月 6, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 回归, 插补, 线性, 线性回归模型, 缺失值

在当我们缺少值时，系统会告诉我用-1代替，然后添加一个指示符，该变量等于-1。这样就可以不删除变量或观测值。

R语言Markowitz马克维茨投资组合理论分析和可视化

By tecdat7月 25, 2020大数据部落, 数理统计, 经济, 计算机科学与技术, 金融R语言, 可视化, 马克维茨

至少在统计学的角度上，要评估一个投资组合是否最优是很困难的。

R语言逻辑回归和泊松回归模型对发生交通事故概率建模

By tecdat7月 21, 2020保险, 数理统计, 经济, 计算机科学与技术R语言, 交通事故, 保险, 回归, 泊松, 逻辑回归

我们已经看到了如何考虑风险敞口，计算包含风险敞口的多个数量（经验均值和经验方差）的非参数估计量。让我们看看如果要对二项式变量建模。

R语言中自编基尼系数的CART回归决策树的实现

By tecdat7月 10, 2020大数据部落, 数理统计, 机器学习, 计算机科学与技术CART, CART回归决策树, R语言, 决策树, 回归, 基尼系数

这里的想法是使距离最大化：想法是区分，所以我们希望样本尽可能不独立。要计算基尼系数。

R语言多分类logistic逻辑回归模型在混合分布模拟个人风险损失值评估的应用

By tecdat7月 7, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术Logistic, R语言, 个人风险损失值, 单个风险损失值, 回归, 多分类logistic逻辑回归, 混合分布, 逻辑回归

通常，我们在回归模型中一直说的一句话是“ 请查看一下数据 ”。

R语言时间序列数据指数平滑法分析交互式动态可视化

By tecdat7月 4, 2020可视化和设计, 大数据部落, 数理统计, 计算机科学与技术R语言, 交互式, 动态, 可视化, 指数平滑法, 数据, 时间序列

R语言提供了丰富的功能，可用于绘制R中的时间序列数据。

广义线性模型索赔频率预测：过度分散、风险暴露数和树状图可视化

By tecdat7月 3, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术, 金融R语言, 可视化, 广义线性模型, 树状图, 过度分散, 风险暴露

在精算科学和保险费率制定中，考虑到风险敞口可能是一场噩梦。不知何故，简单的结果是因为计算起来更加复杂，只是因为我们必须考虑到暴露是一个异构变量这一事实。

R语言通过伽玛与对数正态分布假设下的广义线性模型对大额索赔进行评估预测

By tecdat7月 1, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术R语言, 对数正态分布, 广义线性模型, 线性模型, 预测

我们已经很自然地认为，不仅可以用一些协变量来解释单个索赔的频率，而且可以用单个成本来解释。

R语言精算学：使用链梯法Chain Ladder和泊松定律模拟和预测未来赔款数据

By tecdat6月 24, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术, 金融Chain Ladder, R语言, 保险, 泊松, 精算学, 赔款, 链梯法

使用Chain Ladder方法完成流量三角形，即计算我们认为未来几年将支付的平均金额

R语言中回归模型预测的不同类型置信区间应用比较分析

By tecdat6月 22, 2020大数据部落, 数理统计, 计算机科学与技术R语言, 回归, 线性, 置信区间

当我们要为预测提供一个置信区间时，建议您为预测器确定置信区间参数的估计和潜在值的置信区间。

R语言中的广义线性模型（GLM）和广义相加模型（GAM）：多元（平滑）回归分析保险资金投资组合信用风险敞口

By tecdat6月 18, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术, 金融GAM, glm, R语言, 保险, 信用风险敞口, 回归, 投资组合, 线性模型

在之前的课堂上，我们已经看到了如何可视化多元回归模型（带有两个连续的解释变量）。

R语言对巨灾风险下的再保险合同定价研究案例：广义线性模型和帕累托分布Pareto distributions分析

By tecdat6月 15, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术Pareto distributions, R语言, 保险, 再保险合同定价, 巨灾风险, 帕累托分布, 广义线性模型, 线性模型

本文为非人寿保险课程的一部分，该示例对1900 -2005年间的“ 美国标准化飓风损失 ”数据集进行研究（2008）。我们使用了广义线性模型和帕累托分布Pareto distributions分析。

R语言中GLM(广义线性模型)，非线性和异方差可视化分析

By tecdat6月 12, 2020保险, 可视化和设计, 大数据部落, 数理统计, 经济, 计算机科学与技术glm, R语言, 可视化, 回归, 广义线性模型, 异方差, 线性模型, 非线性

上周在非人寿保险课程中，我们了解了广义线性模型的理论

如何用R语言绘制生成正态分布图表

By tecdat6月 10, 2020可视化和设计, 大数据部落, 数理统计, 计算机科学与技术R语言, 图表, 正态分布

在概率课程中经常会看到标准的正态分布表。

R语言蒙特卡洛计算和快速傅立叶变换计算矩生成函数

By tecdat6月 7, 2020保险, 大数据部落, 数理统计, 经济, 计算机科学与技术, 金融R语言, 傅立叶变换, 矩生成函数, 蒙特卡洛

对精算科学来说，当我们处理独立随机变量的总和时，特征函数很有趣，因为总和的特征函数是特征函数的乘积。

R语言预测人口死亡率：用李·卡特（Lee-Carter）模型、非线性模型进行平滑估计

By tecdat6月 2, 2020大数据部落, 数理统计, 经济, 计算机科学与技术Lee-Carter, R语言, 人口死亡率, 平滑估计, 李·卡特模型, 模型, 死亡率, 非线性模型, 预测

我和同事一起分析死亡率。我们在研究人口数据集，可以观察到很多波动性。

Tag Archives: R语言

关注我们，永远不要错过任何见解。