Category Archives: 数理统计

R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化

信用风险建模是金融领域的重要课题,通过建立合理的信用风险模型,可以帮助金融机构更好地评估借款人的信用状况,从而有效降低信贷风险。

数据分享|AARRR模型淘宝用户行为分析、电商销售分析

随着互联网、5G时代到来,大数据横空出世,数据变得越来越重要,如何针对业务问题和需求 ,提取有效特征数据并对问题进行深入分析,最终得到可靠的结论是数据分析最核心的环节,只有得出正确的结论才能对症下药,提出正确的方案,为产品运营提供有力支撑;

数据分享|python分类预测职员离职:逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM交叉验证可视化

离职率是企业保留人才能力的体现。分析预测职员是否有离职趋向有利于企业的人才管理,提升组织职员的心理健康,从而更有利于企业未来的发展。

Python用偏最小二乘回归Partial Least Squares,PLS分析桃子近红外光谱数据可视化

PLS,即偏最小二乘(Partial Least Squares),是一种广泛使用的回归技术,用于帮助客户分析近红外光谱数据。

数据分享|Eviews用ARIMA、指数曲线趋势模型对中国进出口总额时间序列预测分析

众自20世纪80年代至今,随着改革开放的深入以及中国最终加入WTO,我国的对外贸易实现了跨越式的发展,中国已经成为世界第一大出口国和第二大进口国,中国经济对世界经济做出了重大贡献。

疫情期间航空网络演变复杂网络可视化

COVID-19对航空网络的拓扑结构和属性都有很大的影响,其影响的结果表现在网络鲁棒性、连通性和活动性的下降,以及疫情区域的航空网络状态的变化。

数据分享|R语言逐步回归模型对电影票房、放映场数、观影人数预测可视化

本文通过利用回归模型帮助客户对电影的票房数据(以及放映场数,观影人数)进行了研究,确定了决定电影的票房的重要因素。

MATLAB热传导方程模型最小二乘法模型、线性规划对集成电路板炉温优化

集成电路板等电子产品生产中,控制回焊炉各部分保持工艺要求的温度对产品质量至关重要。

Matlab决策树、模糊C-均值聚类算法分析大学教师职称学历评分可视化

本文使用Matlab编程语言中的决策树和模糊C-均值聚类算法,帮助客户对大学教师职称、学历与评分之间的关系进行深入分析。

数据分享|SQL Server、Visual Studio、tableau对信贷风险数据ETL分析、数据立方体构建可视化

追求信贷规模的扩张,往往会导致贷款逾期率的不断增加,如何在当今社会运用数据识别用户特征进行风险管控成为了银行放贷的重点依据。

R语言对面板数据:含时间固定效应混合效应回归分析交通死亡率、酒驾法和啤酒税

面板数据回归可以缓解省略变量偏误的问题,特别是当没有既与感兴趣的回归变量相关又与依赖变量相关的变量信息时,并且这些变量在时间或实体维度上是恒定的。

R语言非线性动态回归模型ARIMAX、随机、确定性趋势时间序列预测个人消费和收入、用电量、国际游客数量

传统时间序列模型允许包含过去观察到的系列信息,但不允许客户包含其他可能相关的信息。

Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数股票价格时间序列数据波动性可视化

随机波动模型(Stochastic volatility models)经常被客户用来对股票价格随时间的变动性进行建模。

R语言非线性回归和广义线性模型:泊松回归、伽马回归、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂锻炼钠摄入数据

我们使用广义线性模型(Generalized Linear Models,简称GLM)来研究客户的非正态数据,并探索非线性关系。

R语言非线性方程数值分析生物降解、植物生长数据:多项式、渐近回归、负指数方程、幂函数曲线、米氏方程、逻辑曲线、Gompertz、Weibull曲线

在选择最佳拟合实验数据的方程时,可能需要一些经验。当我们没有文献信息时该怎么办?

R语言分析糖尿病数据:多元线性模型、MANOVA、决策树、典型判别分析、HE图、Box’s M检验可视化

Reaven和Miller(1979)研究了145名非肥胖成年人的葡萄糖耐量和胰岛素血液化学指标之间的关系。

Python用GAN生成对抗性神经网络判别模型拟合多维数组、分类识别手写数字图像可视化

生成对抗网络(GAN)是一种神经网络,可以生成类似于人类产生的材料,如图像、音乐、语音或文本。

数据代码分享|R语言lasso回归、贝叶斯分析员工满意度调查数据、缺失值填充

员工满意度对于组织绩效和竞争力具有重要影响,因此准确了解员工满意度的影响因素和有效管理成为管理者的关键任务。

Read More

R语言组lasso改进逻辑回归变量选择分析高血压、易感因素、2型糖尿病和LDL可视化

本文用逻辑回归和lasso算法医学上的疾病的相关因素,帮助客户确定哪种模型可用于某种疾病的相关因素分析。

R语言IMDb TOP250电影特征数据挖掘可视化分析受众偏好、排名、投票、评分

本文首先介绍了IMDb(互联网电影资料库) TOP250及其排名算法、评分机制利弊,帮助客户通过分析《黑暗骑士》、《肖申克的救赎》和《教父》三部影片在2008年7月至9月评分数据,分析排名变动的原因。

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498