Python信贷冷启动信用风险评估:WOE编码、IV筛选、代价敏感学习与逻辑回归稀疏样本建模 | 附代码数据
在金融科技浪潮中,新产品迭代加速,但历史数据的缺失让风控模型陷入“巧妇难为无米之炊”的窘境——违约样本稀疏、分布偏移严重,传统依赖大样本的建模范式频频失效。这好比用旧地图探索新大陆,结果自然不尽人意。
在金融科技浪潮中,新产品迭代加速,但历史数据的缺失让风控模型陷入“巧妇难为无米之炊”的窘境——违约样本稀疏、分布偏移严重,传统依赖大样本的建模范式频频失效。这好比用旧地图探索新大陆,结果自然不尽人意。
变量选择是高维统计建模的重要组成部分。
结构方程模型是一个线性模型框架,它对潜变量同时进行回归方程建模。
在数据科学学习之旅中,我经常处理日常工作中的时间序列数据集,并据此做出预测。
正如有配偶的寿命之间存在很强的相关性,我们可能会问,孩子和孙子的出生是否具有对一个人的剩余生命的影响(或者我们是否可以像这样假设独立性)。
在保险定价中,风险敞口通常用作模型索赔频率的补偿变量。
我们将首先介绍主题建模和t-SNE,然后将这些技术应用于两个数据集:20个新闻组和推文。

技术干货

最新洞察

视频号
This will close in 0 seconds