消费者今天会订阅多个电信服务(电视、付费节目、游戏等)。然而电信供应商提供的服务的差异化程度不高,客户忠诚度成为问题。
因此,电信公司主动识别有流失倾向的客户,并采取预防措施来保留这些客户变得越来越重要。
基于以上背景,tecdat研究人员对16年至今的电信用户流失数据进行分析,并建立预测模型,识别出流失概率很高的客户群体,同时找出哪些用户特征(“X”)对用户流失(“Y”)会有重大影响。
▼
▍数据概览
使用收视服务的用户最多,订阅付费节目其次,订阅游戏业务用户数量最少。
订阅收视业务的用户增长最快,其次是订阅游戏业务的用户,而订阅付费节目的用户增长缓慢,同时流失严重。
相比较16年,用户净增长37%,然而17年上半年的流失比例相比较去年增加8%。
▍不同维度的流失率比较
我们比较了不同营业厅和是否发放数字机顶盒的用户流失情况。
可以看到相比较发放了数字机顶盒的用户来说,没有发放机顶盒的用户更容易流失。
从不同营业厅的流失情况来看,沙河站和南口站的流失率最高,昌平站和小汤山站的流失率较低。
▍用户流失预测模型
然后,我们使用DT算法分析电信客户特征的特点,并获得流失客户的基本特征,分析客户的行为特征,采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。
▍技术
DT(decision tree)用于构建、验证和测试数据集的模型。
在Spark / MLLib / Scikit-Learn / HDFS中重构实现处理较大的数据集。
▍结果
模型预测客户流失的精度精度达到93.2%。
影响客户流失或对“Y”产生重大影响的关键变量有:
营业厅的位置
是否发放数字机顶盒
在分析客户的行为特征之后,我们采取有针对性的措施,改善客户关系,避免 客户损失或留住客户,达到补救的效果。
可下载资源
关于作者
Kaizong Ye是拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。
本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。
非常感谢您阅读本文,如需帮助请联系我们!