Python银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机svm分析营销活动数据

视频

逻辑回归Logistic模型原理和R语言分类预测冠心病风险实例

3.python中使用scikit-learn和pandas决策树

输入变量
银行客户数据
1 – 年龄(数字)
2 – 工作：工作类型（分类：’行政’、’蓝领’、’企业家’、’女佣’、’管理’、’退休’、’自雇’、’服务’、’学生’、’技术员’、’失业’、’未知’)
3 – 婚姻：婚姻状况（分类：’离婚’、’已婚’、’单身’、’不详’；注：’离婚’指离婚或丧偶）。
4 – 教育（分类：’基础4年’、’基础6年’、’基础9年’、’高中’、’文盲’、’专业课程’、’大学学位’、’未知’)
5 – 违约：是否有违约的信贷？(分类: ‘没有’, ‘有’, ‘未知’)
6-住房：是否有住房贷款？(分类: ‘否’, ‘是’, ‘未知’)
7 – 贷款：有个人贷款吗？
8 – contact: 联系通信类型（分类：’手机’, ‘电话’）。
9 – 月：最后一次联系的年份月份（分类：’一月’, ‘二月’, ‘三月’, …, ‘十一月’, ‘十二月’)
10 – day\_of\_week：最后一次联系的星期（分类：’mon’, ‘tue’, ‘wed’, ‘thu’, ‘fri’)
11 – 持续时间：最后一次联系的持续时间，以秒为单位（数字）。
12 – 活动：在这个活动期间为这个客户进行的接触次数（数字，包括最后一次接触）。
13 – pdays: 在上次活动中最后一次与客户联系后的天数（数字，999表示之前没有与客户联系）。
14 – 以前：在这次活动之前，为这个客户进行的接触次数（数字）。
15 – 结果：上次营销活动的结果（分类：”失败”、”不存在”、”成功”）。

社会和经济背景属性
16 – emp.var.rate：就业变化率–季度指标（数值）。
17 – cons.price.idx：消费者价格指数–月度指标（数值）。
18 – cons.conf.idx：消费者信心指数–月度指标（数字）。
19 – euribor3m：银行3个月利率–每日指标(数值)
20 – nr.employed: 雇员人数 – 季度指标(数字)

输出变量（所需目标）：

y – 客户是否认购了定期存款？(二进制: ‘是’, ‘否’)

data.head(5)

我们的下一步是查看变量的形式以及是否存在缺失值的问题。

df1 = data.dtypes
df1

最受欢迎的见解

1.从决策树模型看员工为什么离职

2.R语言基于树的方法：决策树，随机森林

4.机器学习：在SAS中运行随机森林数据分析报告

5.R语言用随机森林和文本挖掘提高航空公司客户满意度

6.机器学习助推快时尚精准销售时间序列

7.用机器学习识别不断变化的股市状况——隐马尔可夫模型的应用

8.python机器学习：推荐系统实现（以矩阵分解来协同过滤）

9.python中用pytorch机器学习分类预测银行客户流失

df2 = data.isnull().sum() 
df2

视频

贝叶斯推断线性回归与R语言预测工人工资数据

我们的下一步是计算所有变量的值。

data\['y'\].value_counts()

data\['job'\].value_counts()

Python中用PyTorch机器学习神经网络分类预测银行客户流失模型

阅读文章 ➜

data\['marital'\].value_counts()

data\['education'\].value_counts()

data\['housing'\].value_counts()

视频

从决策树到随机森林：R语言信用卡违约分析信贷数据实例