ML之shap:基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之详细攻略
目录
基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性
# 1、定义数据集
# 2、数据预处理
# 2.1、分离特征与标签
# 3、模型建立和训练
# 3.1、数据集切分# 3.2、模型训练
# 4、模型特征重要性解释可视化
# 4.1、单个样本基于shap值进行解释可视化
# (1)、挑选某条样本数据并转为array格式
# (2)、利用Shap值解释RFC模型
# T1、基于树模型TreeExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)
# T2、基于核模型KernelExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)
# 4.2、多个样本基于shap值进行解释可视化
# (1)、基于树模型TreeExplainer创建Explainer并计算SHAP值
# (2)、全验证数据集样本各特征shap值summary_plot可视化
# (3)、依赖关系贡献图dependence_plot可视化
相关文章
ML:机器学习可解释性之SHAP值之理解单样本单特征预测
ML之shap:基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性之详细攻略
ML之shap:基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性之详细攻略实现
相关文章
ML之PDP:基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略
ML之PDP:基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用DT决策树&RF随机森林+PDP部分依赖图可视化实现模型可解释性之详细攻略实现
基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图可视化实现可解释性
# 1、定义数据集
数据集来源:Dataset:FIFA Statistics数据集(Predict FIFA Man of the Match预测国际足联最佳球员)的简介、下载、使用方法之详细攻略_一个处女座的程序猿的博客-CSDN博客
# 2、数据预处理
# 2.1、分离特征与标签
df_X Goal Scored Ball Possession % Attempts ... Yellow & Red Red Goals in PSO0 5 40 13 ... 0 0 01 0 60 6 ... 0 0 02 0 43 8 ... 0 0 03 1 57 14 ... 0 0 04 0 64 13 ... 0 0 0[5 rows x 18 columns]df_y 0True1 False2 False3True4 FalseName: Man of the Match, dtype: bool
# 3、模型建立和训练
# 3.1、数据集切分
# 3.2、模型训练
# 4、模型特征重要性解释可视化
# 4.1、单个样本基于shap值进行解释可视化
# (1)、挑选某条样本数据并转为array格式
输出当前测试样本:5 Goal Scored 2Ball Possession %38Attempts 13On-Target 7Off-Target 4Blocked 2Corners 6Offsides1Free Kicks 18Saves 1Pass Accuracy % 69Passes399Distance Covered (Kms) 148Fouls Committed 25Yellow Card 1Yellow & Red0Red0Goals in PSO3Name: 118, dtype: int64输出当前测试样本的真实label: False输出当前测试样本的的预测概率: [[0.29 0.71]]
输出当前测试样本:7 Goal Scored 0Ball Possession %53Attempts 16On-Target 4Off-Target 10Blocked 2Corners 7Offsides1Free Kicks 20Saves 1Pass Accuracy % 77Passes466Distance Covered (Kms) 107Fouls Committed 23Yellow Card 1Yellow & Red0Red0Goals in PSO0Name: 35, dtype: int64输出当前测试样本的真实label: False输出当前测试样本的的预测概率: [[0.56 0.44]]
# (2)、利用Shap值解释RFC模型
# T1、基于树模型TreeExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)
# T2、基于核模型KernelExplainer创建Explainer并计算SHAP值,且进行单个样本力图可视化(分析单个样本预测的解释)
# 4.2、多个样本基于shap值进行解释可视化
# (1)、基于树模型TreeExplainer创建Explainer并计算SHAP值
# (2)、全验证数据集样本各特征shap值summary_plot可视化
# (3)、依赖关系贡献图dependence_plot可视化
ML之shap:基于FIFA Statistics(俄罗斯世界杯足球赛)球队比赛之星分类预测数据集利用RF随机森林+计算SHAP值单样本力图/依赖关系贡献图可视化实现可解释性之攻略