使用随机森林度量特征重要性的方法在此介绍两种:
通过基尼指数计算节点的不纯度衡量特征重要性在节点t使用属性a作为划分属性,估计属于不同类的概率,使用p(k|t),k=1,…,Q表示,基尼指数的定义为:
Q是样本种类数。在使用属性Xj作为划分属性时,计算划分之前与划分之后的基尼指数(表示不确定性程度)之差,使用表示,表示平均减少基尼指数。通过袋外数据的误差OOB(out-of-bag)衡量特征重要性
时间:2022-04-23 06:51:31
在节点t使用属性a作为划分属性,估计属于不同类的概率,使用p(k|t),k=1,…,Q表示,基尼指数的定义为:
Q是样本种类数。在使用属性Xj作为划分属性时,计算划分之前与划分之后的基尼指数(表示不确定性程度)之差,使用表示,表示平均减少基尼指数。通过袋外数据的误差OOB(out-of-bag)衡量特征重要性
python随机森林特征重要性_Python中随机森林回归的特征重要性
2022-04-10
python随机森林特征重要性原理_使用Python的随机森林特征重要性图表
2019-06-27
随机森林特征重要性计算_R语言随机森林模型中具有相关特征的变量重要性
2018-09-15