700字范文 > 特征选择之Relief算法与Relief-F算法

特征选择之Relief算法与Relief-F算法

时间：2020-11-29 16:20:07

一、背景介绍二、Relief算法三、Relief-F算法参考资料

一、背景介绍

Relief算法是由Kira提出的一种经典的过滤式特征选择算法，其通过相关统计量度量特征的重要程度，只适用于二分类问题。相应的，针对多分类问题，Kononeill对Relief算法进行了改进，得到了适用于多分类问题的Relief-F算法。

二、Relief算法

Relief算法步骤如下：

给定训练样本集{(x1,y1),(x2,y2),…(xm,ym)}，对于每个样本xi：（1）先在其同类样本中寻找最近邻xi,nh，称为“猜中近邻”（near-hit）;（2）再在其异类样本中寻找最近邻xi,nm，称为“猜错近邻”（near-miss）;（3）计算相关统计量对应于属性j的分量：

其中diff(xja,xjb)取决于属性j的类型：

①若属性j为离散型，则xja=xjb时，diff(xja,xjb)=0，否则为1；

②若属性j为连续型，则diff(xja,xjb)=|xja-xjb|，且xja,xjb已规范化到[0,1]区间。（4）将基于不同样本得到的估计结果取均值。