特征提取与选择 总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章特征提取与选择_总结
7.6 特征选择中的直接挑选法
特征的选择除了我们前面学习的变换法外, 也可以在原坐标系中依据某些原则直接选择特征, 即我们这节课要学的直接挑选法。
7.6.1次优搜索法
(一)单独最优的特征选择
单独选优法的基本思路是计算各特征单独使用时的判据值并以递减排序,选取前d个分类效果最好的特征。一般地讲,即使各特征是统计独立的,这种方法选出的d个特征也不一定是最优的特征组合,只有可分性判据J是可分的,即
这种方法才能选出一组最优特征。
(二)增添特征法
该方法也称为顺序前进法(SFS)这是最简单的自下而上搜索方法,每次从未选入的特征中选择一个特征,使它与已选入的特征组合在一起时J值最大,直到选入特征数目达到指定的维数d为止。
设已选入了k个特征,它们记为X k,把未选入的n-k个特征x j(j=1,2,…,n-k)逐个与已选入的特征X k组合计算J 值,若:
则x1选入,下一步的特征组合为X k+1=X k+x1。开始时,k=0,X0=F,该过程一直进行到k=d为止。
该方法比“单独最优的特征选择法”要好,但其缺点也是明显的:即某特征一旦选入,即使后边的n-k特征中的某个从组合讲比它好,也无法把它剔除。
(三)剔减特征法
该方法也称为顺序后退法(SBS)。这是一种自上而下的搜索方法,从全部特征开始每次剔除一个特征,所剔除的特征应使尚保留的特征组合的值最大。
设已剔除了k个特征,剩下的特征组记为,将中的各特征x j (j=1,2,…,n-k)分别逐个剔除,并同时计算值,若:
则在这轮中x1应该剔除。
这里初值,过程直到k=n-d为止。
(四) 增l 减r 法(l-r 法)
为了克服前面方法(二)、(三)中的一旦某特征选入或剔除就不能再剔除或选入的缺点,可在选择过程中加入局部回溯,例如在第k步可先用方法(二)。,对已选入的k个特征再一个个地加入新的特征到k+1个特征,然后用方法(三) 一个个地剔除r个特征,称这种方法为l减r法(l-r法)。
7.6.2最优搜索法
(一)分支定界法(BAB算法)
寻求全局最优的特征选择的搜索过程可用一个树结构来描述,称其为搜索树或解树。总的搜索方案是沿着树自上而下、从右至左进行,由于树的每个节点代表一种特征组合,于是所有可能的组合都可以被考虑。利用可分性判据的单调性采用分支定界策略和值左小右大的树结构,使得在实际上并不计算某些特征组合而又不影响全局寻优。这种具有上述特点的快速搜索方法,称为分支定界算法。
6选2的特征选择问题 (a)搜索树 (b)搜索回溯示意图
树的每个节点表示一种特征组合,树的每一级各节点表示从其父节点的特征
组合中再去掉一个特征后的特征组合,其标号k表示去掉的特征是。由于每一级只舍弃一个特征,因此整个搜索树除根节点的0级外,还需要n-d级,即全树有n-d级。6个特征中选2个,故整个搜索树需4级,第n-d级是叶节点,有
个叶节点。
表示特征数目为l 的特征集合。
表示舍弃s 个特征后余下的特征集合。
表示第s级当前节点上用来作为下一级可舍弃特征的特征集合。
表示集合中元素的数目。
表示当前节点的子节点数。
由于从根节点要经历n-d级才能到达叶节点,s级某节点后继的每一个子节
点分别舍弃中互不相同的一个特征,从而考虑在s+1级可以舍弃的特征方案
数(即其子节点数)时,必须使这一级舍弃了特征后的还剩(n-d)-(s+1)个特征。除了从树的纵的方向上一级丢弃一个特征,实际上从树的横的方向上,一个分支也轮换丢弃一个特征。因此后继子节点数。
我们的目的是求出叶节点对应的所有可能的d个特征组合使得判据J的值最大。注意到每个节点都可以计算相应的J值。由于判据J值的单调性,使得:
上面的不等式表明,任何节点的J值均大于它所属的各子节点的J值。
搜索过程是从上至下、从右至左进行。
四个步骤:
1、向下搜索
2、更新界值
3、向上回溯
4、停止回溯再向下搜索
向下搜索:
开始时置界值B=0
从树的根节点沿最右边的一支自上而下搜索。对于一个节点,它的子树最右边的一支总是无分支的,即是1度节点或0节点(叶节点)。此时可直接到达叶节点,计算该叶节点的J值,并更新界值B。即图中的虚线可省略而得到最小搜索树。
最小搜索树
向上回溯和停止回溯:
回溯到有分支的那个节点则停止回溯转入向下搜索。
例如回溯到q s-1>1 的那个节点,则转入s深度的左边的最近的那个节点,使该节点成为当前节点,按前面的方法沿它最右边的子树继续搜索。
在搜索过程中先要判一下该节点的J值是否比B值大。若不大于B值,该节点以下的各子节点J值均不会比B大,故无需对该子树继续进行搜索。
如果搜索到叶节点,且该叶节点代表的特征的可分性判据J值大于B,则更新界值,即B=J;否则不更新界值。
显然到达叶节点后,要向上回溯。重复上述过程,一直进行到J值不大于当前界值B为止。而对应的最大界值B的叶节点对应的d个特征组合就是所求的最优的选择。
该算法的高效性能原因在于如下三个方面:
(1)在构造搜索树时,同一父节点的各子节点为根的各子树右边的边要比左边的少,即树的结构右边比左边简单;
(2)在同一级中按最小的J值从左到右挑选舍弃的特征,即节点的J值是左小右大,而搜索过程是从右至左进行的;
(3)因J的单调性,树上某节点如A的可分性判据值,则A的子树上各节点的J值都不会大于B,因此该子树各节点都可以不去搜索。
从(1) 、(2)和(3)可知,有很多的特征组合不需计算仍能求得全局最优解。