![模式识别](https://wfqqreader-1252317822.image.myqcloud.com/cover/195/37669195/b_37669195.jpg)
4.2 Fisher线性判别函数
Fisher 线性判别分析是R.A.Fisher于1936年提出来的方法[2]。两类的线性判别问题可以看作把所有样本都投影到一个方向上,然后确定一个分类的阈值。过了这个阈值点且与投影方向垂直的超平面就是两类样本的分类面。如何通过不同投影方向成功地将两类样本分开?
从图4-7中可以看出,按图4-7(a)所示的方向投影后,两类样本混在一起,而按图4-7(b)所示的方向投影后,两类样本很容易区分。显然,图4-7(b)所示的投影方向是更好的选择。Fisher线性判别的思想就是选择投影方向,使得投影后两类样本相隔尽可能远,同时使同一类别的样本尽可能聚集。
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_67.jpg?sign=1739174271-dYqw4XHbSmHcRqfPcSskNXvavQhAKNwg-0-fa428a748b9e71ae0844bf161405fa2a)
图4-7 样本投影后的区分程度比较
这里只讨论两类分类的问题。设训练样本集={x1,…,xN},每个样本是一个d 维向量,其中第一类样本
=
,第二类样本
=
。找一个投影方向
(
也是d维向量),投影以后的样本变为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_75.jpg?sign=1739174271-vEQqR7GpeTZ7PQSTlDHp16C0PANfs2m8-0-05e2054edf597e1d7124abd5b9cce18c)
(4-10)
其中,i=1,2,…,N。在原样本空间中,类均值向量为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_76.jpg?sign=1739174271-K77q38oWzgkzFEsJXBWxJexamZvKeEz5-0-1587d669bae639f30e8b1ec46a2e8c52)
(4-11)
其中,i=1,2。定义各类的类内离散度矩阵(Within-Class Scatter Matrix),即样本协方差矩阵为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_77.jpg?sign=1739174271-QISj9k5p6Pcg0RtXc1iTs6ZsDljUyRmD-0-664962d907e8388178594a0b0669ef47)
(4-12)
总类内离散度矩阵(Pooled Within-Class Scatter Matrix)为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_78.jpg?sign=1739174271-J97oHYMFNu0adXb2Cyke9cXGidHo4AqE-0-39f785e8cb8f6e5720bd53d9fbd1fcf9)
(4-13)
类间离散度矩阵(Between-Class Scatter Matrix)为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_79.jpg?sign=1739174271-g9Vez9y3kjkckJe0IOkHxUmxBOAefZhL-0-5d7bfd7706ec371eddb9778ec79e4648)
(4-14)
在投影后的一维空间中,两类的均值分别为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_80.jpg?sign=1739174271-316aB87boNEHwqK4kuXooeVYkBufpUuz-0-212d4b1d3941d2a3c896ba7272db4a19)
(4-15)
其中,i=1,2。此时,类内离散度为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_81.jpg?sign=1739174271-J07z4vy5X9S1XSkByIIAA7iiYeRN9Hmo-0-211425d9d2b70a1230a5f8c63a2b049a)
(4-16)
其中,i=1,2。总类内离散度为,而类间离散度就成为两类均值差的平方,即
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_83.jpg?sign=1739174271-Y8YlzVYxzGvKZjjcTO6mNfge3yWAB72P-0-11509c6d4a5f71c4c2940fa2e9bfb543)
(4-17)
因为人们希望寻找到的投影方向可使投影后的两类样本尽可能分开,而各类内部又尽可能聚集,所以这一目标可以表示成如下的函数。
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_84.jpg?sign=1739174271-TDlXqJpvdXgWEBv3AQTiIStL08zR0PiW-0-c3ded82e3f5521962c6ee6268c688e4d)
(4-18)
这就是Fisher判别函数。
把式(4-10)代入式(4-16)和式(4-17)得到
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_85.jpg?sign=1739174271-IBv3Tf7f5eu7kGcdT6sDObrPvS3JyNmn-0-8b9f717f4b62167afad6c5ab31b15839)
(4-19)
以及
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_86.jpg?sign=1739174271-7gZd5laODXJ3VGqqbecnKhTg0BnVYjlf-0-3b12417b03daa0f7787caf95eedd12a4)
(4-20)
因此Fisher判别函数变为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_87.jpg?sign=1739174271-CFGD0WkvtlYgIRbocyIFNLpg8qaCnxTz-0-0a3dcb23bad1373bf1cd4eb6417b5e1f)
(4-21)
应注意到,我们的目的是求使式(4-21)最大的投影方向。由于对
幅值的调节并不会影响
的方向,即不会影响
的值。因此,可以设定式(4-21)的分母为非零常数而最大化分子部分,即把式(4-21)的优化问题转化为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_92.jpg?sign=1739174271-KzUIKRg5sHa2OLTmH00HhP6jJvjBLfS2-0-277f2a71ac8c6c2418bc79106045aa84)
(4-22)
这是一个等式约束下的极值问题,可以通过引入拉格朗日(Lagrange)乘子转化成以下拉格朗日函数的无约束极值问题。
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_93.jpg?sign=1739174271-B9D5tz7eT9O2NBDiVPSgP630MFLKr7zr-0-200da2df628f190e31c7625f23fb811e)
(4-23)
在式(4-23)的极值处应满足
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_94.jpg?sign=1739174271-cq4Vl1nOMQsTUOfwa7SHTHknPmUKnIX4-0-fc9424d777dc7a9113a9c51f5e83db4e)
(4-24)
由此可得,极值解应满足
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_96.jpg?sign=1739174271-1sadrOT8t4b2tgwJvBPCqeHFDJDs7Va0-0-aa92c80ca0e7b4971c9bf85af9ea9b3a)
(4-25)
假定是非奇异的,把式(4-14)变为
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_98.jpg?sign=1739174271-uobHyZIBzgqEyZfYBen1Ftv5MYNaAFHY-0-a2da184089c2f9e5c149a2831c97dd55)
(4-26)
其中,的方向是由
决定的。我们要求解的是
的方向,因此可以取
![img](https://epubservercos.yuewen.com/738614/19938710408149206/epubprivate/OEBPS/Images/txt004_102.jpg?sign=1739174271-7Xi9eEje2OswU0Ucd1MeSzWOFvLr0xav-0-8744fb8b3fa2af7861c2e1f822a3a10c)
(4-27)
这就是Fisher判别准则下的最优投影方向。
需要注意的是,Fisher线性判别函数最优的解本身只给出了一个投影方向,并没有给出我们要的决策面,想要得到决策面,需要在投影后的一维空间上确定一个分类阈值。若不考虑先验概率的不同,则可以采用阈值
,其中
是所有样本在投影后的均值。
直观地解释,Fisher线性判别就是把待决策的样本投影到Fisher线性判别的方向上,通过与两类均值投影的平分点进行比较做出分类判别。在先验概率相同的情况下,以该平分点为两类样本的分界点;在先验概率不同的情况下,分界点向先验概率小的一侧偏移。
Fisher 线性判别并不假设样本分布,但在很多情况下,当样本维数比较高且样本数较多时,投影到一维空间后,样本接近正态分布。此时可以在一维空间中用样本拟合正态分布,并用得到的参数来确定分类阈值。