![机器学习数学基础](https://wfqqreader-1252317822.image.myqcloud.com/cover/482/43738482/b_43738482.jpg)
1.3.2 基
在1.2.3节就已经发现,对于二维向量空间,任何一个向量都可以用两个线性无关的向量线性表出。同样来思考三维向量空间,也有类似的情况,如图1-3-2所示,向量组是
的一个线性无关的向量组(即:
),此空间中任意一个向量
可以用这三个向量线性表出,但如果给向量组
再增加一个向量,则该向量组不再是线性无关的了,也就是说这个向量组也是一个极大线性无关组。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_332.jpg?sign=1739176372-inx4JsoCrBizN11q6GeXJ5VAHTBNGtFW-0-36f9bb4ab9bcaa63e36bcf6c593abea8)
图1-3-2
将得到的以上结论推广到任何向量空间,如果我们都可以找到一个极大线性无关的向量组,用它可线性表出这个向量空间的任何一个向量,那么称这个极大线性无关组为该向量空间的一个基(Basis)。
再如几何空间中的向量组,是极大线性无关组,它构成了几何空间的一个基,几何空间中的任何一个向量同样可以用这三个向量的线性组合表示。只不过,相比于图1-3-2中所示的那个基,这个基不那么“特殊”。
图1-3-2所示的基的特殊性在于:向量长度都是1,且彼此垂直(另外一种称谓是正交,参阅3.4.1节),因此也称其为标准基(Standard Basis,或称标准正交基),例如的一个标准基是:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_335.jpg?sign=1739176372-JMyZfZmuhzsQoge6ObSXfdSW2QRuIyNR-0-86fe9a19692802d2ef9908878fc4d270)
(1.3.1)
显然,以上我们所选择的标准基更具有特殊性,即每个向量中只有一个值是非零值。有没有别的标准基呢?是不是标准基都如此?不是!只不过像上面那样选择标准基让向量的描述更简单。如图1-3-3所示,二维向量空间中的向量(以
表示向量对象本身,即不需要依靠任何基以数学形式描述该向量),在标准基
下描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_339.jpg?sign=1739176372-fcKBINjnpDPVzwgqAta1yK7NCVY2OhL5-0-8692c9f3b0ea0775d3334837973d41c6)
(1.3.2)
如果在另外一个标准基下描述,则为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_341.jpg?sign=1739176372-M5EbYNGxlkO7u1RjhAuyjs4QBKzkP6sP-0-db3ecca7336242dfc5a0278b885125f6)
(1.3.3)
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_342.jpg?sign=1739176372-ffm8mM2wHCAyAwDo5g0nkEuggQ61DtKL-0-92d8e183ebd0cb0536a8800f7b6ab5cd)
图1-3-3
比较一下,哪个更简单?一目了然。所以,基于样式的标准基描述空间的向量,更符合我们的意愿。事实上,当我们用线性代数的方式将向量表示出来的时候,就已经为它选定了一个基——向量必须在向量空间的一个基下才能描述。例如,向量
,在我们没有明确说明它的基的时候,事实上已经默认了一个基:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_345.jpg?sign=1739176372-OiG49I7tiYQCZaDgumwNRP8gb1Tb6uIQ-0-dfb0862bbade5212d0db916b871511e0)
类似于(1.3.1)式的基是我们常用的向量空间的默认基。
如果以基中每个向量所在方向的直线为坐标轴,如图1-3-3所示,就创建了一个坐标系(Coordinate System)。很显然,不同的基所创建的坐标系是不同的,图1-3-3分别以实线和虚线表示了上述两个基所对应的坐标系。
(1.3.2)式和(1.3.3)式分别用不同的基描述向量,其中系数
或者
,称为坐标。
如果对进行乘法和加法运算,就得到了
。由此可见,在这个坐标系中,向量的描述和坐标是完全一致的,并且符合我们的直观感觉。所以,在讨论某个空间的列向量或者行向量的时候,如果写成了类似这样的方式,就意味着该向量是基于空间的
标准基描述的(回顾1.1节对向量的描述)。
把上述经验推广到其他向量空间,设(
表示列向量)是某个向量空间的一个基,则该空间中一个向量
可以描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_355.jpg?sign=1739176372-NzQTPNiT4xEpm4n6UOhfZLc4PxxuUynx-0-f6b25869c8c14ddccc155e7fcc21262f)
(1.3.4)
其中的即为向量
在基
的坐标。
如果有另外一个基(
表示列向量),向量
又描述为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_362.jpg?sign=1739176372-XAmpQOXu6bqg61res7NMEbh0mzefxYgV-0-ee5e487ed7ff30e09351024b34d72a58)
(1.3.5)
那么,同一个向量空间的这两个基有没有关系呢?有。不要忘记,基是一个向量组,例如基中的每个向量也在此向量空间,所以可以用基
线性表出,即:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_365.jpg?sign=1739176372-IUZT7Hg2XFOS6LrcTfQcB64eZwKGn7I5-0-685db9394fd2fa4f88a51b4c615255ff)
以矩阵(这里提前使用了矩阵的概念,是因为本书已经在前言中声明,我们假定读者学过高等数学。关于矩阵的更详细内容,请参阅第2章)的方式,可以表示为:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_366.jpg?sign=1739176372-wkUfEdPogbKa7SG8jm4N8s7lPwxJjbX2-0-38d4e20bd467c125b56ebaeb153a8722)
(1.3.6)
其中:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_367.jpg?sign=1739176372-wKMAQFNyHbNyocuaHzXIQyatbJGW1qD8-0-1eb8fa2328edbea8703c6583a498acc4)
称为基向基
的过渡矩阵。显然,过渡矩阵实现了一个基向另一个基的变换。
定义 在同一个向量空间,由基向基
的过渡矩阵是
,则:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_373.jpg?sign=1739176372-9HZUF9O65G4oOGp5Ypq16jSQbFbKniID-0-f56a48730af6ffee0f578f1b44f37c44)
注意:和
分别用列向量方式表示此向量空间的不同的基。
根据(1.3.5)式,可得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_376.jpg?sign=1739176372-qF6Y8aibw1GWtAZVjE8tDFFU2SZsgNaO-0-84783a39332a5d38b69179c93fb4276e)
(1.3.4)式和(1.3.5)式描述的是同一个向量,所以:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_377.jpg?sign=1739176372-FbFHof15KSIr1p9Rt2p6RLrY6xFIAfq3-0-91fa9531e771fd7bfb61f31011252b9b)
如果写成矩阵形式,即:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_378.jpg?sign=1739176372-tBoz2SA3TIshi0giXG4N7hFQqY3Zaqmr-0-649390a27f730cd41efc78dc2a5d52fe)
(1.3.7)
表示了在同一个向量空间中,向量在不同基下的坐标之间的变换关系,我们称之为坐标变换公式。
定义 在某个向量空间中,由基向基
的过渡矩阵是
。某向量在基
下的坐标是
,在基
下的坐标是
,这两组坐标之间的关系是:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_386.jpg?sign=1739176372-vdHFqQ97REdooV9jO268gyC3yO1b9XEa-0-005123ba8c0db2c71404f644d477adfa)
为了更直观地理解上述概念,下面以平面空间为例给予详细说明。如图1-3-4所示,有向量,所对应坐标系如实线
所示(显然,基是
)。此向量空间的另外一个基
所对应的坐标系如虚线
所示。
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_392.jpg?sign=1739176372-I7yqOiz04DqveJlqLHCdzxtsatv3tWVS-0-d3e8d8d99a6371772d7769f77cbc3533)
图1-3-4
在中,分别以基向量的
和
的长度为单位长度,并以它们的各自方向分别设置为
轴和
轴的正方向。
● 坐标表示向量
的长度在
轴方向上是单位长度的
倍(正数表示与
轴正方向一致);
● 坐标表示向量
的长度在
轴方向上是单位长度的
倍(正数表示与
轴正方向一致)。
同样,在中,分别以基向量的
和
的长度为单位长度并建立
和
坐标轴。如图1-3-4所示,先用几何方法,从
点分别作
和
两个坐标轴的平行线,与坐标轴交点分别为
,则这两个点的数值代表了相对于基向量长度的倍数,即向量
在
中的坐标。由图可知,
,于是,在
中向量
表示为:
。
如果不用几何的方式,采用前述的坐标变换公式,看看能不能得到同样结果。
基向基
的过渡矩阵
,由坐标变换公式(1.3.7)式得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_426.jpg?sign=1739176372-z9pLIb9iMPRt4A1noIcdGSsFfQ6QOhUb-0-dab27631863ab773a8715c60f57c9690)
解得:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_427.jpg?sign=1739176372-2GsMLZtce9Gc6BW5ASSEqUSRr6MGNly8-0-d1bd80e5dfaee74ae9a7fc7b4d7c953e)
所以:
![](https://epubservercos.yuewen.com/39156C/23020656909779806/epubprivate/OEBPS/Images/txt001_428.jpg?sign=1739176372-fRb1ueYBtZSIfouVMQdOOIqEkhmdMWrl-0-f1a7b483eac7fc9852936f54eba4d081)
在中,
,与前述几何方法计算结果一致。