![矩阵理论与方法](https://wfqqreader-1252317822.image.myqcloud.com/cover/490/773490/b_773490.jpg)
1.3 线性变换
本节主要研究线性空间中元素之间的关系,介绍映射、线性变换的概念、线性变换的矩阵表示及其有关子空间。
1.3.1 线性变换的概念及实例
若不特别提出,下面所考虑的都是固定在某一数域F上的线性空间。
定义1.3.1 设V1,V2是两个线性空间,若对于某个指定的法则T,使V1中任意一元素α都能与V2中的一个确定元素β相对应,则T称为由V1到V2的一个映射,记为
β=T(α)
β称为α在映射T下的像,而α称为β的原像。
若T同时还满足:
对任意的α1,α2∈V有
T(α1+α2)=T(α1)+T(α2)
及对任意k∈F,α∈V,有
T(kα)=kT(α)
则称T为从V1到V2的一个线性映射。
定义1.3.2 若T为线性空间V到自身的一个映射,则T称为V的一个变换。若变换T对于V中任意的元素α、β和数域F中的任意数k,还同时满足
T(α+β)=T(α)+T(β)
T(kα)=kT(α)
则称T为线性空间V的一个线性变换。
我们可以把定义1.3.2中两个条件用一个表达式来表示,即T是V的线性变换的充分必要条件是
T(kα+lβ)=kT(α)+lT(β)
其中,α与β是V中任意向量,k与l是数域F中任意数。
以后一般用白斜体拉丁字母A,B,C,…,T,…代表线性空间V的线性变换,T(α)或Tα代表元素α在线性变换T下的像。
线性变换的丰富内容可从下面的几个例子显示出来。
【例1.3.1】 设R4×4是实数域R上全体4阶方阵的集合,A为R4×4中任意一个4阶方阵
T(A)=|A|
表示T是R4×4到R的一个映射。
【例1.3.2】 在平面几何空间R2中,把任一向量x=(x1,x2)T在平面上绕原点按逆时针方向旋转θ角后,得到向量y=(y1,y2)T。它们之间的关系用以下公式表示:
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0023_0001.jpg?sign=1739317531-zCAR7Kbf1ONQ0STOc9hzhhIGNpu8jfO3-0-d5633bc532a3ed6aad5fb614bd506eae)
即
y=T(x)
根据定义,易说明T是R2的线性变换。
【例1.3.3】 关于F[x]n的求导变换D。对任意f(x)∈F[x]n有D[f(x)]=f′(x),则求导变换D是F[x]n上的一个线性变换。
【例1.3.4】 设C[a,b]表示定义在闭区间[a,b]上全体实连续函数组成的实数域上的线性空间。在C[a,b]中,变换
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0023_0002.jpg?sign=1739317531-YMlh6VldKdTnHBwj3lcCdCzAiLFs4B34-0-b6a043737e83fa570115f9fcf006821a)
其中,f(t)是C[a,b]中任意实连续函数。
用定义不难验证积分变换∫是C[a,b]上的一个线性变换。
【例1.3.5】 在线性空间V中,
(1)把V中的任意向量α变成α的变换,称为V的恒等变换或单位变换,记做I,即
I(α)=α
(2)把V中的任意向量α变成零向量的变换,称为V的零变换,记做T0,即
T0(α)=0
(3)设k是F中的某个数,把V中任意向量α变成kα的变换,称为V的数乘变换,记做K,即
K(α)=kα
当k=1时,得到单位变换I;当k=0时,得到零变换T0。
易证明单位变换、零变换和数乘变换都是线性变换。
线性变换有如下简单性质:
若T是V的线性变换,则
(1)T(0)=0, T(-α)=-T(α)。
(2)若β=k1α1+k2α2+…+kmαm,则有
T(β)=k1T(α1)+k2T(α2)+…+kmT(αm)
又若k1α1+k2α2+…+kmαm=0,则有
k1T(α1)+k2T(α2)+…+kmT(αm)=0
其中,β,αi∈V,ki∈F(i=1,2,…,m)。上式表明,线性变换保持线性关系式不变。
(3)若α1,α2,…,αm∈V,且α1,α2,…,αm线性相关,则T(α1),T(α2),…,T(αm)也线性相关。即线性变换把线性相关的向量组变成线性相关的向量组。
要注意的是,线性变换可能把线性无关的向量组变成线性相关的向量组。
1.3.2 线性变换的运算
定义1.3.3 设线性变换T1、T2和T都是线性空间V的线性变换,k∈F,若
(1)对任意向量α∈V,均有T1(α)=T2(α),则称T1与T2相等,记为T1=T2;
(2)对任意向量α∈V,均有T1(α)+T2(α)=T(α),则称T为T1与T2的和,记为T=T1+T2;
(3)对任意向量α∈V,任意k∈F,均有T(α)=k(T1(α)),则T为T1与k的乘积,记为T=kT1;
(4)若对任意向量α∈V,有(-T)(α)=-T(α),则(-T)为T的负变换;
(5)对于任意向量α∈V,均有T(α)=T1(T2(α)),则称T为T1与T2的积,记为T=T1T2;
(6)设T1是V的线性变换,若在V中有线性变换T2存在,使对于任意向量α∈V,有
T1T2(α)=T2T1(α)=I(α)
这时,线性变换T1称为可逆的。T2称为T1的逆变换,记为,且逆变换是唯一的。
要注意的是,一般情况下线性变换的乘积不满足交换律,即T1T2≠T2T1。对线性变换的运算,通过验证易得到如下结论:
线性变换的和、数乘、积、逆变换与负变换都仍是线性变换。
这里要指出的是,定义1.3.3所提到的线性变换的加法和数乘具有以下性质:
线性变换的加法满足:
(1)T1+T2=T2+T1;
(2)(T1+T2)+T3=T1+(T2+T3);
(3)T+T0=T;
(4)T+(-T)=T0。
线性变换的数乘满足:
(1)1·T=T;
(2)k(lT)=(kl)T;
(3)(k+l)T=kT+lT。
其中T1、T2、T3、T0、T、(-T)都是数域F上线性空间V的线性变换,k、l是F中任意的数。
由线性变换的加法与数乘定义及其性质,看出线性空间中所有线性变换所构成的集合,在规定的运算下构成V的一个新线性子空间。
1.3.3 线性变换的矩阵表示
由于线性变换的概念比较抽象,为了研究方便,现来建立线性变换与矩阵的联系。
首先说明,当数域F上n维线性空间V取定一组基α1,α2,…,αn后,V中的一个线性变换T可与Fn×n中的矩阵A有一个一一对应的关系,可形式地表示为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0001.jpg?sign=1739317531-PReX8Tjge0LicVHb6Pf5FgPByAj7xXqd-0-1361a24f14529e5d55369de1224290ad)
事实上,由线性变换T唯一地确定了基的像T(α1),T(α2),…,T(αn),所以它们在给定基下都有确定的坐标。以T(αj)在给定基下的坐标作为矩阵A的第j列,这就构造了唯一确定的一个n阶方阵A。
反之,取定Fn×n中一个矩阵A,则A的n个列唯一确定n个向量β1,β2,…,βn分别作为α1,α2,…,αn的像,就可唯一确定V的一个线性变换T,其中βj关于基α1,α2,…,αn的坐标是A的第j列元素。
下面给出线性变换矩阵表示的定义。
定义1.3.4 设T是n维线性空间V的一个线性变换,α1,α2,…,αn是V的一个基,设
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0002.jpg?sign=1739317531-Ss3c0QS1eIrVPaUjimDGzZqArUErd0rJ-0-d7dd36b40bc6ba8465a12ecd24889744)
用矩阵形式表示为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0003.jpg?sign=1739317531-nxxMDlJ1VF2YpEtX2Vuc6ja43JkAFQ9l-0-4e40952dd246ab1aed0e8a4497746495)
其中
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0004.jpg?sign=1739317531-hiQrEYQhOX7ZRwKEd8z7GHWtYgjc8Pzp-0-fb843e2645672b2b8669ded54e8a019f)
称A为线性变换T在基α1,α2,…,αn下的矩阵。
显然,线性空间V中的零变换、单位变换、数乘变换在任意一个基下的矩阵分别为零矩阵、单位矩阵和数量矩阵。
【例1.3.6】 求F[x]n的求导变换D,在基1,x,x2,…,xn-1下的矩阵。
解 因为
D(1)=0,D(x)=1,D(x2)=2x,…,D(xn-1)=(n-1)xn-2
所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0025_0005.jpg?sign=1739317531-2xQTV99muAlzQW38oLb0Jc2dMBbgNMHT-0-5544e604a1ebddd4275808619ad5c4c8)
所求矩阵为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0001.jpg?sign=1739317531-0A95QCmlq6F1BUpfcMQJDiBVJWEjq8jv-0-73347924527bebbc53e19975ba5cf4b3)
在取定一组基后,线性变换与n阶矩阵是一一对应关系,它可以保持运算。
定理1.3.1 若α1,α2,…,αn是n维线性空间V的一个基,则在这组基下,每个线性变换按式(1.3.1)都可对应一个n阶方阵,这个对应有以下性质:
(1)线性变换的和对应矩阵的和;
(2)线性变换的乘积对应矩阵的乘积;
(3)线性变换与数的乘积对应矩阵与数的乘积;
(4)可逆的线性变换与可逆矩阵对应,且逆变换对应于逆矩阵。
证略。
利用线性变换的矩阵可以求出一个向量的像。
定理1.3.2 设线性变换T在基α1,α2,…,αn下的矩阵是A,向量α及其像T(α)在基α1,α2,…,αn下的坐标分别是(x1,x2,…,xn)T与(y1,y2,…,yn)T,则有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0002.jpg?sign=1739317531-mAM7GIPaDyja9DuT7YIuDX7DB5syYXwb-0-1124cb2aba6808784fe0ee37c20d5ade)
证 已知
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0003.jpg?sign=1739317531-Ha31ZGkizxS1ETxWhUEkbz893Duho1ey-0-9a505c0d7d43b65ee6f94b4a277d2c11)
及
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0004.jpg?sign=1739317531-UJLsnKAg3WQ8aBAWKiHqZ7exHduIczda-0-cd2f72abb12534b6b75d834914535803)
于是
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0005.jpg?sign=1739317531-6o0mSTfDfw135D7plgVLRl7r8aGCbtpv-0-31749a1010ad8ef46622a85a1f8cda0b)
将式(1.3.2)代入,有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0006.jpg?sign=1739317531-4MrgW2UkgBxQhrsgmEo2NZMAcNybzDpg-0-92172e3d7a318eecc39af885e236323d)
又因为α1,α2,…,αn线性无关,所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0026_0007.jpg?sign=1739317531-kiUSnUEoxkDEIcyJfuEY6yfQsMuY5VXu-0-ef71858d6bf41ef0e2ef4a6ed7ad602e)
下面的定理给出同一线性变换在不同基下的矩阵之间的关系,这对以后的讨论很重要。
定理1.3.3 设线性空间V中,线性变换T在基(1)α1,α2,…,αn与基(2)β1,β2,…,βn下的矩阵分别是A和B,由基(1)到基(2)的过渡矩阵是P,则有B=P-1AP。
证 已知
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0001.jpg?sign=1739317531-EapgrdH0yKv51Hvk28OSYy6m9J5GVsZq-0-785ee6c7bc605766ccafe329b08dace5)
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0002.jpg?sign=1739317531-ucj5LGGoQapCN0N7GzkAKOSkrW83vsIv-0-3c49bb5af73916e23ab422cd90682e0c)
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0003.jpg?sign=1739317531-l8rDGEtS4RxTu6F4g7FXyVF3Sql5cJFY-0-2253d28c0a9c5856cd450e55f29192fc)
于是
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0004.jpg?sign=1739317531-YhyFX3kKH9uwluUNxR0O8LiaRtg1VZZW-0-31cc842768a918abaeb2108dc4912bb3)
与式(1.3.4)比较,有
B=P-1AP
所以,同一线性变换在不同基下的矩阵是相似关系。
【例1.3.7】 已知R3中线性变换T在基β1=(-1,1,1)T,β2=(1,0,-1)T,β3=(0,1,1)T下的矩阵为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0005.jpg?sign=1739317531-2GnZzRC7t9mooIptMDHYc68TTDpxrgPb-0-afe1ae4134e8b97a69eba447d20d7f8b)
求:(1)T在基α1=(1,0,0)T,α2=(0,1,0)T,α3=(0,0,1)T下的矩阵;
(2)向量η=(1,0,1)T及T(η)在β1,β2,β3下的坐标。
解(1)由
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0006.jpg?sign=1739317531-nFr03nBP4uo6gNbjYbosNDqFP0oUVRDk-0-66bb917c7d3493a13364b1c156b21817)
得到基α1,α2,α3到基β1,β2,β3的过渡矩阵P
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0007.jpg?sign=1739317531-oRsB4HtJOm64h7uQgiCLM6IPMglrb6ay-0-5b33fdcdae2c5dd39c2e837cb36a4330)
又已知
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0008.jpg?sign=1739317531-z0rqpdZfhufyfJGq0dAZKaPUUNLIWSq6-0-81d1478be20c0aff28bbce10ec3f6fb5)
即线性变换T在基β1,β2,β3下的矩阵为
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0027_0009.jpg?sign=1739317531-YM0I4bWGy1sJaYOBADbODAaq7frncKlc-0-39c60c670cc5530486ca2a54370af194)
设线性变换T在基α1,α2,α3下的矩阵为A,即
T(α1,α2,α3)=(α1,α2,α3)A
由定理1.3.3有B=P-1AP,求出
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0001.jpg?sign=1739317531-ErWJCIh0C4poBCWHZKYYZglrzoAhZXQV-0-6d8447b1e494900c2e4444ba6892b6ec)
所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0002.jpg?sign=1739317531-oTjCi5PSroY05VP0aKQGfy44RQ9gEkOx-0-8128beeb6448ea1648c781ce51f89c66)
A即为所求。
(2)设
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0003.jpg?sign=1739317531-omqg63GRybu0GHSHBHavwNnKYlbZjMVS-0-75ba48b15599be5b88fde0297822779b)
解此非齐次线性方程组,得
x1=-2,x2=-1,x3=2
所以,η在基β1,β2,β3下的坐标为(-2,-1,2)T。
设T(η)在基β1,β2,β3下的坐标为(y1,y2,y3)T,可由定理1.3.2所给出的公式求出,即
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0004.jpg?sign=1739317531-GCMA3MLjFyohyjKzpptClWzpOf7gEWx9-0-295000180e8be09dd715c377c874267d)
其中,B为线性变换T在基β1,β2,β3下的矩阵。由于B已在前面求出,所以
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0005.jpg?sign=1739317531-UsuxSd3LZBx9SOa3SosX9thLoWttegmO-0-c85a3594d565032f93b3d0e9c26605fd)
*1.3.4 线性映射的矩阵表示
定义1.3.5 设T是由n维线性空间V1到m维线性空间V2的一个线性映射,α1,α2,…,αn与β1,β2,…,βm分别是V1与V2的一个基,则
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0006.jpg?sign=1739317531-3IeZq3FQlczaQ9MxzbBg0nyC8tX73IIR-0-d5c04978cc34b907de4df8bae53ebd26)
可形式地写成
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0007.jpg?sign=1739317531-BgOnVlqLkj0a8Odd5tFwTvPqOVwTi8Yh-0-33eb2442d697c1127eae31bfc5bfc7e5)
设
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0028_0008.jpg?sign=1739317531-8KQIxpLWM9NCUANNqldslE3xyTsX18uI-0-fb7fcf109e58a07e56c2ddb543c1b850)
上式可写成
T(α1,α2,…,αn)=(β1,β2,…,βm)A
我们称矩阵A为线性映射T在V1基α1,α2,…,αn与V2基β1,β2,…,βm下的矩阵。上式称为线性映射在一对基下的矩阵表示。
可以证明在V1与V2的一对基下,线性映射T与矩阵A之间是一一对应的。
定理1.3.4 设T是由n维线性空间V1到m维线性空间V2的线性映射,α1,α2,…,αn与β1,β2,…,βm分别是V1与V2的一个基,T在给定的一对基下的矩阵为A。若任意向量α∈V1,且Tα∈V2,在给定基下,它们的坐标分别为(x1,x2,…,xn)T和(y1,y2,…,ym)T,则有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0029_0001.jpg?sign=1739317531-vfItDYrsdbqfY2KDSkuAumhk5UqMvQtF-0-af60f93f1fed2969afbfe7ef4964341d)
此定理的证明与定理1.3.2的证明类似,留给读者自证。
定理1.3.4说明,有了线性映射在一对基下矩阵表示,就可以求出V1中向量α的坐标与它在V2中像的坐标之间的关系。
下面的定理将给出线性映射在不同对基下矩阵之间的关系。
定理1.3.5 设T是由n维线性空间V1到m维线性空间V2的一个线性映射,α1,α2,…,αn与α′1,α′2,…,α′n是V1的两个基,由αi到α′i(i=1,2,…,n)的过渡矩阵为P1。β1,β2,…,βm与β′1,β′2,…,β′m是V2的两个基,由βj到β′j(j=1,2,…,m)的过渡矩阵为P2。线性映射T在基α1,α2,…,αn与β1,β2,…,βm下的矩阵表示为A,在基α′1,α′2,…,α′n与β′1,β′2,…,β′m下的矩阵表示为B,则有
![](https://epubservercos.yuewen.com/5C7993/3590603603565701/epubprivate/OEBPS/Images/figure_0029_0002.jpg?sign=1739317531-bOEjvyMX0AjWFRFkvbsjtFYpuUwGMucL-0-4b77629f19e33d667cde4c3b90f7a141)
证略。由矩阵等价的定义知,矩阵A与矩阵B是等价的。
定理1.3.5说明,由n维线性空间V1到m维线性空间V2的一个线性映射T有一系列的m×n矩阵表示:A,B,…,它们之间的关系是等价关系。