矩陣是個(gè)非常抽象的數(shù)學(xué)概念,很多人到了這里往往望而生畏。比如矩陣的乘法為什么有這樣奇怪的定義?實(shí)際上是由工程實(shí)際需要定義過來的。如果只知道概念不懂有何用處,思維就只有抽象性而沒有直觀性,實(shí)在是無法感受矩陣的精妙。
創(chuàng)新互聯(lián)建站是一家企業(yè)級云計(jì)算解決方案提供商,超15年IDC數(shù)據(jù)中心運(yùn)營經(jīng)驗(yàn)。主營GPU顯卡服務(wù)器,站群服務(wù)器,服務(wù)器托管德陽,海外高防服務(wù)器,機(jī)柜大帶寬、租用·托管,動(dòng)態(tài)撥號VPS,海外云手機(jī),海外云服務(wù)器,海外服務(wù)器租用托管等。直觀性說明
我們先看點(diǎn)直觀性的內(nèi)容。矩陣的特征方程式是:
A * x = lamda * x
這個(gè)方程可以看出什么?上次我們提到矩陣實(shí)際可以看作一個(gè)變換,方程左邊就是把向量x變到另一個(gè)位置而已;右邊就是把向量x作了一個(gè)拉伸,拉伸量是lamda。那么它的意義就很明顯了,表達(dá)了矩陣A的一個(gè)特性就是這個(gè)矩陣可以把向量x拉長(或縮短)lamda倍,僅此而已。
任意給定一個(gè)矩陣A,并不是對所有的x它都能拉長(縮短)。凡是能被A拉長(縮短)的向量稱為A的特征向量(Eigenvector);拉長(縮短)量就為這個(gè)特征向量對應(yīng)的特征值(Eigenvalue)。
值得注意的是,我們說的特征向量是一類向量,因?yàn)槿我庖粋€(gè)特征向量隨便乘以一個(gè)標(biāo)量結(jié)果肯定也滿足以上方程,當(dāng)然這兩個(gè)向量都可以看成是同一個(gè)特征向量,而且它們也都對應(yīng)同一個(gè)特征值。
如果特征值是負(fù)數(shù),那說明了矩陣不但把向量拉長(縮短)了,而且讓向量指向了相反的方向。
一個(gè)矩陣可能可以拉長(縮短)好幾個(gè)向量,所以它可能就有好多個(gè)特征值。有趣的是,如果A是實(shí)對稱矩陣,那么那些不同的特征值對應(yīng)的特征向量肯定是互相正交的,原因是(?)。
我們也可以說,一個(gè)變換矩陣的所有特征向量組成了這個(gè)變換矩陣的一組基。所謂基可以理解為坐標(biāo)系的軸。我們平常用到的大多是直角坐標(biāo)系,在線形代數(shù)中可以把這個(gè)坐標(biāo)系扭曲、拉伸、旋轉(zhuǎn),稱為基的變換。我們可以按我們的需求去設(shè)定基,但是基的軸之間必須是線形無關(guān)的,也就是保證坐標(biāo)系的不同軸不要指向同一個(gè)方向或可以被別的軸組合而成,否則的話原來的空間就“撐”不起來了。在主成分分析(Principal Component Analysis)中我們通過在拉伸大的方向設(shè)置基,忽略一些小的量,可以極大地壓縮數(shù)據(jù)而減小失真。
變換矩陣的所有特征向量作為空間的基之所以重要,是因?yàn)樵谶@些方向上變換矩陣可以拉伸向量而不必扭曲和旋轉(zhuǎn)它,使得計(jì)算大為簡單。所以特征值固然重要,我們的終極目標(biāo)卻是特征向量。
幾個(gè)重要的抽象概念
我們回到矩陣的意義上,先介紹幾個(gè)抽象概念:
核:所有經(jīng)過變換矩陣后變成了零向量的向量組成的集合,通常用Ker(A)來表示。假如你是一個(gè)向量,有一個(gè)矩陣要來變換你,如果你不幸落在了這個(gè)矩陣的核里面,那么很遺憾轉(zhuǎn)換后你就變成了虛無的零。特別指出的是,核是“變換”(Transform)中的概念,矩陣變換中有一個(gè)相似的概念叫“零空間”。有的材料在談到變換的時(shí)候使用T來表示,聯(lián)系到矩陣時(shí)才用A,本文把矩陣直接看作“變換”。核所在的空間定義為V空間,也就是全部向量原來在的空間。
值域:某個(gè)空間中所有向量經(jīng)過變換矩陣后形成的向量的集合,通常用R(A)來表示。假設(shè)你是一個(gè)向量,有一個(gè)矩陣要來變換你,這個(gè)矩陣的值域表示了你將來可能的位置,你不可能跑到這些位置之外。值域的維度也叫做秩(Rank)。值域所在的空間定義為W空間。W空間中不屬于值域的部分等會(huì)兒我們會(huì)談到。
空間:向量加上加、乘運(yùn)算構(gòu)成了空間。向量可以(也只能)在空間中變換。使用坐標(biāo)系(基)在空間中描述向量。
不管是核還是值域,它們都是封閉的。意思是如果你和你的朋友困在核里面,你們不管是相加還是相乘都還會(huì)在核里面,跑不出去。這就構(gòu)成了一個(gè)子空間。值域同理。
數(shù)學(xué)家證明了,V的維度一定等于它的任意一個(gè)變換矩陣的核的維度加上值域的維度。
dim( V ) = dim( Ker( A ) ) + dim( R( A) )
嚴(yán)格的證明過程可以參考教科書,這里說一個(gè)直觀的證法:
V的維度也就是V的基的數(shù)目,這些基分為兩部分,一部分在核中,一部分是值域中非零象的原象(肯定可以分,因?yàn)楹撕椭涤蚨际仟?dú)立的子空間)。如果把V中的任意向量用基的形式寫出來,那么這個(gè)向量必然也是一部分在核中,另一部分在值域中非零象的原象里?,F(xiàn)在對這個(gè)向量作變換,核的那部分當(dāng)然為零了,另一部分的維度剛好等于值域的維度。
變換矩陣行空間和零空間的關(guān)系
另外我們根據(jù)矩陣的性質(zhì),變換矩陣的行數(shù)等于V的維度,變換矩陣的秩等于值域R的維度,所以也可以記成:
A的行數(shù)= dim( A的零空間 )+ A的秩
因?yàn)锳的秩又是A行空間的維度(注意在非滿秩矩陣中這個(gè)數(shù)肯定小于行數(shù)):
A的行數(shù)= dim( A的零空間 )+ dim( A的行空間 )
為什么要寫成這個(gè)形式?因?yàn)閺倪@里我們可以發(fā)現(xiàn)A的零空間和A的行空間是正交互補(bǔ)的。正交是因?yàn)榱憧臻g就是核,按定義乘以A的行向量當(dāng)然為零。互補(bǔ)是因?yàn)樗鼈兗悠饋韯偤脧埑烧麄€(gè)V空間。
這個(gè)正交互補(bǔ)導(dǎo)致了非常好的性質(zhì),因?yàn)锳的零空間和A的行空間的基組合起來剛好可以湊成V的基。
變換矩陣列空間和左零空間的關(guān)系
如果把以上方程取轉(zhuǎn)置,可得:
A的列數(shù)= dim( A^T的零空間 )+ dim( A的列空間 )
因?yàn)锳^T的實(shí)際意義是把值域和定義域顛倒了過來,所以A^T的零空間就是從值域以外的區(qū)域投向V中零點(diǎn)的所有向量的空間(有點(diǎn)拗口!),有人把它稱為“左零空間”(LeftNull Space)。這樣:
A的列數(shù)= dim( A的左零空間 )+ dim( A的列空間 )
同樣A的左零空間與A的列空間也正交互補(bǔ),它們加起來剛好可以張成W空間。它們的基也構(gòu)成了W的基。
變換矩陣行空間和列空間的關(guān)系
不要忘了變換矩陣實(shí)際上是把目標(biāo)向量從行空間轉(zhuǎn)化到列空間。
矩陣的行空間,列空間,零空間,左零空間構(gòu)成了我們在線形代數(shù)研究中的所有空間,把它們的關(guān)系弄清楚,對于分別的基的轉(zhuǎn)換非常重要。
特征方程的秘密
我們試圖構(gòu)造一個(gè)這樣的變換矩陣A:它把向量變換到一個(gè)值域空間,這個(gè)值域空間的基是正交的;不僅如此,還要求任意一個(gè)基v都有A* u = lamda * v的形式,u是原來空間的一個(gè)已知的基。這樣我們就能把復(fù)雜的向量問題轉(zhuǎn)化到一個(gè)異常簡單的空間中去。
如果u的數(shù)量不等于v,那么用A^T*A取代A,可以變?yōu)橐粋€(gè)對稱且半正定矩陣,它的特征向量正是要求的基v!
再次說明,矩陣不等于變換,把矩陣看成變換只是提供一個(gè)理解變換矩陣的方法?;蛘哒f矩陣只是變換的其中一種表現(xiàn)形式。