“但是生成的特征值按照從小到大的順序排列的,這樣就不能知道特征值對應(yīng)的是哪一列的特征值?!?/p>
創(chuàng)新互聯(lián)堅持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都網(wǎng)站建設(shè)、做網(wǎng)站、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時代的柳江網(wǎng)站設(shè)計、移動媒體設(shè)計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!
這個說法是有問題的。
eig函數(shù)的完整用法是:
[V,D]=eig(A):求矩陣A的全部特征值構(gòu)成對角陣D,A的特征向量(列向量)排列成V。V的第n列和A的第n個對角元素是對應(yīng)的。
因此可以知道每個特征值對應(yīng)的特征向量是什么。
Python 中,可以使用 NumPy 庫來生成隨機數(shù)組并進行矩陣運算。
首先,可以使用 numpy.random.rand 函數(shù)生成一個12階的隨機非負方陣:
import numpy as np
A = np.random.rand(12, 12)
然后,可以使用 numpy.linalg.eig 函數(shù)求出矩陣的特征值:
Copy codeeigenvalues, eigenvectors = np.linalg.eig(A)
如果矩陣的特征值是對角線上的元素,那么它就是相似于對角陣。
計算方陣所對應(yīng)的行列式的最小余子式,可以使用 numpy.linalg.det 函數(shù)計算行列式,然后枚舉所有可能的余子式并取最小值:
Copy codedef min_cofactor(A):
determinant = np.linalg.det(A)
min_cofactor = float('inf')
for i in range(A.shape[0]):
for j in range(A.shape[1]):
cofactor = np.linalg.det(np.delete(np.delete(A, i, axis=0), j, axis=1))
min_cofactor = min(min_cofactor, cofactor)
return min_cofactor
最后,每列選取一個元素,使相鄰三列的和最小,可以枚舉所有的列并求出和的最小值:
Copy codedef min_sum(A):
min_sum = float('inf') for i in range(A.shape[1] - 2):
column_sum = A[:,i] + A[:,i+1] + A[:,i+2]
min_column_sum = min(column_sum)
min_sum = min(min_sum, min_column_sum) return min_sum
希望以上答案能夠幫到你。
一般步驟來實現(xiàn)PCA算法
(1)零均值化
假如原始數(shù)據(jù)集為矩陣dataMat,dataMat中每一行代表一個樣本,每一列代表同一個特征。零均值化就是求每一列的平均值,然后該列上的所有數(shù)都減去這個均值。也就是說,這里零均值化是對每一個特征而言的,零均值化都,每個特征的均值變成0。實現(xiàn)代碼如下:
[python]?view plain?copy
def?zeroMean(dataMat):
meanVal=np.mean(dataMat,axis=0)?????#按列求均值,即求各個特征的均值
newData=dataMat-meanVal
return?newData,meanVal
函數(shù)中用numpy中的mean方法來求均值,axis=0表示按列求均值。
該函數(shù)返回兩個變量,newData是零均值化后的數(shù)據(jù),meanVal是每個特征的均值,是給后面重構(gòu)數(shù)據(jù)用的。
(2)求協(xié)方差矩陣
[python]?view plain?copy
newData,meanVal=zeroMean(dataMat)
covMat=np.cov(newData,rowvar=0)
numpy中的cov函數(shù)用于求協(xié)方差矩陣,參數(shù)rowvar很重要!若rowvar=0,說明傳入的數(shù)據(jù)一行代表一個樣本,若非0,說明傳入的數(shù)據(jù)一列代表一個樣本。因為newData每一行代表一個樣本,所以將rowvar設(shè)置為0。
covMat即所求的協(xié)方差矩陣。
(3)求特征值、特征矩陣
調(diào)用numpy中的線性代數(shù)模塊linalg中的eig函數(shù),可以直接由covMat求得特征值和特征向量:
[python]?view plain?copy
eigVals,eigVects=np.linalg.eig(np.mat(covMat))
eigVals存放特征值,行向量。
eigVects存放特征向量,每一列帶別一個特征向量。
特征值和特征向量是一一對應(yīng)的
(4)保留主要的成分[即保留值比較大的前n個特征]
第三步得到了特征值向量eigVals,假設(shè)里面有m個特征值,我們可以對其排序,排在前面的n個特征值所對應(yīng)的特征向量就是我們要保留的,它們組成了新的特征空間的一組基n_eigVect。將零均值化后的數(shù)據(jù)乘以n_eigVect就可以得到降維后的數(shù)據(jù)。代碼如下:
[python]?view plain?copy
eigValIndice=np.argsort(eigVals)????????????#對特征值從小到大排序
n_eigValIndice=eigValIndice[-1:-(n+1):-1]???#最大的n個特征值的下標
n_eigVect=eigVects[:,n_eigValIndice]????????#最大的n個特征值對應(yīng)的特征向量
lowDDataMat=newData*n_eigVect???????????????#低維特征空間的數(shù)據(jù)
reconMat=(lowDDataMat*n_eigVect.T)+meanVal??#重構(gòu)數(shù)據(jù)
return?lowDDataMat,reconMat
代碼中有幾點要說明一下,首先argsort對特征值是從小到大排序的,那么最大的n個特征值就排在后面,所以eigValIndice[-1:-(n+1):-1]就取出這個n個特征值對應(yīng)的下標。【python里面,list[a:b:c]代表從下標a開始到b,步長為c。】
MATALB中的eig(A)函數(shù)用于求矩陣的特征值和特征向量,常用的調(diào)用格式有三種:
1、E=eig(A):求矩陣A的全部特征值,構(gòu)成向量E。
2、[V,D]=eig(A):求矩陣A的全部特征值,構(gòu)成對角陣D,并求A的特征向量構(gòu)成V的列向量。
3、[V,D]=eig(A,'nobalance'):與第二種類似,但第二種格式中先對A作相似變換后求矩陣A的特征值和特征向量,而格式三直接求矩陣A的特征值和特征向量。
擴展資料:
MATLAB參考函數(shù)
ones( )創(chuàng)建一個所有元素都為1的矩陣,其中可以制定維數(shù),1,2….個變量
zeros()創(chuàng)建一個所有元素都為0的矩陣
eye()創(chuàng)建對角元素為1,其他元素為0的矩陣
diag()根據(jù)向量創(chuàng)建對角矩陣,即以向量的元素為對角元素
reshape重塑矩陣,reshape(A,2,6),將A變?yōu)?×6的矩陣,按列排列。
ctranspose轉(zhuǎn)置矩陣,也可用A’或A.’,這僅當矩陣為復數(shù)矩陣時才有區(qū)別
rot90旋轉(zhuǎn)矩陣90度,逆時針方向
參考資料來源:百度百科-MATLAB
這兩個命令是完全不同的呀。
S=svd(A)表示對矩陣A進行SVD分解,分解的結(jié)果是得到3個矩陣,如果返回值只有一個,那么可以得到A的奇異值向量。
eig(A)表示求矩陣A的特征值。
所以區(qū)別就是,svd得到的是A的奇異值,eig得到的是A的特征值。
A'表示A的轉(zhuǎn)置矩陣,A'*A的n個非負特征值的平方根叫作矩陣A的奇異值。記為σi(A)。
希望可以幫助你,望采納!