本篇內(nèi)容主要講解“怎么解決人工智能PCA降維后的報(bào)錯(cuò)問題”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“怎么解決人工智能PCA降維后的報(bào)錯(cuò)問題”吧!
創(chuàng)新互聯(lián)建站主營(yíng)張家港網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,重慶APP開發(fā),張家港h5成都微信小程序搭建,張家港網(wǎng)站營(yíng)銷推廣歡迎張家港等地區(qū)企業(yè)咨詢問題:PCA降維后的feature數(shù)如果少于樣本數(shù),為什么會(huì)報(bào)錯(cuò)把n_components一旦改為超過230后,會(huì)有截圖中的錯(cuò)誤,即:
ValueError: n_components=250 must be between 0 and min(n_samples, n_features)=230 with svd_solver='full'
Answer:
PCA降維實(shí)現(xiàn)的依舊是對(duì)features的減少,而不是樣本數(shù),這個(gè)你要記住。因此降維之后的樣本數(shù)量是不變的,feature數(shù)量會(huì)變少。
為什么pca降維后feature數(shù)量多余樣本數(shù)量會(huì)報(bào)錯(cuò)?這是算法本身決定的,要求降維后的feature數(shù)量少于樣本數(shù):
思考pca降維的原理,如果要降到n維,那就需要構(gòu)建一個(gè)n維德投影空間,而這個(gè)投影空間是要通過n+1個(gè)樣本數(shù)量決定的,如果樣本數(shù)量太少,那就無法得到一個(gè)有效的投影空間。舉個(gè)最簡(jiǎn)單的例子:
把數(shù)據(jù)點(diǎn)投影到一條直線上,理解為投影到一維空間,那就需要有兩個(gè)或兩個(gè)以上的點(diǎn),這樣才能確定一條直線,使樣本到直線德距離之和最小,如果只有一個(gè)點(diǎn),那是有無數(shù)條直線的。因此需要樣本數(shù)量大于一。
到此,相信大家對(duì)“怎么解決人工智能PCA降維后的報(bào)錯(cuò)問題”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!