RBF (Radial Basis Function)可以看作是一個(gè)高維空間中的曲面擬合(逼近)問題,學(xué)習(xí)是為了在多維空間中尋找一個(gè)能夠最佳匹配訓(xùn)練數(shù)據(jù)的曲面,然后來一批新的數(shù)據(jù),用剛才訓(xùn)練的那個(gè)曲面來處理(比如分類、回歸)。RBF的本質(zhì)思想是反向傳播學(xué)習(xí)算法應(yīng)用遞歸技術(shù),這種技術(shù)在統(tǒng)計(jì)學(xué)中被稱為隨機(jī)逼近。RBF里的basis function(徑向基函數(shù)里的基函數(shù))就是在神經(jīng)網(wǎng)絡(luò)的隱單元里提供了提供了一個(gè)函數(shù)集,該函數(shù)集在輸入模式(向量)擴(kuò)展至隱空間時(shí),為其構(gòu)建了一個(gè)任意的“基”。這個(gè)函數(shù)集中的函數(shù)就被稱為徑向基函數(shù)。
創(chuàng)新互聯(lián)公司專注于歷城網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供歷城營銷型網(wǎng)站建設(shè),歷城網(wǎng)站制作、歷城網(wǎng)頁設(shè)計(jì)、歷城網(wǎng)站官網(wǎng)定制、微信小程序開發(fā)服務(wù),打造歷城網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供歷城網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。
如果對(duì)于輸入空間的某個(gè)局部區(qū)域只有少數(shù)幾個(gè)連接權(quán)值影響輸出,則該網(wǎng)絡(luò)稱為局部逼近網(wǎng)絡(luò)。常見的局部逼近網(wǎng)絡(luò)有RBF網(wǎng)絡(luò)、小腦模型(CMAC)網(wǎng)絡(luò)、B樣條網(wǎng)絡(luò)等。
徑向基函數(shù)解決插值問題
完全內(nèi)插法要求插值函數(shù)經(jīng)過每個(gè)樣本點(diǎn),即。樣本點(diǎn)總共有P個(gè)。
RBF的方法是要選擇P個(gè)基函數(shù),每個(gè)基函數(shù)對(duì)應(yīng)一個(gè)訓(xùn)練數(shù)據(jù),各基函數(shù)形式為,由于距離是徑向同性的,因此稱為徑向基函數(shù)。||X-Xp||表示差向量的模,或者叫2范數(shù)。
假設(shè)x、x0∈RN,以x0為中心,x到x0的徑向距離為半徑所形成的‖x-x0‖構(gòu)成的函數(shù)系滿足k(x)=O?!瑇-x0‖稱為徑向基函數(shù)。
考慮徑向基函數(shù)插值在一些不同領(lǐng)域的來源.
最早可能是Krige ,他在1951 年把礦藏的沉積看成是一個(gè)各向同性的穩(wěn)定的隨機(jī)函數(shù)的實(shí)現(xiàn). 從而導(dǎo)出了廣泛應(yīng)用于礦藏分析的Kriging 方法. 在這方面的進(jìn)一步深入的理論工作主要是由Mathron 完成的.
1971 年Hardy 用徑向基函數(shù)Multi-Quadric來處理飛機(jī)外形設(shè)計(jì)曲面擬合問題, 取得了非常好的效果.
1975 年Duchon 從樣條彎曲能最小的理論出發(fā)導(dǎo)出了多元問題的薄板樣條. 這些從不同領(lǐng)域?qū)С龅姆椒? 事實(shí)上都是徑向基函數(shù)的插值方法,
他們所用的徑向基函數(shù)有:
1)Kriging 方法的Gauss 分布函數(shù)
2)Hardy 的Multi2Quadric 函數(shù)
3)Duchon 的薄板樣條
kde(kernel density estimation)是核密度估計(jì)。核的作用是根據(jù)離散采樣,估計(jì)連續(xù)密度分布。
如果原始采樣是《陰陽師》里的式神,那么kernel(核函數(shù))就相當(dāng)于御魂。
假設(shè)現(xiàn)在有一系列離散變量X = [4, 5, 5, 6, 12, 14, 15, 15, 16, 17],可見5和15的概率密度應(yīng)該要高一些,但具體有多高呢?有沒有三四層樓那么高,有沒有華萊士高?如果要估計(jì)的是沒有出現(xiàn)過的3呢?這就要自己判斷了。
核函數(shù)就是給空間的每個(gè)離散點(diǎn)都套上一個(gè)連續(xù)分布。最簡單的核函數(shù)是Parzen窗,類似一個(gè)方波:
這時(shí)候單個(gè)離散點(diǎn)就可以變成區(qū)間,空間或者高維空間下的超立方,實(shí)質(zhì)上是進(jìn)行了升維。
設(shè)h=4,則3的概率密度為:
(只有4對(duì)應(yīng)的核函數(shù)為1,其他皆為0)
kernel是非負(fù)實(shí)值對(duì)稱可積函數(shù),表示為K,且一本滿足:
這樣才能保證cdf仍為1。
實(shí)際上應(yīng)用最多的是高斯核函數(shù)(Gaussian Kernel),也就是標(biāo)準(zhǔn)正態(tài)分布。所謂核密度估計(jì)就是把所有離散點(diǎn)的核函數(shù)加起來,得到整體的概率密度分布。核密度估計(jì)在很多機(jī)器學(xué)習(xí)算法中都有應(yīng)用,比如K近鄰、K平均等。
在支持向量機(jī)里,也有“核”的概念,同樣也是給數(shù)據(jù)升維,最常用的還是高斯核函數(shù),也叫徑向基函數(shù)(Radial Basis Funtion)。
seaborn.kdeplot內(nèi)置了多種kerne,總有一款適合你。