python filter內(nèi)建函數(shù)
站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到鎮(zhèn)坪網(wǎng)站設(shè)計(jì)與鎮(zhèn)坪網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、外貿(mào)網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、域名注冊(cè)、虛擬主機(jī)、企業(yè)郵箱。業(yè)務(wù)覆蓋鎮(zhèn)坪地區(qū)。
filter函數(shù)是python內(nèi)建函數(shù),可以操作任何可迭代類型,如list,tuple,string.
filter需要帶上一個(gè)函數(shù)function和一個(gè)可迭代序列作為參數(shù)。filter()將調(diào)用該function作用于每一個(gè)可迭代序列的元素,并返回一個(gè)由該function驗(yàn)證后返回值為true的元素組成新的可迭代序列,新序列的類型保持與filter參數(shù)序列的類型一致
2.filter與數(shù)字
下面用這個(gè)例子來(lái)說(shuō)明:
#建個(gè)數(shù)字列表
numbers?=?[1,5,9,8,4,6,3,7]
#定義一個(gè)過(guò)濾標(biāo)準(zhǔn),取小于5的數(shù)
def?lessThanFive(element):
return?element??5
print?filter(lessThanFive,?numbers)
輸出結(jié)果是列表:[1,4,3]
解說(shuō):此處的過(guò)濾函數(shù)lessThanFive必需帶入一個(gè)參數(shù)(filter()會(huì)調(diào)用lessThanFive,參數(shù)是列表nembers中的每一個(gè)元素,一次一個(gè))。filter()返回所有值都是小于5的列表
3.filter與字符串
下面用如下例子說(shuō)明:
#定義元組類型
names?=?('Jack',?'Jill,?'Steve',?'')
#篩選出名字
new_names?=?filter(None,?names)
print?new_names
輸出結(jié)果是元組:
('Jack',?'Jill,?'Steve')
在元組names最后一個(gè)名字是空字符串,而filter的第一個(gè)參數(shù)是None,這說(shuō)明需要使用identity函數(shù)(該函數(shù)是簡(jiǎn)單的返回該元素的)
因?yàn)閜ython對(duì)空字符串,0和None作為False,所以上面的filter的語(yǔ)句就是移除空元素。
4.filter和函數(shù)
目的:找出以J開(kāi)頭的名字
def?startsWithJ(element):
if?element:
return?element[0]?==?'J'
return?False
j_names?=?filter(startsWithJ,?names)
print?j_names
輸出結(jié)果是元組:('Jack',?'Jill')
注意到了嗎,上面的2個(gè)結(jié)果都是tuple而不是list,再一次說(shuō)明fliter的返回值類型與參數(shù)序列的類型保持一致
原始數(shù)據(jù)是[1 9 2 8 3 7]
嵌入:
比如選擇的窗口長(zhǎng)度L為3,得到的矩陣就是:
[1 9 2]
[9 2 8]
[2 8 3]
[8 3 7]
SVD分解:
Python里自帶一個(gè)函數(shù)進(jìn)行分解,就不用它參考文獻(xiàn)上寫(xiě)的啥X乘X的轉(zhuǎn)置了,函數(shù)是這個(gè):
u, s, v = np.linalg.svd(嵌入得到的矩陣)
得到的三個(gè)結(jié)果是這樣的
u是個(gè)形狀為(4, 4)的矩陣,為啥是4我不知道
[-0.34748861 -0.67722177? 0.41306458 -0.5? ? ? ]
[-0.62332023? 0.4373678? -0.41253036 -0.5? ? ? ]
[-0.38669102 -0.52074809 -0.57383924? 0.5? ? ? ]
[-0.58411781? 0.28089413? 0.57437346? 0.5? ? ? ]
s是,形狀為(3,)?
[18.29004176? 9.97102473? 0.23030046]
奇藝譜就是s里取最大值,這里為 18.29004175999194
v是,形狀是(3, 3)
[-0.62349202 -0.50409505 -0.59761683]
[ 0.44777196 -0.85683898? 0.25559193]
[ 0.64090402? 0.10823653 -0.7599519 ]
重構(gòu):
重構(gòu)矩陣的計(jì)算方法是 newMatrix = value * u1 * v1
value就是奇藝譜,SVD分解里得到的s里的最大值,上面也提了一下,這里value是: 18.29004175999194
u1是在u的基礎(chǔ)上,取第一行,為
[-0.34748861 -0.62332023 -0.38669102 -0.58411781]
v1是在u的基礎(chǔ)上,取第一行,為
[-0.62349202 -0.50409505 -0.59761683]
計(jì)算時(shí)需要對(duì)u1進(jìn)行轉(zhuǎn)置,轉(zhuǎn)置后的u1是:
[-0.34748861]
[-0.62332023]
[-0.38669102]
[-0.58411781]
重構(gòu)完的矩陣就是:
[3.96265415 3.203817? 3.79820225]
[7.10815385 5.74696232 6.81316231]
[4.40970654 3.56526011 4.22670177]
[6.66110146 5.38551921 6.3846628 ]
最后把重構(gòu)完的矩陣再轉(zhuǎn)變?yōu)橐痪S數(shù)組:
設(shè)這個(gè)一維數(shù)組叫ret[],對(duì)于重構(gòu)完的矩陣,對(duì)每一條次對(duì)角線進(jìn)行計(jì)算,并把結(jié)果添加到ret[]里
利用兩個(gè)動(dòng)態(tài)的變量,這里分別叫sigma和alpha,sigma是每條次對(duì)角線的數(shù)據(jù)的和,alpha是次對(duì)角線長(zhǎng)度
ret.append(sigma/alpha)
就相當(dāng)于添加了每條次對(duì)角線的平均值。
過(guò)程大概是這樣的:
pos is( 0 , 0 ) sigma+
alpha is 1 now
ret[] append
pos is( 1 , 0 ) sigma+,
pos is( 0 , 1 ) sigma+
alpha is 2 now
ret[] append
pos is( 2 , 0 ) sigma+
pos is( 1 , 1 ) sigma+
pos is( 0 , 2 ) sigma+
alpha is 3 now
ret[] append
pos is( 3 , 0 ) sigma+
pos is( 2 , 1 ) sigma+
pos is( 1 , 2 ) sigma+
alpha is 3 now
ret[] append
pos is( 3 , 1 ) sigma+
pos is( 2 , 2 ) sigma+
alpha is 2 now
ret[] append
pos is( 3 , 2 ) sigma+
alpha is 1 now
ret[] append
處理后的數(shù)據(jù)ret[]為:
[3.9626541544632476 5.155985423726059 4.651623704998423 5.67984129396347 4.806110489242382 6.384662797164128]
就是最終結(jié)果
備注:
因?yàn)榇翱陂L(zhǎng)度L的選擇不宜超過(guò)數(shù)據(jù)長(zhǎng)度的1/3,這里數(shù)據(jù)長(zhǎng)度是6,L為了為了算著方便選的3,所以這個(gè)例子的效果不好,但是領(lǐng)會(huì)精神。
做為參考的話,處理數(shù)據(jù)的時(shí)候,數(shù)據(jù)長(zhǎng)度是300+,L選的4。
源碼訪問(wèn):
參考文獻(xiàn)
數(shù)字信號(hào)是通過(guò)對(duì)連續(xù)的模擬信號(hào)采樣得到的離散的函數(shù)。它可以簡(jiǎn)單看作一個(gè)以時(shí)間為下標(biāo)的數(shù)組。比如,x[n],n為整數(shù)。比如下圖是一個(gè)正弦信號(hào)(n=0,1, ..., 9):
對(duì)于任何的音頻文件,實(shí)際上都是用這種存儲(chǔ)方式,比如,下面是對(duì)應(yīng)英文單詞“skip”的一段信號(hào)(只不過(guò)由于點(diǎn)太多,筆者把點(diǎn)用直線連接了起來(lái)):
衡量數(shù)字信號(hào)的 能量(強(qiáng)度) ,只要簡(jiǎn)單的求振幅平方和即可:
我們知道,聲音可以看作是不同頻率的正弦信號(hào)疊加。那么給定一個(gè)聲音信號(hào)(如上圖),怎么能夠知道這個(gè)信號(hào)在不同頻率區(qū)段上的強(qiáng)度呢?答案是使用離散傅里葉變換。對(duì)信號(hào)x[n], n=0, ..., N-1,通常記它的離散傅里葉變換為X[n],它是一個(gè)復(fù)值函數(shù)。
比如,對(duì)上述英文單詞“skip”對(duì)應(yīng)的信號(hào)做離散傅里葉變換,得到它在頻域中的圖像是:
可以看到能量主要集中在中低音部分(約16000Hz以下)。
在頻域上,也可以計(jì)算信號(hào)的強(qiáng)度,因?yàn)楦鶕?jù)Plancherel定理,有:
對(duì)于一般的語(yǔ)音信號(hào),長(zhǎng)度都至少在1秒以上,有時(shí)候我們需要把其中比如25毫秒的一小部分單獨(dú)拿出來(lái)研究。將一個(gè)信號(hào)依次取小段的操作,就稱作分幀。技術(shù)上,音頻分幀是通過(guò)給信號(hào)加一系列的 窗 函數(shù) 實(shí)現(xiàn)的。
我們把一種特殊的函數(shù)w[n],稱作窗函數(shù),如果對(duì)所有的n,有0=w[n]=1,且只有有限個(gè)n使得w[n]0。比如去噪要用到的漢寧窗,三角窗。
漢寧窗
三角窗
我們將平移的窗函數(shù)與原始信號(hào)相乘,便得到信號(hào)的“一幀”:
w[n+d]*x[n]
比如用長(zhǎng)22.6毫秒的漢寧窗加到“skip”信號(hào)大約中間部位上,得到一幀的信號(hào):
可見(jiàn)除一有限區(qū)間之外,加窗后的信號(hào)其他部分都是0。
對(duì)一幀信號(hào)可以施加離散傅里葉變換(也叫短時(shí)離散傅里葉變換),來(lái)獲取信號(hào)在這一幀內(nèi)(通常是很短時(shí)間內(nèi)),有關(guān)頻率-能量的分布信息。
如果我們把信號(hào)按照上述方法分成一幀一幀,又將每一幀用離散傅里葉變換轉(zhuǎn)換到頻域中去,最后將各幀在頻域的圖像拼接起來(lái),用橫坐標(biāo)代表時(shí)間,縱坐標(biāo)代表頻率,顏色代表能量強(qiáng)度(比如紅色代表高能,藍(lán)色代表低能),那么我們就構(gòu)造出所謂 頻譜圖 。比如上述“skip”發(fā)音對(duì)應(yīng)的信號(hào)的頻譜圖是:
(使用5.8毫秒的漢寧窗)
從若干幀信號(hào)中,我們又可以恢復(fù)出原始信號(hào)。只要我們適當(dāng)選取窗口大小,以及窗口之間的平移距離L,得到 ..., w[n+2L], w[n+L], w[n], w[n-L], w[n-2L], ...,使得對(duì)k求和有:
從而簡(jiǎn)單的疊加各幀信號(hào)便可以恢復(fù)出原始信號(hào):
最后,注意窗函數(shù)也可以在頻域作用到信號(hào)上,從而可以起到取出信號(hào)的某一頻段的作用。
下面簡(jiǎn)單介紹一下3種音效。
1. 擴(kuò)音
要擴(kuò)大信號(hào)的強(qiáng)度,只要簡(jiǎn)單的增大信號(hào)的“振幅”。比如給定一個(gè)信號(hào)x[n],用a1去乘,便得到聲音更大的增強(qiáng)信號(hào):
同理,用系數(shù)0a1去乘,便得到聲音變小的減弱信號(hào)。
2. 去噪(降噪)
對(duì)于白噪音,我們可以簡(jiǎn)單的用“移動(dòng)平均濾波器”來(lái)去除,雖然這也會(huì)一定程度降低聲音的強(qiáng)度,但效果的確不錯(cuò)。但是,對(duì)于成分較為復(fù)雜,特別是頻段能量分布不均勻的噪聲,則需要使用下面的 噪聲門 技術(shù),它可以看作是一種“多帶通濾波器”。
這個(gè)特效的基本思路是:對(duì)一段噪聲樣本建模,然后降低待降噪信號(hào)中噪聲的分貝。
更加細(xì)節(jié)的說(shuō),是在信號(hào)的若干頻段f[1], ..., f[M]上,分別設(shè)置噪聲門g[1], ..., g[M],每個(gè)門都有一個(gè)對(duì)應(yīng)的閾值,分別是t[1], ..., t[M]。這些閾值時(shí)根據(jù)噪聲樣本確定的。比如當(dāng)通過(guò)門g[m]的信號(hào)強(qiáng)度超過(guò)閾值t[m]時(shí),門就會(huì)關(guān)閉,反之,則會(huì)重新打開(kāi)。最后通過(guò)的信號(hào)便會(huì)只保留下來(lái)比噪聲強(qiáng)度更大的聲音,通常也就是我們想要的聲音。
為了避免噪聲門的開(kāi)合造成信號(hào)的劇烈變動(dòng),筆者使用了sigmoid函數(shù)做平滑處理,即噪聲門在開(kāi)-關(guān)2個(gè)狀態(tài)之間是連續(xù)變化的,信號(hào)通過(guò)的比率也是在1.0-0.0之間均勻變化的。
實(shí)現(xiàn)中,我們用漢寧窗對(duì)信號(hào)進(jìn)行分幀。然后對(duì)每一幀,又用三角窗將信號(hào)分成若干頻段。對(duì)噪聲樣本做這樣的處理后,可以求出信號(hào)每一頻段對(duì)應(yīng)的閾值。然后,又對(duì)原始信號(hào)做這樣的處理(分幀+分頻),根據(jù)每一幀每一頻段的信號(hào)強(qiáng)度和對(duì)應(yīng)閾值的差(diff = energy-threshold),來(lái)計(jì)算對(duì)應(yīng)噪聲門的開(kāi)合程度,即通過(guò)信號(hào)的強(qiáng)度。最后,簡(jiǎn)單的將各頻段,各幀的通過(guò)信號(hào)疊加起來(lái),便得到了降噪信號(hào)。
比如原先的“skip”語(yǔ)音信號(hào)頻譜圖如下:
可以看到有較多雜音(在高頻,低頻段,藍(lán)色部分)。采集0.25秒之前的聲音作為噪聲樣本,對(duì)信號(hào)作降噪處理,得到降噪后信號(hào)的頻譜圖如下:
可以明顯的看到大部分噪音都被清除了,而語(yǔ)音部分仍完好無(wú)損,強(qiáng)度也沒(méi)有減弱,這是“移動(dòng)平均濾波器”所做不到的。
3. 靜音剪切
在對(duì)音頻進(jìn)行上述降噪處理后,我們還可以進(jìn)一步把多余的靜音去除掉。
剪切的原理十分簡(jiǎn)單。首先用漢寧窗對(duì)信號(hào)做分幀。如果該幀信號(hào)強(qiáng)度過(guò)小,則舍去該幀。最后將保留的幀疊加起來(lái),便得到了剪切掉靜音部分的信號(hào)。
比如,對(duì)降噪處理后的“skip”語(yǔ)音信號(hào)做靜音剪切,得到的新信號(hào)的頻譜圖為:
使用opencv-python的內(nèi)置函數(shù),對(duì)圖片進(jìn)行降噪處理。
8Fourier變換的應(yīng)用——圖像去噪
給出的圖片是RGB圖片,也就是需要有三個(gè)通道。
下面的函數(shù)用來(lái)去噪。
img=np.uint8(cv2.fastNlMeansDenoisingColored(img,None,10,10,7,21))
對(duì)這個(gè)圖片進(jìn)行局部自適應(yīng)二值化處理:
img=hui(img)
th1 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,31,5)
另一種局部自適應(yīng)二值化處理:
th2 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,31,5)
在第一步連續(xù)執(zhí)行兩次去噪,得到的三幅圖片是:
執(zhí)行三次降噪。
連續(xù)10次降噪。