這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)基于RNN網(wǎng)絡(luò)的Deepfake檢測(cè)是怎樣的,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
公司主營(yíng)業(yè)務(wù):網(wǎng)站設(shè)計(jì)制作、網(wǎng)站設(shè)計(jì)、移動(dòng)網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競(jìng)爭(zhēng)能力。成都創(chuàng)新互聯(lián)公司是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對(duì)我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來驚喜。成都創(chuàng)新互聯(lián)公司推出下冶免費(fèi)做網(wǎng)站回饋大家。
今天給大家介紹的是一篇基于CNN+RNN結(jié)構(gòu)的檢測(cè)Deepfakes框架
大部分檢測(cè)假臉工作是在圖片上進(jìn)行的,而針對(duì)deepfake視頻往往有很少檢測(cè)方法。這個(gè)工作里我們提出了一種基于時(shí)間序列的處理方法,用于檢測(cè)Deepfake視頻。我們采用了CNN去提取幀級(jí)別的高維特征,并用這些高維特征訓(xùn)練RNN。我們展示了通過一個(gè)簡(jiǎn)單的架構(gòu)也能在檢測(cè)任務(wù)上達(dá)到不俗的效果。
深度學(xué)習(xí)方法可用于圖片壓縮性能, 最常用的就是自編解碼器(AutoEncoder-Decoder)。自編碼器可以通過最小化損失函數(shù),將圖片壓縮成一個(gè)高維特征,這比現(xiàn)有的壓縮方法都要來的高效
而編碼器則是將高維特征映射回圖片,如Figure2所示
使得Deepfakes生效,關(guān)鍵是將兩個(gè)潛在的人臉編碼到相同的特征上
我們通過共享一個(gè)自編碼器權(quán)重,而去分別訓(xùn)練兩個(gè)自解碼器。
當(dāng)我們?nèi)ヌ鎿Q人臉的時(shí)候,先對(duì)輸入圖像編碼,再用目標(biāo)人臉解碼器去解碼
但是自編解碼器在不同攝像角度,不同光照等復(fù)雜條件下,很難去生成人臉。種種條件變化導(dǎo)致人臉替換部分與背景在視覺上不一致,這種幀級(jí)別的場(chǎng)景不一致性將是我們方法利用的第一個(gè)特性
第二個(gè)特性來自于替換人臉需要用到人臉檢測(cè)器,而自編解碼器只關(guān)注人臉部分,很少去關(guān)注余下的背景信息,因此最后融合很容易出現(xiàn)邊界效應(yīng)
第三個(gè)特性是自編解碼器是獨(dú)立于每一幀的,它并不考慮前后幀生成人臉圖片效果。最突出的是幀與幀之間光源的不一致性,導(dǎo)致假臉有閃爍現(xiàn)象,這種特征是很適合使用CNN來進(jìn)行像素級(jí)別的檢測(cè)。
至此我們確定了基礎(chǔ)架構(gòu),由CNN提取幀特征,由LSTM進(jìn)行時(shí)間序列上的分析,我們的網(wǎng)絡(luò)還包含2個(gè)全連接層加Dropout以防模型過擬合
我們使用預(yù)訓(xùn)練后的InceptionV3網(wǎng)絡(luò)作為CNN結(jié)構(gòu),對(duì)輸入的圖片抽取出2048個(gè)特征。
抽取得到的2048特征,送入LSTM單元,接一個(gè)512單元的全連接層,0.5概率的Dropout,最后通過softmax計(jì)算概率,做最終的二分類
最終結(jié)果顯示增加幀序列,能提高一定的準(zhǔn)確率,但是提升幅度不是很大
上述就是小編為大家分享的基于RNN網(wǎng)絡(luò)的Deepfake檢測(cè)是怎樣的了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。