Amazon在計(jì)算機(jī)視覺和圖形識別重要年度會議CVPR中,發(fā)布了三篇改善用戶線上購買衣物體驗(yàn)的論文,除了改善文本搜索商品的能力之外,也要讓系統(tǒng)能夠主動推薦能補(bǔ)充用戶已選擇商品的建議,并且還要讓系統(tǒng)能夠合成衣服到模特兒身上。
創(chuàng)新互聯(lián)建站服務(wù)項(xiàng)目包括回民網(wǎng)站建設(shè)、回民網(wǎng)站制作、回民網(wǎng)頁制作以及回民網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,回民網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到回民省份的部分城市,未來相信會繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!Amazon的第一篇論文描述了一種,能夠讓用戶通過文本描述,修正產(chǎn)品查詢的方法,像是用戶能以“我想要淺色的花朵圖案”,來改善產(chǎn)品查詢結(jié)果。研究人員訓(xùn)練了一個擁有三個輸入的神經(jīng)網(wǎng)絡(luò)模型,三個輸入分別為來源圖像、文本修正描述以及與文本描述相符的目標(biāo)圖像,這個主模型由位于工作管線中不同位置的三個子模型組成。
研究人員設(shè)計(jì)了一種可將文本描述表示,和圖像特征表示融合在一起的方法,在工作管線中,來源圖像和文本描述表示,會先融合在一起,接著才與目標(biāo)圖像相互關(guān)聯(lián)。
由于較低端的模型傾向表示像是材質(zhì)與顏色等較低端的特征,而較高端的模型表達(dá)袖子長短和松緊等較高端的特征,因此這個新系統(tǒng)使用的分層配對(Hierarchical Matching)技術(shù),有助于訓(xùn)練模型,確保能在不同層次適當(dāng)處理文本修正。
每種語言描述和視覺表現(xiàn)的融合,都由兩個獨(dú)立的組件模型執(zhí)行,其中一個關(guān)注來源圖像和目標(biāo)圖像需要維持相同的視覺特征,另一個則關(guān)注要改變的特征。經(jīng)過測試,這個系統(tǒng)有助于提高搜索到與文本修正相符結(jié)果的幾率,較之前系統(tǒng)提高58%。
而Amazon的第二篇論文,則是建議用戶購買能夠補(bǔ)充選購衣物的商品,研究人員提到,這項(xiàng)新系統(tǒng)能夠預(yù)測服裝和飾品的兼容性,并在用戶選擇襯衫和夾克之后,推薦可搭配的鞋子。圖像會經(jīng)過模型產(chǎn)生一個表示矢量,矢量會以遮罩處理,這個經(jīng)訓(xùn)練的遮罩,能夠?qū)κ噶刻卣鬟M(jìn)行調(diào)整,縮小部分特征的影響以及放大部分特征的影響。
當(dāng)目錄中的每個物品都以矢量表示,則要找出特定服裝的搭配,就變成了矢量配對的問題,研究人員提到,這個系統(tǒng)能以56.19%精確度推薦商品,較之前的系統(tǒng)表現(xiàn)都還好。
第三篇論文則是描述一個能將衣服合成到目標(biāo)模特兒身上的系統(tǒng)Outfit-VITON,相當(dāng)于虛擬試穿系統(tǒng),將參考照片中人物的穿著,合成到另一張照片的模特兒身上,研究人員提到,Outfit-VITON使用對抗網(wǎng)絡(luò),由生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的競爭產(chǎn)生結(jié)果。
Outfit-VITON由三部分組成,形狀生成模型、外觀生成模型以及外觀修正模型,形狀生成模型會圈出要試穿的衣服形狀,并計(jì)算要試穿模特兒的身材以及動作,其輸出的形狀表示到外觀生成模型,外觀生成模型的工作和形狀生成模型相似,其會結(jié)合形狀生成模型所生成的結(jié)果,合成出模特兒穿著指定服飾的照片,接著由第三個模型進(jìn)行微調(diào),保留商標(biāo)以及特殊圖案,研究人員表示,這個系統(tǒng)比以前的系統(tǒng)產(chǎn)生更自然的結(jié)果,能夠產(chǎn)生正確的分割圖,通過改變所選服裝的形狀,以符合目標(biāo)人物。