Voice Commands on the Edge - Syntiant是如何解決功耗問題的,針對這個問題,這篇文章詳細介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
成都創(chuàng)新互聯(lián)公司服務(wù)項目包括合川網(wǎng)站建設(shè)、合川網(wǎng)站制作、合川網(wǎng)頁制作以及合川網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,合川網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到合川省份的部分城市,未來相信會繼續(xù)擴大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
云端語音服務(wù)最主要的問題就是隱私和安全的問題,其次是識別率(Accuracy),功耗和處理時間(prcessing time)等問題。其中隱私,又涉及到深層次的技術(shù)和倫理問題(mix of technical ability and ethics)。
接下來我們來討論Syntiant NDP10x系列處理器是如何解決前述(aforementioned)的挑戰(zhàn)的。
人機交互已經(jīng)走過了從鍵盤,到鼠標(biāo),到觸控,而如今語音控制也取得了引人矚目的進步(compelling progression),為消費類電子產(chǎn)品帶來了令人激動的創(chuàng)新(exciting innovation)。
在很多場景下語音控制非常有價值,在廚房我們手很臟的時候,在健身房手有很多汗的時候,或者泡溫泉手很濕的時候等等。而產(chǎn)品可能是藍牙音箱,耳機,或其他如手機或穿戴等移動設(shè)備等。
但是在這些邊緣側(cè)產(chǎn)品上支持語音交互同時也面臨著很多的技術(shù)問題,如需要在盡量降低電池功耗的同時保證語音識別的準(zhǔn)確性(maintain accuracy of key word spotting or wake word detection)。
Syntiant神經(jīng)網(wǎng)絡(luò)技術(shù)(neural network technology)允許藍牙音箱,藍牙耳機,或其他電池功耗非常有限的設(shè)備支持語音助理交互(voice assistant interactions)。
Syntiant NDP 10x專為(purpose-built)執(zhí)行深度神經(jīng)網(wǎng)絡(luò)算法而設(shè)計,支持始終在線能力(always-on capability),在檢測到喚醒詞后發(fā)出中斷激活應(yīng)用處理器(send interrupts to application processor),同時也支持本地語音命令嗎,如"volume up/volum down/answer call/mute, e.g.)。
關(guān)鍵因素在于(key element)在本地檢測喚醒詞激活僅需消耗140微瓦的功耗,比其他競爭產(chǎn)品的功耗小200倍以上,同時延遲也是最低的(lowest latency)。
Syntiant的超低功耗得益于其類似于門邏輯功能的模擬計算通路(analogy of the compute path in NDP。當(dāng)檢測到喚醒詞呼叫后,處理器會判定是或不是正確的喚醒詞,若檢測正確則發(fā)送中斷信號。
而采用MCU架構(gòu)的處理器則需要反復(fù)的將數(shù)據(jù)移入或移出內(nèi)存單元。
Syntiant NDP在并行計算處理上具有極大優(yōu)勢(exploit massive advantages in parallel processing)。
Syntiant NDP的另一個優(yōu)勢是其可以在較低比特率如8 bit執(zhí)行任務(wù),對比MCU則通常需要128或256 bit才可以獲得類似的精度。
NDP vs MCU/DSP
對于耳機或智能手機等近場交互產(chǎn)品(close-talk devices),語音識別的精度對產(chǎn)品尤其重要(extremely critical)。雖然Syntiant有能力開發(fā)自己的模型或庫(libraries or models),但同時也與行業(yè)內(nèi)幾個主要的算法廠商建立伙伴關(guān)系(aligned a partnership with several key algorithm partner companies)。
如Sensory,提供超高精度,支持15種語言的語音識別技術(shù)。
不僅是喚醒詞和本地語音命令,向NLP的技術(shù)演進對設(shè)備最終采用語音技術(shù)非常的重要,比如Sensory的本地嵌入式大單詞量自然語言識別技術(shù) - TrulyNatualLanguages(TNL)。
想象一下你的藍牙音箱,不僅可聽懂常規(guī)的語音命令,也可以對諸如"turn it up/crack it up"等口語表達做出正確反應(yīng),這將非常有趣并會極大的推動消費者對語音技術(shù)的采用。
隨著芯片技術(shù)和算法的不斷進步,將合力推動語音技術(shù)的進步和消費者體驗。
Syntiant AoV(always on voice)技術(shù)以超低功耗監(jiān)聽喚醒詞,只有在正確識別后才會激活應(yīng)用處理器連接云端或執(zhí)行指令。也就是說,采用Syntiant芯片技術(shù)方案,有效的避免了實時監(jiān)聽錄音(always recording or gethering)和收集用戶語音數(shù)據(jù),有效的保護了用戶的隱私。
隨著產(chǎn)品的小型化發(fā)展,采用按鍵或輕觸的操作方式越來越復(fù)雜和困難,如一些TWS產(chǎn)品輕敲左耳兩次靜音,輕敲右耳三次音樂快進,用戶記憶和使用成本非常之高。
語音喚醒和識別,對比輕敲觸控,是一種更加友好和易用的人機交互技術(shù)。
關(guān)于Voice Commands on the Edge - Syntiant是如何解決功耗問題的問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。