小編給大家分享一下使用python腳本進行文本轉(zhuǎn)換的方法,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
創(chuàng)新互聯(lián)公司是一家集網(wǎng)站建設,于田企業(yè)網(wǎng)站建設,于田品牌網(wǎng)站建設,網(wǎng)站定制,于田網(wǎng)站建設報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,于田網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。語音識別通常有以下流程:
l 接收語音,比如通過電話等方式
l 對接收到的語音做處理,將聲音轉(zhuǎn)化為電子信號
l 通過模擬數(shù)字轉(zhuǎn)換器將模擬形式的連續(xù)電子信號轉(zhuǎn)換為數(shù)字形式的離散信號
l 轉(zhuǎn)換成數(shù)字信號后,模型便可以將音頻轉(zhuǎn)換為文本了
Python 庫
pip install SpeechRecognition
將音頻文件轉(zhuǎn)換為文本
l 導入語音識別庫
l 初始化識別類,以便識別語音。
l 支持語音識的音頻文件格式:wav, AIFF, AIFF-C, FLAC Wav,AIFF,AIFF-c,F(xiàn)LAc.在這個例子中我們使用wav文件.
l 我用的是一段電影音頻剪輯,里邊說的話是:"I don’t know who you are,I don’t know what you want, if you’re looking for ransom,I can tell you I don’t have money"
l 默認情況下,谷歌識別器讀取的是英語。
具體代碼如下所示:
#import library import speech_recognition as sr # Initialize recognizer class (for recognizing the speech) r = sr.Recognizer() # Reading Audio file as source # listening the audio file and store in audio_text variable with sr.AudioFile('I-dont-know.wav') as source: audio_text = r.listen(source) # recoginize_() method will throw a request error if the API is unreachable, hence using exception handling try: # using google speech recognition text = r.recognize_google(audio_text) print('Converting audio transcripts into text ...') print(text) except: print('Sorry.. run again...')
以上是使用python腳本進行文本轉(zhuǎn)換的方法的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道!