摘要:
讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:域名注冊、虛擬空間、營銷軟件、網(wǎng)站建設(shè)、金鄉(xiāng)網(wǎng)站維護、網(wǎng)站推廣。近幾天在做一個東西,其中需要對圖像中的文字進行識別,看了前輩們的文章,找到兩個較簡單的方法:使用python的pytesseract庫和調(diào)用百度AI平臺接口。寫下這篇文章做一個比較簡短的記錄和學(xué)習(xí),后期如果有新內(nèi)容再行補充。
1、使用python的pytesseract庫
主要是安裝庫,比較簡單,直接使用 pip install 安裝即可;另外,如果進行中文識別,需要下載語言包,并配置好相應(yīng)環(huán)境,具體操作可以進行百度,教程有不少。因為這個識別方法比較簡單(但效果并不是很理想),下面直接貼出測試代碼:
import pytesseract from PIL import Image img = Image.open('./testImages/test01.jpg') pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe' s = pytesseract.image_to_string(img, lang='chi_sim') #不加lang參數(shù)的話,默認進行英文識別 print(s)
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。