小編給大家分享一下解決python爬取中文輸出亂碼的問題,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
創(chuàng)新互聯(lián)是一家集網(wǎng)站建設,伊州企業(yè)網(wǎng)站建設,伊州品牌網(wǎng)站建設,網(wǎng)站定制,伊州網(wǎng)站建設報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,伊州網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。
爬蟲部分代碼如下
`` r = requests.get('http://www.xxxxxxxxxxxxxxx.html') print(r.text) ```
初次試寫python爬蟲爬取網(wǎng)頁小說,
但是會出現(xiàn)中文亂碼,很是尷尬。
解決辦法
先 r.encoding = r.apparent_encoding # 解決中文亂碼
解碼后再取text。 結束
看完了這篇文章,相信你對解決python爬取中文輸出亂碼的問題有了一定的了解,想了解更多相關知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!