這篇文章將為大家詳細(xì)講解有關(guān)解決python在html中顯示亂碼的問(wèn)題,小編覺(jué)得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)專(zhuān)注于南山企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,商城網(wǎng)站制作。南山網(wǎng)站建設(shè)公司,為南山等地區(qū)提供建站服務(wù)。全流程按需制作網(wǎng)站,專(zhuān)業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)專(zhuān)業(yè)和態(tài)度為您提供的服務(wù)
python寫(xiě)入html文件中文亂碼問(wèn)題
使用open函數(shù)將爬蟲(chóng)爬取的html寫(xiě)入文件,有時(shí)候在控制臺(tái)不會(huì)亂碼,但是寫(xiě)入文件的html中的中文是亂碼的
案例分析
看下面一段代碼:
# 爬蟲(chóng)未使用cookie from urllib import request if __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w")as f: # 將爬取的頁(yè)面 print(html) f.write(html)
看似沒(méi)有問(wèn)題,并且在控制臺(tái)輸出的html也不會(huì)出現(xiàn)中文亂碼,但是創(chuàng)建的html文件中
解決方案
使用open方法的一個(gè)參數(shù),名為encoding=” “,加入encoding=”utf-8”即可
# 爬蟲(chóng)未使用cookie from urllib import request if __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w",encoding="utf-8")as f: # 將爬取的頁(yè)面 print(html) f.write(html)
運(yùn)行結(jié)果
關(guān)于解決python在html中顯示亂碼的問(wèn)題就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。