這篇文章主要介紹了python判斷中文是否一致的方法,具有一定借鑒價(jià)值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。
成都創(chuàng)新互聯(lián)是一家專注于網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)與策劃設(shè)計(jì),相城網(wǎng)站建設(shè)哪家好?成都創(chuàng)新互聯(lián)做網(wǎng)站,專注于網(wǎng)站建設(shè)十多年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:相城等地區(qū)。相城做網(wǎng)站價(jià)格咨詢:18982081108
Python判斷兩個(gè)相等的中文字符串為false,將兩個(gè)待比較的字符串都把unicode編碼設(shè)為‘utf-8’也不能解決問題,具體原因如下:
1、首先查看待比較兩個(gè)字符串的編碼格式 ,使用命令:
import chardet ...... string_code = chardet.detect(string_word)
比較兩個(gè)字符串的編碼結(jié)果,如下圖所示:
一個(gè)編碼格式為‘UTF-8-SIG',另一個(gè)編碼格式為‘utf-8',兩個(gè)字符串的編碼格式不同,所以比較的結(jié)果為不相等;
出現(xiàn)編碼為‘UTF-8-SIG'是因?yàn)槲募诖鎯?chǔ)的時(shí)候以UTF-8格式編碼保存,將文件以UTF-8無(wú)BOM格式編碼存儲(chǔ),則讀取出的數(shù)據(jù)編碼格式自然變?yōu)椤畊tf-8'。
2、文件以UTF-8無(wú)BOM格式編碼重新存儲(chǔ),重新比較兩個(gè)相等的字符串,返回值為True,即兩個(gè)字符串相等。
感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享python判斷中文是否一致的方法內(nèi)容對(duì)大家有幫助,同時(shí)也希望大家多多支持創(chuàng)新互聯(lián),關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,遇到問題就找創(chuàng)新互聯(lián),詳細(xì)的解決方法等著你來(lái)學(xué)習(xí)!