這篇文章主要介紹“MySQL字符轉(zhuǎn)化出現(xiàn)亂碼的原因”,在日常操作中,相信很多人在mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
成都創(chuàng)新互聯(lián)一直通過網(wǎng)站建設(shè)和網(wǎng)站營銷幫助企業(yè)獲得更多客戶資源。 以"深度挖掘,量身打造,注重實效"的一站式服務(wù),以網(wǎng)站設(shè)計、成都網(wǎng)站設(shè)計、移動互聯(lián)產(chǎn)品、成都營銷網(wǎng)站建設(shè)服務(wù)為核心業(yè)務(wù)。十余年網(wǎng)站制作的經(jīng)驗,使用新網(wǎng)站建設(shè)技術(shù),全新開發(fā)出的標準網(wǎng)站,不但價格便宜而且實用、靈活,特別適合中小公司網(wǎng)站制作。網(wǎng)站管理系統(tǒng)簡單易用,維護方便,您可以完全操作網(wǎng)站資料,是中小公司快速網(wǎng)站建設(shè)的選擇。
mysql中存入數(shù)據(jù)時發(fā)生的編碼轉(zhuǎn)換過程:
1、在終端(Terminal,可以是bash窗口,也可以是客戶端工具如navicat)中輸入,輸入的內(nèi)容由Terminal根據(jù)其自己的字符進行編碼。
2、經(jīng)Terminal編碼后的二進制流被傳輸?shù)絤ysql server。mysql server(mysql engine)根據(jù)參數(shù)character_set_client的字符設(shè)置來對該二進制流進行解碼。
3、解碼之后,mysql server再次根據(jù)目的表,即table的字符集來判斷是否需要字符編碼轉(zhuǎn)換。如果character_set_client的字符設(shè)置和table定義時的character設(shè)置一致,則無需字符編碼轉(zhuǎn)換。否則進行轉(zhuǎn)換,然后將轉(zhuǎn)換后的二進制流存放到數(shù)據(jù)文件(file)中去。
總結(jié):client ------> server(engine) -----> file 需要經(jīng)過三次編碼,兩次編碼轉(zhuǎn)化。
mysql中取出數(shù)據(jù)時發(fā)生的編碼轉(zhuǎn)換過程:
1、從數(shù)據(jù)文件(file)中讀出二進制數(shù)據(jù)流,將該數(shù)據(jù)流根據(jù)table定義時的character設(shè)置來進行解碼。
2、在用table character對二級制數(shù)據(jù)流進行解碼之后,在mysql engine(mysql server)中,需要根據(jù)參數(shù)character_set_client的字符集設(shè)置對解碼后的數(shù)據(jù)庫流再一次進行編碼,將編碼之后的二級制數(shù)據(jù)庫流傳輸?shù)絚lient端。
3、client端,即終端(Terminal)根據(jù)其自己的字符集編碼來展示查詢結(jié)果。
總結(jié): file ------> server(engine) -----> client 需要經(jīng)過三次編碼,兩次編碼轉(zhuǎn)化。
可能會有些疑問,在上面的分析中,數(shù)據(jù)都是以二進制流的方式在各個節(jié)點之間流動的。那么為什么需要編碼轉(zhuǎn)化了?
1、client 和 server(engine) 之間的轉(zhuǎn)換,或者說編解碼是為了對傳進來的二進制流做語法和詞法解析,否則你不會知道傳進來的是insert還是update。
2、file 和 server(engine) 之間的轉(zhuǎn)換是為了在從數(shù)據(jù)文件讀入數(shù)據(jù)后,在存儲引擎內(nèi)部進行字符級別的操作。
經(jīng)過以上分析,應(yīng)該很快發(fā)現(xiàn)導(dǎo)致亂碼出現(xiàn)的原因是有以下幾種:
1、數(shù)據(jù)在存入的時候和取出的時候,編碼不一致。比如存入時用的utf8,取出時用的GBK。
2、編碼轉(zhuǎn)換不是無損編碼轉(zhuǎn)換導(dǎo)致亂碼出現(xiàn)。比如clien是utf8,mysql server中的character_set_client設(shè)置為gbk,表結(jié)構(gòu)的字符集設(shè)置為utf8。這里會有兩次編碼轉(zhuǎn)化,client到server時,utf8要轉(zhuǎn)為gbk,然后server到file時,gbk要轉(zhuǎn)為utf8。由于gbk到utf8是有損編碼轉(zhuǎn)化,導(dǎo)致了亂碼出現(xiàn)。
無損編碼轉(zhuǎn)換:假設(shè)我們要把用編碼A表示的字符X,轉(zhuǎn)化為編碼B的表示形式,而編碼B的字形集中并沒有X這個字符,那么此時我們就稱這個轉(zhuǎn)換是有損的。
但不是任何兩種字符集編碼之間的轉(zhuǎn)換都是有損,轉(zhuǎn)換是否有損取決于以下幾點:
------被轉(zhuǎn)換的字符是否同時在兩個字符集中
------標字符集是否能夠?qū)Σ恢С肿址A羝湓斜磉_形式。(比如latin1在遇到自己無法表示的字符時,會保留原字符集的編碼數(shù)據(jù),并跳過忽略該字符進而處理后面的數(shù)據(jù)。)
因此只要客戶端,MySQL Server的character-set-client,table charset的三個字符集完全一致就可以保證一定不會有亂碼出現(xiàn)了。
到此,關(guān)于“mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
當前文章:mysql字符轉(zhuǎn)化出現(xiàn)亂碼的原因
當前URL:http://weahome.cn/article/jcijhe.html