下面講講關(guān)于MySQL中GBK字符集和UTF8字符編碼的相關(guān)操作,文字的奧妙在于貼近主題相關(guān)。所以,閑話就不談了,我們直接看下文吧,相信看完MySQL中GBK字符集和UTF8字符編碼的相關(guān)操作這篇文章你一定會有所受益。
成都創(chuàng)新互聯(lián)長期為近1000家客戶提供的網(wǎng)站建設(shè)服務(wù),團隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為長島企業(yè)提供專業(yè)的成都做網(wǎng)站、網(wǎng)站制作,長島網(wǎng)站改版等技術(shù)服務(wù)。擁有10年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。
GBK 和UTF8的實際在系統(tǒng)里面的存放方式:
1、GBK:
> SELECT hex(convert('你好' using gbk));
+----------------------------------+
| hex(convert('你好' using gbk)) |
|----------------------------------|
| C4E3BAC3 |
+----------------------------------+
GBK字符集是按照4個長度來分割的,因此得出對應(yīng)關(guān)系:
你 --> C4E3
好 --> BAC3
2、UTF-8:
> SELECT hex(convert('你好' using utf8));
+-----------------------------------+
| hex(convert('你好' using utf8)) |
|-----------------------------------|
| E4BDA0E5A5BD |
+-----------------------------------+
UTF8字符集是按照6個長度來分割的,因此得出對應(yīng)關(guān)系:
你 --> E4BDA0
好 --> E5A5BD
這樣我們就能發(fā)現(xiàn)不同的地方了。假如我們用的是UTF-8存進去的"你好"(對應(yīng)的底層存儲為:E4BDA0E5A5BD),但是使用GBK的方式來讀取的話,GBK會對E4BDA0E5A5BD按照每4個bit長度切分,最終切分成E4BD A0E5 A5BD 這個樣子。
(如下)
> SELECT CONVERT( unhex('E4BDA0E5A5BD') USING GBK);
+-------------------------------------------+
| CONVERT( unhex('E4BDA0E5A5BD') USING GBK) |
+-------------------------------------------+
| 浣犲ソ | ---> 采用GBK的方式讀出來就成亂碼了
+-------------------------------------------+
> SELECT hex(convert('浣' using gbk));
+-------------------------------+
| hex(convert('浣' using gbk)) |
+-------------------------------+
| E4BD |
+-------------------------------+
> SELECT hex(convert('犲' using gbk));
+-------------------------------+
| hex(convert('犲' using gbk)) |
+-------------------------------+
| A0E5 |
+-------------------------------+
> SELECT hex(convert('ソ' using gbk));
+-------------------------------+
| hex(convert('ソ' using gbk)) |
+-------------------------------+
| A5BD |
+-------------------------------+
補充,將16進制的編碼反推成UTF8編碼的漢字:
> SELECT CONVERT( unhex('E4BDA0E5A5BD') USING utf8);
+--------------------------------------------+
| CONVERT( unhex('E4BDA0E5A5BD') USING utf8) |
+--------------------------------------------+
| 你好 |
+--------------------------------------------+
> SELECT CONVERT( unhex('E4BDA0E5A5BD') USING GBK);
+-------------------------------------------+
| CONVERT( unhex('E4BDA0E5A5BD') USING GBK) |
+-------------------------------------------+
| 浣犲ソ | ---> 采用GBK的方式讀出來就成亂碼了
+-------------------------------------------+
對于以上MySQL中GBK字符集和UTF8字符編碼的相關(guān)操作相關(guān)內(nèi)容,大家還有什么不明白的地方嗎?或者想要了解更多相關(guān),可以繼續(xù)關(guān)注我們的行業(yè)資訊板塊。