一、轉(zhuǎn)碼失敗
創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),清原企業(yè)網(wǎng)站建設(shè),清原品牌網(wǎng)站建設(shè),網(wǎng)站定制,清原網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營(yíng)銷,網(wǎng)絡(luò)優(yōu)化,清原網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競(jìng)爭(zhēng)力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長(zhǎng)自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。
在數(shù)據(jù)寫入到表的過程中轉(zhuǎn)碼失敗,數(shù)據(jù)庫(kù)端也沒有進(jìn)行恰當(dāng)?shù)奶幚?,?dǎo)致存放在表里的數(shù)據(jù)亂碼。
針對(duì)這種情況,前幾篇文章介紹過客戶端發(fā)送請(qǐng)求到服務(wù)端。
其中任意一個(gè)編碼不一致,都會(huì)導(dǎo)致表里的數(shù)據(jù)存入不正確的編碼而產(chǎn)生亂碼。
比如下面簡(jiǎn)單一條語(yǔ)句:
set @a = "文本字符串";
insert into t1 values(@a);
變量 @a 的字符編碼是由參數(shù) CHARACTER_SET_CLIENT 決定的,假設(shè)此時(shí)編碼為 A,也就是變量 @a 的編碼。
2. 寫入語(yǔ)句在發(fā)送到 MySQL 服務(wù)端之前的編碼由 CHARACTER_SET_CONNECTION 決定,假設(shè)此時(shí)編碼為 B。
3. 經(jīng)過 MySQL 一系列詞法,語(yǔ)法解析等處理后,寫入到表 t1,表 t1 的編碼為 C。
那這里編碼 A、編碼 B、編碼 C 如果不兼容,寫入的數(shù)據(jù)就直接亂碼。
二、客戶端亂碼
表數(shù)據(jù)正常,但是客戶端展示后出現(xiàn)亂碼。
這一類場(chǎng)景,指的是從 MySQL 表里拿數(shù)據(jù)出來(lái)返回到客戶端,MySQL 里的數(shù)據(jù)本身沒有問題??蛻舳税l(fā)送請(qǐng)求到 MySQL,表的編碼為 D,從 MySQL 拿到記錄結(jié)果傳輸?shù)娇蛻舳耍藭r(shí)記錄編碼為 E(CHARACTER_SET_RESULTS)。
那以上編碼 E 和 D 如果不兼容,檢索出來(lái)的數(shù)據(jù)就看起來(lái)亂碼了。但是由于數(shù)據(jù)本身沒有被破壞,所以換個(gè)兼容的編碼就可以獲取正確的結(jié)果。
這一類又分為以下三個(gè)不同的小類:
1)字段編碼和表一致,客戶端是不同的編碼
比如下面例子, 表數(shù)據(jù)的編碼是 utf8mb4,而 SESSION 1 發(fā)起的連接編碼為 gbk。那由于編碼不兼容,檢索出來(lái)的數(shù)據(jù)肯定為亂碼。
2)表編碼和客戶端的編碼一致,但是記錄之間編碼存在不一致的情形
比如表編碼是 utf8mb4,應(yīng)用端編碼也是 utf8mb4,但是表里的數(shù)據(jù)可能一半編碼是 utf8mb4,另外一半是 gbk。那么此時(shí)表的數(shù)據(jù)也是正常的,不過此時(shí)采用哪種編碼都讀不到所有完整的數(shù)據(jù)。這樣數(shù)據(jù)產(chǎn)生的原因很多,比如其中一種可能性就是表編碼多次變更而且每次變更不徹底導(dǎo)致(變更不徹底,我之前的篇章里有介紹)。舉個(gè)例子,表 t3 的編碼之前是 utf8mb4,現(xiàn)在是 gbk,而且兩次編碼期間都被寫入了正常的數(shù)據(jù)。
3)每個(gè)字段的編碼不一致,導(dǎo)致亂碼和第二點(diǎn)一樣的場(chǎng)景。不同的是:非記錄間的編碼不統(tǒng)一,而是每個(gè)字段編碼不統(tǒng)一。舉個(gè)例子,表 c1 字段 a1,a2。a1 編碼 gbk,a2 編碼是 utf8mb4。那每個(gè)字段單獨(dú)讀出來(lái)數(shù)據(jù)是完整的,但是所有字段一起讀出來(lái),數(shù)據(jù)總會(huì)有一部分亂碼。
三、LATIN1
還有一種情形就是以 LATIN1 的編碼存儲(chǔ)數(shù)據(jù)
估計(jì)大家都知道字符集 LATIN1,LATIN1 對(duì)所有字符都是單字節(jié)流處理,遇到不能處理的字節(jié)流,保持原樣,那么在以上兩種存入和檢索的過程中都能保證數(shù)據(jù)一致,所以 MySQL 長(zhǎng)期以來(lái)默認(rèn)的編碼都是 LATIN1。這種情形,看起來(lái)也沒啥不對(duì)的點(diǎn),數(shù)據(jù)也沒亂碼,那為什么還有選用其他的編碼呢?原因就是對(duì)字符存儲(chǔ)的字節(jié)數(shù)不一樣,比如 emoji 字符 "?",如果用 utf8mb4 存儲(chǔ),占用 3 個(gè)字節(jié),那 varchar(12) 就能存放 12 個(gè)字符,但是換成 LATIN1,只能存 4 個(gè)字符。
1、修改安裝文件根目錄下的my.ini文件:
搜索字段default-character-set,設(shè)置其值為utf8/gbk之一(注意設(shè)置utf8的時(shí)候不能設(shè)成utf-8)
再去重啟MySQL服務(wù)器
如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作
2、修改數(shù)據(jù)庫(kù)編碼
在安裝目錄的data目錄下找到你出現(xiàn)亂碼的數(shù)據(jù)庫(kù)對(duì)應(yīng)的文件夾(這個(gè)文件夾即是你這個(gè)數(shù)據(jù)庫(kù)存放數(shù)據(jù)的地方),
進(jìn)入找到db.opt文件(即此數(shù)據(jù)庫(kù)的編碼配置文件),修改值為下面的
default-character-set=gbk
default-collation=gbk_chinese_ci
再去重啟MySQL服務(wù)器
如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作
3、再不行,備份原數(shù)據(jù)庫(kù)數(shù)據(jù),直接drop掉這個(gè)數(shù)據(jù)庫(kù)
重新創(chuàng)建數(shù)據(jù)庫(kù)并設(shè)置編碼
create database yourDB character set gbk;
別忘了重啟MySQL服務(wù)器綜上:如果還沒有解決,我也沒轍了。重裝吧,重裝的時(shí)候設(shè)置下編碼三處的編碼要一致
客戶端字符集的設(shè)置,依據(jù)客戶端不同方法不同:
1. 使用控制臺(tái)連接,在my.ini文件中的client項(xiàng)里面設(shè)置;
2. 使用ems連接,優(yōu)先使用ems連接配置的字符集,默認(rèn)使用my.ini文件中的設(shè)置;
3. jdbc連接,在連接串中指定:
jdbc:mysql://192.168.3.99:3306/test?useUnicode=true;characterEncoding=gbk
在寫入時(shí)Mysq會(huì)將客戶端指定的字符集轉(zhuǎn)換成數(shù)據(jù)庫(kù)字符集存入數(shù)據(jù)文件,讀取時(shí)又將數(shù)據(jù)庫(kù)字符集轉(zhuǎn)換成客戶端指定的字符集展示給客戶端,把客戶端字符集和數(shù)據(jù)庫(kù)字符設(shè)置一致,顯而易見的好處是免掉轉(zhuǎn)換的性能損耗;另外,如果考慮到以后數(shù)據(jù)庫(kù)的遷移,將數(shù)據(jù)庫(kù)字符集設(shè)置為大多數(shù)數(shù)據(jù)庫(kù)都支持的字符集會(huì)省掉很大麻煩。
幾個(gè)字符集相關(guān)的命令:
1. 查看 MySQL 數(shù)據(jù)庫(kù)服務(wù)器字符集,數(shù)據(jù)庫(kù)字符集和客戶端字符集
showvariableslike'%char%';
character_set_client,客戶端字符集
character_set_database,數(shù)據(jù)庫(kù)字符集
character_set_server,服務(wù)器字符集
2. 查看 MySQL 數(shù)據(jù)表(table) 的字符集showtablestatusfromtablenamelike'%countries%';
3. 查看 MySQL 數(shù)據(jù)列(column)的字符集。
showfullcolumnsfromtablename;
1、修改安裝文件根目錄下的my.ini文件:\x0d\x0a搜索字段default-character-set,設(shè)置其值為utf8/gbk之一(注意設(shè)置utf8的時(shí)候不能設(shè)成utf-8)\x0d\x0a再去重啟MySQL服務(wù)器\x0d\x0a如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作\x0d\x0a2、修改數(shù)據(jù)庫(kù)編碼\x0d\x0a在安裝目錄的data目錄下找到你出現(xiàn)亂碼的數(shù)據(jù)庫(kù)對(duì)應(yīng)的文件夾(這個(gè)文件夾即是你這個(gè)數(shù)據(jù)庫(kù)存放數(shù)據(jù)的地方),\x0d\x0a進(jìn)入找到db.opt文件(即此數(shù)據(jù)庫(kù)的編碼配置文件),修改值為下面的\x0d\x0adefault-character-set=gbk\x0d\x0adefault-collation=gbk_chinese_ci\x0d\x0a再去重啟MySQL服務(wù)器\x0d\x0a如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作\x0d\x0a3、再不行,備份原數(shù)據(jù)庫(kù)數(shù)據(jù),直接drop掉這個(gè)數(shù)據(jù)庫(kù)\x0d\x0a重新創(chuàng)建數(shù)據(jù)庫(kù)并設(shè)置編碼\x0d\x0acreate database yourDB character set gbk;\x0d\x0a別忘了重啟MySQL服務(wù)器綜上:如果還沒有解決,我也沒轍了。重裝吧,重裝的時(shí)候設(shè)置下編碼三處的編碼要一致
mysql數(shù)據(jù)亂碼問題可能有以下三種原因:
1.server本身設(shè)定問題,例如還停留在latin1版本;
2.table的語(yǔ)系設(shè)定問題(包含character與collation);
3.客戶端程式(例如php,java)的連線語(yǔ)系設(shè)定問題;
建議使用utf8!!!!
想要避免mysql的中文亂碼問題,可以嘗試以下方法:
1,對(duì)于版本問題,建議去官網(wǎng)更新最新的版本或者比較好用的版本;
2,創(chuàng)建數(shù)據(jù)庫(kù),創(chuàng)建表時(shí)沒有對(duì)字符編碼進(jìn)行設(shè)定會(huì)造成亂碼問題:
創(chuàng)建數(shù)據(jù)庫(kù)的時(shí)候:CREATE DATABASE `test`
CHARACTER SET 'utf8'
COLLATE 'utf8_general_ci';
建表的時(shí)候 CREATE TABLE `database_user` (
`ID` varchar(40) NOT NULL default '',
`UserID` varchar(40) NOT NULL default '',
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
3,對(duì)于第三種情況,參考一下方法:
編輯linux服務(wù)器中/etc/my.cnf文件,在[mysql]段加入default_character_set=utf8;
如果只是調(diào)試遇到亂碼問題:
在編寫Connection URL時(shí),加上?useUnicode=truecharacterEncoding=utf-8參數(shù);
并且在網(wǎng)頁(yè)代碼中加上一個(gè)"set names utf8"或者"set names gbk"的指令,告訴MySQL連線內(nèi)容都要使用utf-8或者gbk。
utf8或者gbk;