1、中文亂碼
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長期合作伙伴,公司提供的服務(wù)項(xiàng)目有:國際域名空間、虛擬空間、營銷軟件、網(wǎng)站建設(shè)、汝南網(wǎng)站維護(hù)、網(wǎng)站推廣。
1.1、中文亂碼
create table user(name varchar(11)); ? ?# 創(chuàng)建user表 insert into table user("carl"); ? ? ? ? # 添加數(shù)據(jù) select * from user;123
insert into user value("哈哈");1
無法插入中文字符:
1.2、查看表字符編碼
mysql show create table user \G;*************************** 1. row *************************** ? ? ? Table: userCreate Table: CREATE TABLE `user` ( ?`name` varchar(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=latin1
1 row in set (0.00 sec)1234567
我們可以看到表的默認(rèn)字符集是latin1.
所以我們在創(chuàng)建表的時(shí)候就需要指定表的字符集:
create table user(name varchar(11)) default charset=utf8; 1
這樣在Linux里面可以訪問并且可以插入與訪問這個(gè)表了。
1.3、數(shù)據(jù)庫與操作系統(tǒng)編碼
雖然在服務(wù)器端可以顯示中文正常,但是在客戶端可能會(huì)顯示亂碼。因?yàn)槲覀兊姆?wù)器是UTF8。
而且數(shù)據(jù)庫的編碼也存在問題。
這里我們可以看character_sert_database與character_set_server的字符集都是latin1.那么在mysql數(shù)據(jù)庫中,server,database,table的字符集都默認(rèn)是latin1.下面我們就來看看如何解決mysql亂碼情況。
2、mysql設(shè)置變量的范圍
2.1、session范圍
查看數(shù)據(jù)庫編碼:
show variables like '%char%';1
修改字符編碼:
set character_set_server=utf8;set character_set_database=utf8;show variables like '%char%';123
我們可以看到字符集已經(jīng)修改成都是utf8了。但是這里有一個(gè)問題,那就是我們重新打開一個(gè)命令窗口然后查看數(shù)據(jù)編碼就會(huì)出現(xiàn)下面的畫面:
2.2、global范圍
mysql設(shè)置變量的范圍默認(rèn)是session范圍。如果設(shè)置多個(gè)會(huì)話的字符集那么需要設(shè)置global范圍:Set [global|session] variables …
set global character_set_database=utf8;set global character_set_server=utf8;show variables like '%char%';123
當(dāng)我們跨會(huì)話查看mysql字符集都會(huì)看到都是utf8。如果你以為萬事大吉了的話,那么你就大錯(cuò)特錯(cuò)了。
2.3、設(shè)置數(shù)據(jù)全局范圍
當(dāng)我們數(shù)據(jù)庫重啟的時(shí)候,你們發(fā)現(xiàn)設(shè)置global范圍的值又變成latin1了。
service mysqld restart
mysql -uroot -pyourpasswordshow variables like '%char%';123
不要怕,下面就教你終極大招:
修改mysql配置文件/etc/my.cnf。
[mysqld]
character-set-server=utf8
[client]default-character-set=utf8
[mysql]default-character-set=utf8123456
請注意這幾個(gè)參數(shù)配置的位置,不然可能會(huì)啟動(dòng)不起來mysql服務(wù):
OK。這下如果你重啟mysql服務(wù)也會(huì)發(fā)現(xiàn)它的字符集是utf8.
而且我們創(chuàng)建表的時(shí)候不需要指定字符編碼,它默認(rèn)就是utf8;
drop database test;create database test;use test;create table user(name varchar(11));show create table user \G;12345
1、修改安裝文件根目錄下的my.ini文件:\x0d\x0a搜索字段default-character-set,設(shè)置其值為utf8/gbk之一(注意設(shè)置utf8的時(shí)候不能設(shè)成utf-8)\x0d\x0a再去重啟MySQL服務(wù)器\x0d\x0a如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作\x0d\x0a2、修改數(shù)據(jù)庫編碼\x0d\x0a在安裝目錄的data目錄下找到你出現(xiàn)亂碼的數(shù)據(jù)庫對應(yīng)的文件夾(這個(gè)文件夾即是你這個(gè)數(shù)據(jù)庫存放數(shù)據(jù)的地方),\x0d\x0a進(jìn)入找到db.opt文件(即此數(shù)據(jù)庫的編碼配置文件),修改值為下面的\x0d\x0adefault-character-set=gbk\x0d\x0adefault-collation=gbk_chinese_ci\x0d\x0a再去重啟MySQL服務(wù)器\x0d\x0a如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作\x0d\x0a3、再不行,備份原數(shù)據(jù)庫數(shù)據(jù),直接drop掉這個(gè)數(shù)據(jù)庫\x0d\x0a重新創(chuàng)建數(shù)據(jù)庫并設(shè)置編碼\x0d\x0acreate database yourDB character set gbk;\x0d\x0a別忘了重啟MySQL服務(wù)器綜上:如果還沒有解決,我也沒轍了。重裝吧,重裝的時(shí)候設(shè)置下編碼三處的編碼要一致
1. 借助 notepad++ 把 .sql 文件的編碼格式改成 utf8
2. 替換 mysql 的 my.cnf 文件 并加入指定字符集的語句
3. 使用終端命令重新導(dǎo)入 .sql 文件
4. 各種重啟 清除瀏覽器緩存
一、轉(zhuǎn)碼失敗
在數(shù)據(jù)寫入到表的過程中轉(zhuǎn)碼失敗,數(shù)據(jù)庫端也沒有進(jìn)行恰當(dāng)?shù)奶幚恚瑢?dǎo)致存放在表里的數(shù)據(jù)亂碼。
針對這種情況,前幾篇文章介紹過客戶端發(fā)送請求到服務(wù)端。
其中任意一個(gè)編碼不一致,都會(huì)導(dǎo)致表里的數(shù)據(jù)存入不正確的編碼而產(chǎn)生亂碼。
比如下面簡單一條語句:
set @a = "文本字符串";
insert into t1 values(@a);
變量 @a 的字符編碼是由參數(shù) CHARACTER_SET_CLIENT 決定的,假設(shè)此時(shí)編碼為 A,也就是變量 @a 的編碼。
2. 寫入語句在發(fā)送到 MySQL 服務(wù)端之前的編碼由 CHARACTER_SET_CONNECTION 決定,假設(shè)此時(shí)編碼為 B。
3. 經(jīng)過 MySQL 一系列詞法,語法解析等處理后,寫入到表 t1,表 t1 的編碼為 C。
那這里編碼 A、編碼 B、編碼 C 如果不兼容,寫入的數(shù)據(jù)就直接亂碼。
二、客戶端亂碼
表數(shù)據(jù)正常,但是客戶端展示后出現(xiàn)亂碼。
這一類場景,指的是從 MySQL 表里拿數(shù)據(jù)出來返回到客戶端,MySQL 里的數(shù)據(jù)本身沒有問題??蛻舳税l(fā)送請求到 MySQL,表的編碼為 D,從 MySQL 拿到記錄結(jié)果傳輸?shù)娇蛻舳耍藭r(shí)記錄編碼為 E(CHARACTER_SET_RESULTS)。
那以上編碼 E 和 D 如果不兼容,檢索出來的數(shù)據(jù)就看起來亂碼了。但是由于數(shù)據(jù)本身沒有被破壞,所以換個(gè)兼容的編碼就可以獲取正確的結(jié)果。
這一類又分為以下三個(gè)不同的小類:
1)字段編碼和表一致,客戶端是不同的編碼
比如下面例子, 表數(shù)據(jù)的編碼是 utf8mb4,而 SESSION 1 發(fā)起的連接編碼為 gbk。那由于編碼不兼容,檢索出來的數(shù)據(jù)肯定為亂碼。
2)表編碼和客戶端的編碼一致,但是記錄之間編碼存在不一致的情形
比如表編碼是 utf8mb4,應(yīng)用端編碼也是 utf8mb4,但是表里的數(shù)據(jù)可能一半編碼是 utf8mb4,另外一半是 gbk。那么此時(shí)表的數(shù)據(jù)也是正常的,不過此時(shí)采用哪種編碼都讀不到所有完整的數(shù)據(jù)。這樣數(shù)據(jù)產(chǎn)生的原因很多,比如其中一種可能性就是表編碼多次變更而且每次變更不徹底導(dǎo)致(變更不徹底,我之前的篇章里有介紹)。舉個(gè)例子,表 t3 的編碼之前是 utf8mb4,現(xiàn)在是 gbk,而且兩次編碼期間都被寫入了正常的數(shù)據(jù)。
3)每個(gè)字段的編碼不一致,導(dǎo)致亂碼和第二點(diǎn)一樣的場景。不同的是:非記錄間的編碼不統(tǒng)一,而是每個(gè)字段編碼不統(tǒng)一。舉個(gè)例子,表 c1 字段 a1,a2。a1 編碼 gbk,a2 編碼是 utf8mb4。那每個(gè)字段單獨(dú)讀出來數(shù)據(jù)是完整的,但是所有字段一起讀出來,數(shù)據(jù)總會(huì)有一部分亂碼。
三、LATIN1
還有一種情形就是以 LATIN1 的編碼存儲(chǔ)數(shù)據(jù)
估計(jì)大家都知道字符集 LATIN1,LATIN1 對所有字符都是單字節(jié)流處理,遇到不能處理的字節(jié)流,保持原樣,那么在以上兩種存入和檢索的過程中都能保證數(shù)據(jù)一致,所以 MySQL 長期以來默認(rèn)的編碼都是 LATIN1。這種情形,看起來也沒啥不對的點(diǎn),數(shù)據(jù)也沒亂碼,那為什么還有選用其他的編碼呢?原因就是對字符存儲(chǔ)的字節(jié)數(shù)不一樣,比如 emoji 字符 "?",如果用 utf8mb4 存儲(chǔ),占用 3 個(gè)字節(jié),那 varchar(12) 就能存放 12 個(gè)字符,但是換成 LATIN1,只能存 4 個(gè)字符。
mysql數(shù)據(jù)亂碼問題可能有以下三種原因:
1.server本身設(shè)定問題,例如還停留在latin1版本;
2.table的語系設(shè)定問題(包含character與collation);
3.客戶端程式(例如php,java)的連線語系設(shè)定問題;
建議使用utf8!!!!
想要避免mysql的中文亂碼問題,可以嘗試以下方法:
1,對于版本問題,建議去官網(wǎng)更新最新的版本或者比較好用的版本;
2,創(chuàng)建數(shù)據(jù)庫,創(chuàng)建表時(shí)沒有對字符編碼進(jìn)行設(shè)定會(huì)造成亂碼問題:
創(chuàng)建數(shù)據(jù)庫的時(shí)候:CREATE DATABASE `test`
CHARACTER SET 'utf8'
COLLATE 'utf8_general_ci';
建表的時(shí)候 CREATE TABLE `database_user` (
`ID` varchar(40) NOT NULL default '',
`UserID` varchar(40) NOT NULL default '',
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
3,對于第三種情況,參考一下方法:
編輯linux服務(wù)器中/etc/my.cnf文件,在[mysql]段加入default_character_set=utf8;
如果只是調(diào)試遇到亂碼問題:
在編寫Connection URL時(shí),加上?useUnicode=truecharacterEncoding=utf-8參數(shù);
并且在網(wǎng)頁代碼中加上一個(gè)"set names utf8"或者"set names gbk"的指令,告訴MySQL連線內(nèi)容都要使用utf-8或者gbk。
utf8或者gbk;
1、修改安裝文件根目錄下的my.ini文件:
搜索字段default-character-set,設(shè)置其值為utf8/gbk之一(注意設(shè)置utf8的時(shí)候不能設(shè)成utf-8)
再去重啟MySQL服務(wù)器
如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作
2、修改數(shù)據(jù)庫編碼
在安裝目錄的data目錄下找到你出現(xiàn)亂碼的數(shù)據(jù)庫對應(yīng)的文件夾(這個(gè)文件夾即是你這個(gè)數(shù)據(jù)庫存放數(shù)據(jù)的地方),
進(jìn)入找到db.opt文件(即此數(shù)據(jù)庫的編碼配置文件),修改值為下面的
default-character-set=gbk
default-collation=gbk_chinese_ci
再去重啟MySQL服務(wù)器
如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作
3、再不行,備份原數(shù)據(jù)庫數(shù)據(jù),直接drop掉這個(gè)數(shù)據(jù)庫
重新創(chuàng)建數(shù)據(jù)庫并設(shè)置編碼
create database yourDB character set gbk;
別忘了重啟MySQL服務(wù)器綜上:如果還沒有解決,我也沒轍了。重裝吧,重裝的時(shí)候設(shè)置下編碼三處的編碼要一致