1)安裝的時(shí)候安裝兼容中文的包
10年積累的成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì)經(jīng)驗(yàn),可以快速應(yīng)對(duì)客戶對(duì)網(wǎng)站的新想法和需求。提供各種問題對(duì)應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識(shí)你,你也不認(rèn)識(shí)我。但先網(wǎng)站制作后付款的網(wǎng)站建設(shè)流程,更有加查免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。
2)其實(shí)很多時(shí)候中文亂碼并不是因?yàn)榘惭b引起的,而是在建表和插入數(shù)據(jù)的時(shí)候,不注意表的字符集導(dǎo)致的。
簡單舉例:一般我們建表的時(shí)候都不指定字符集,這時(shí)候默認(rèn)一般是 latin1,然后讀/寫數(shù)據(jù)的時(shí)候,都會(huì)加一個(gè) set names utf8( 或 gbk),這時(shí)候的字符集跟表的字符集不一致,就出現(xiàn)了所謂的亂碼了~~
避免這種情況的出現(xiàn),就要養(yǎng)成良好的習(xí)慣,在建表的時(shí)候指定相應(yīng)的字符集,推薦 utf8,讀寫數(shù)據(jù)的時(shí)候,也設(shè)定好當(dāng)前傳遞數(shù)據(jù)的字符集~~
3)由于客戶端/瀏覽器 支持的編碼與程序編碼不一致引起的亂碼,這種情況,要么頁面修改編碼,要么程序作編碼轉(zhuǎn)換~~~
一、轉(zhuǎn)碼失敗
在數(shù)據(jù)寫入到表的過程中轉(zhuǎn)碼失敗,數(shù)據(jù)庫端也沒有進(jìn)行恰當(dāng)?shù)奶幚?,?dǎo)致存放在表里的數(shù)據(jù)亂碼。
針對(duì)這種情況,前幾篇文章介紹過客戶端發(fā)送請(qǐng)求到服務(wù)端。
其中任意一個(gè)編碼不一致,都會(huì)導(dǎo)致表里的數(shù)據(jù)存入不正確的編碼而產(chǎn)生亂碼。
比如下面簡單一條語句:
set @a = "文本字符串";
insert into t1 values(@a);
變量 @a 的字符編碼是由參數(shù) CHARACTER_SET_CLIENT 決定的,假設(shè)此時(shí)編碼為 A,也就是變量 @a 的編碼。
2. 寫入語句在發(fā)送到 MySQL 服務(wù)端之前的編碼由 CHARACTER_SET_CONNECTION 決定,假設(shè)此時(shí)編碼為 B。
3. 經(jīng)過 MySQL 一系列詞法,語法解析等處理后,寫入到表 t1,表 t1 的編碼為 C。
那這里編碼 A、編碼 B、編碼 C 如果不兼容,寫入的數(shù)據(jù)就直接亂碼。
二、客戶端亂碼
表數(shù)據(jù)正常,但是客戶端展示后出現(xiàn)亂碼。
這一類場景,指的是從 MySQL 表里拿數(shù)據(jù)出來返回到客戶端,MySQL 里的數(shù)據(jù)本身沒有問題??蛻舳税l(fā)送請(qǐng)求到 MySQL,表的編碼為 D,從 MySQL 拿到記錄結(jié)果傳輸?shù)娇蛻舳?,此時(shí)記錄編碼為 E(CHARACTER_SET_RESULTS)。
那以上編碼 E 和 D 如果不兼容,檢索出來的數(shù)據(jù)就看起來亂碼了。但是由于數(shù)據(jù)本身沒有被破壞,所以換個(gè)兼容的編碼就可以獲取正確的結(jié)果。
這一類又分為以下三個(gè)不同的小類:
1)字段編碼和表一致,客戶端是不同的編碼
比如下面例子, 表數(shù)據(jù)的編碼是 utf8mb4,而 SESSION 1 發(fā)起的連接編碼為 gbk。那由于編碼不兼容,檢索出來的數(shù)據(jù)肯定為亂碼。
2)表編碼和客戶端的編碼一致,但是記錄之間編碼存在不一致的情形
比如表編碼是 utf8mb4,應(yīng)用端編碼也是 utf8mb4,但是表里的數(shù)據(jù)可能一半編碼是 utf8mb4,另外一半是 gbk。那么此時(shí)表的數(shù)據(jù)也是正常的,不過此時(shí)采用哪種編碼都讀不到所有完整的數(shù)據(jù)。這樣數(shù)據(jù)產(chǎn)生的原因很多,比如其中一種可能性就是表編碼多次變更而且每次變更不徹底導(dǎo)致(變更不徹底,我之前的篇章里有介紹)。舉個(gè)例子,表 t3 的編碼之前是 utf8mb4,現(xiàn)在是 gbk,而且兩次編碼期間都被寫入了正常的數(shù)據(jù)。
3)每個(gè)字段的編碼不一致,導(dǎo)致亂碼和第二點(diǎn)一樣的場景。不同的是:非記錄間的編碼不統(tǒng)一,而是每個(gè)字段編碼不統(tǒng)一。舉個(gè)例子,表 c1 字段 a1,a2。a1 編碼 gbk,a2 編碼是 utf8mb4。那每個(gè)字段單獨(dú)讀出來數(shù)據(jù)是完整的,但是所有字段一起讀出來,數(shù)據(jù)總會(huì)有一部分亂碼。
三、LATIN1
還有一種情形就是以 LATIN1 的編碼存儲(chǔ)數(shù)據(jù)
估計(jì)大家都知道字符集 LATIN1,LATIN1 對(duì)所有字符都是單字節(jié)流處理,遇到不能處理的字節(jié)流,保持原樣,那么在以上兩種存入和檢索的過程中都能保證數(shù)據(jù)一致,所以 MySQL 長期以來默認(rèn)的編碼都是 LATIN1。這種情形,看起來也沒啥不對(duì)的點(diǎn),數(shù)據(jù)也沒亂碼,那為什么還有選用其他的編碼呢?原因就是對(duì)字符存儲(chǔ)的字節(jié)數(shù)不一樣,比如 emoji 字符 "?",如果用 utf8mb4 存儲(chǔ),占用 3 個(gè)字節(jié),那 varchar(12) 就能存放 12 個(gè)字符,但是換成 LATIN1,只能存 4 個(gè)字符。
使用MySQL導(dǎo)入數(shù)據(jù)時(shí)出現(xiàn)亂碼的兩種解決方法如下:1、添加 –default-character-set
先檢查一下,目標(biāo)數(shù)據(jù)編碼。 56云 分享
使用目標(biāo)庫編碼導(dǎo)入數(shù)據(jù),如下:
2、修改數(shù)據(jù)庫編碼
此教程方法必須謹(jǐn)慎使用,需初始化數(shù)據(jù)庫或?qū)⑵髽I(yè)數(shù)據(jù)庫技術(shù)可以覆蓋情況下使用,否則導(dǎo)致數(shù)據(jù)庫出現(xiàn)亂碼
1、修改安裝文件根目錄下的my.ini文件:\x0d\x0a搜索字段default-character-set,設(shè)置其值為utf8/gbk之一(注意設(shè)置utf8的時(shí)候不能設(shè)成utf-8)\x0d\x0a再去重啟MySQL服務(wù)器\x0d\x0a如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作\x0d\x0a2、修改數(shù)據(jù)庫編碼\x0d\x0a在安裝目錄的data目錄下找到你出現(xiàn)亂碼的數(shù)據(jù)庫對(duì)應(yīng)的文件夾(這個(gè)文件夾即是你這個(gè)數(shù)據(jù)庫存放數(shù)據(jù)的地方),\x0d\x0a進(jìn)入找到db.opt文件(即此數(shù)據(jù)庫的編碼配置文件),修改值為下面的\x0d\x0adefault-character-set=gbk\x0d\x0adefault-collation=gbk_chinese_ci\x0d\x0a再去重啟MySQL服務(wù)器\x0d\x0a如果還是出現(xiàn)亂碼,接著執(zhí)行下面操作\x0d\x0a3、再不行,備份原數(shù)據(jù)庫數(shù)據(jù),直接drop掉這個(gè)數(shù)據(jù)庫\x0d\x0a重新創(chuàng)建數(shù)據(jù)庫并設(shè)置編碼\x0d\x0acreate database yourDB character set gbk;\x0d\x0a別忘了重啟MySQL服務(wù)器綜上:如果還沒有解決,我也沒轍了。重裝吧,重裝的時(shí)候設(shè)置下編碼三處的編碼要一致
1、修改安裝文件根目錄下的我的文件,搜索字段默認(rèn)特征設(shè)置,設(shè)置其值為中國字符編碼或國際編碼之一,重啟MySQL服務(wù)器;
2、修改數(shù)據(jù)庫編碼,在安裝目錄的根目錄下找到出現(xiàn)亂碼的數(shù)據(jù)庫對(duì)應(yīng)的文件夾,進(jìn)入文件夾,找到此數(shù)據(jù)庫的編碼配置文件,進(jìn)行修改,重啟MySQL服務(wù)器;
3、備份原數(shù)據(jù)庫數(shù)據(jù),直接刪除此數(shù)據(jù)庫,重新創(chuàng)建數(shù)據(jù)庫并設(shè)置編碼,再重啟MySQL服務(wù)器。
4、若仍出現(xiàn)亂碼,重裝系統(tǒng)即可。
顯示亂碼有許多原因:
這里主要是MySQL數(shù)據(jù)庫中 因?yàn)?*【編碼不統(tǒng)一】**造成的
Latin1是ISO-8859-1的別名,有些環(huán)境下寫作Latin-1,最終要改為utf-8
在數(shù)據(jù)庫中輸入查詢命令:
修改成功后的查看界面:
1.用phpmyadmin創(chuàng)建數(shù)據(jù)庫和數(shù)據(jù)表
創(chuàng)建數(shù)據(jù)庫的時(shí)候,請(qǐng)將“整理”設(shè)置為:“utf8_general_ci”
或執(zhí)行語句:
復(fù)制代碼
代碼如下:CREATE
DATABASE
`dbname`
DEFAULT
CHARACTER
SET
utf8
COLLATE
utf8_general_ci;
創(chuàng)建數(shù)據(jù)表的時(shí)候:如果是該字段是存放中文的話,則需要將“整理”設(shè)置為:“utf8_general_ci”,
如果該字段是存放英文或數(shù)字的話,默認(rèn)就可以了。
相應(yīng)的SQL語句,例如:
CREATE
TABLE
`test`
(
`id`
INT
NOT
NULL
,
`name`
VARCHAR(
10
)
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NOT
NULL
,
PRIMARY
KEY
(
`id`
)
)
ENGINE
=
MYISAM
;
2.用PHP讀寫數(shù)據(jù)庫
在連接數(shù)據(jù)庫之后:
復(fù)制代碼
代碼如下:$connection
=
mysql_connect($host_name,
$host_user,
$host_pass);
加入兩行:
mysql_query("set
character
set
'utf8'");//讀庫
mysql_query("set
names
'utf8'");//寫庫
就可以正常的讀寫MYSQL數(shù)據(jù)庫了。
用的appserv-win32-2.5.10做的環(huán)境,裝這個(gè)包的時(shí)候用默認(rèn)的utf8編碼。
在寫數(shù)據(jù)庫連接文件時(shí),寫成:
$conn
=
mysql_connect("$host","$user","$password");
mysql_query("SET
NAMES
'UTF8'");
mysql_select_db("$database",$conn);
然后在做頁面時(shí),注意這句:
復(fù)制代碼
代碼如下:meta
http-equiv="Content-Type"
content="text/html;
charset=utf-8"
/
這樣不管輸入數(shù)據(jù)庫的中文,還是頁面顯示,就都正常了。
在DW
CS4版里,默認(rèn)生成的也是utf8頁面。
同樣的,如果一開始寫數(shù)據(jù)庫連接文件時(shí)寫成:
mysql_query("SET
NAMES
'GBK'");
那頁面也要相應(yīng)變成:
復(fù)制代碼
代碼如下:meta
http-equiv="Content-Type"
content="text/html;
charset=gb2312"
/
總結(jié),最后主要是頁面編碼要統(tǒng)一就可以很方便的解決亂碼問題,特別是在mysql_query()這個(gè)set
names的設(shè)置必須和頁面及數(shù)據(jù)庫編碼統(tǒng)計(jì)一就可以了。
希望這兩篇關(guān)于UTF-8中文編碼亂碼的文章,能夠更好地幫助大家解決這類問題,希望大家喜歡。