mysql中一般用UTF-8編碼。
10年積累的成都網(wǎng)站建設(shè)、做網(wǎng)站經(jīng)驗,可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認識你,你也不認識我。但先網(wǎng)站制作后付款的網(wǎng)站建設(shè)流程,更有海北州免費網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。
UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。由Ken Thompson于1992年創(chuàng)建?,F(xiàn)在已經(jīng)標準化為RFC 3629。UTF-8用1到6個字節(jié)編碼UNICODE字符。用在網(wǎng)頁上可以同一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。
修改數(shù)據(jù)庫編碼的命令為:
alter?database?app_relation?character?set?utf8;
它相當于下面的三句指令:
SET?character_set_client?=?utf8;
SET?character_set_results?=?utf8;
SET?character_set_connection?=?utf8;
MySQL在5.5.3之后增加了這個utf8mb4的編碼,mb4就是most bytes
4的意思,專門用來兼容四字節(jié)的unicode。好在utf8mb4是utf8的超集,除了將編碼改為utf8mb4外不需要做其他轉(zhuǎn)換。當然,為了節(jié)省空間,一般情況下使用utf8也就夠了。
二、內(nèi)容描述
那上面說了既然utf8能夠存下大部分中文漢字,那為什么還要使用utf8mb4呢? 原來mysql支持的 utf8
編碼最大字符長度為 3 字節(jié),如果遇到 4 字節(jié)的寬字符就會插入異常了。三個字節(jié)的 UTF-8 最大能編碼的 Unicode 字符是
0xffff,也就是 Unicode 中的基本多文種平面(BMP)。也就是說,任何不在基本多文本平面的 Unicode字符,都無法使用
Mysql 的 utf8 字符集存儲。包括 Emoji 表情(Emoji 是一種特殊的 Unicode 編碼,常見于 ios 和 android
手機上),和很多不常用的漢字,以及任何新增的 Unicode 字符等等。
三、問題根源
最初的 UTF-8 格式使用一至六個字節(jié),最大能編碼 31 位字符。最新的 UTF-8 規(guī)范只使用一到四個字節(jié),最大能編碼21位,正好能夠表示所有的 17個 Unicode 平面。
utf8 是 Mysql 中的一種字符集,只支持最長三個字節(jié)的 UTF-8字符,也就是 Unicode 中的基本多文本平面。
Mysql 中的 utf8 為什么只支持持最長三個字節(jié)的 UTF-8字符呢?我想了一下,可能是因為 Mysql
剛開始開發(fā)那會,Unicode 還沒有輔助平面這一說呢。那時候,Unicode 委員會還做著 “65535
個字符足夠全世界用了”的美夢。Mysql 中的字符串長度算的是字符數(shù)而非字節(jié)數(shù),對于 CHAR 數(shù)據(jù)類型來說,需要為字符串保留足夠的長。當使用
查看MySQL編碼
SHOW VARIABLES LIKE 'char%';
因為當初安裝時指定了字符集為UTF8,所以所有的編碼都是UTF8。
?character_set_client:你發(fā)送的數(shù)據(jù)必須與client指定的編碼一致?。?!服務(wù)器會使用該編碼來解讀客戶端發(fā)送過來的數(shù)據(jù);
?character_set_connection:通過該編碼與client一致!該編碼不會導(dǎo)致亂碼!當執(zhí)行的是查詢語句時,客戶端發(fā)送過來的數(shù)據(jù)會先轉(zhuǎn)換成connection指定的編碼。但只要客戶端發(fā)送過來的數(shù)據(jù)與client指定的編碼一致,那么轉(zhuǎn)換就不會出現(xiàn)問題;
?character_set_database:數(shù)據(jù)庫默認編碼,在創(chuàng)建數(shù)據(jù)庫時,如果沒有指定編碼,那么默認使用database編碼;
?character_set_server:MySQL服務(wù)器默認編碼;
?character_set_results:響應(yīng)的編碼,即查詢結(jié)果返回給客戶端的編碼。這說明客戶端必須使用result指定的編碼來解碼;
控制臺編碼
修改character_set_client、character_set_results、character_set_connection為GBK,就不會出現(xiàn)亂碼了。但其實只需要修改character_set_client和character_set_results。
控制臺的編碼只能是GBK,而不能修改為UTF8,這就出現(xiàn)一個問題??蛻舳税l(fā)送的數(shù)據(jù)是GBK,而character_set_client為UTF8,這就說明客戶端數(shù)據(jù)到了服務(wù)器端后一定會出現(xiàn)亂碼。既然不能修改控制臺的編碼,那么只能修改character_set_client為GBK了。
服務(wù)器發(fā)送給客戶端的數(shù)據(jù)編碼為character_set_result,它如果是UTF8,那么控制臺使用GBK解碼也一定會出現(xiàn)亂碼。因為無法修改控制臺編碼,所以只能把character_set_result修改為GBK。
?修改character_set_client變量:set character_set_client=gbk;
?修改character_set_results變量:set character_set_results=gbk;
設(shè)置編碼只對當前連接有效,這說明每次登錄MySQL提示符后都要去修改這兩個編碼,但可以通過修改配置文件來處理這一問題:配置文件路徑:D:\Program Files\MySQL\MySQL Server 5.1\ my.ini
讓MYSQL支持GBK
在 mysql數(shù)據(jù)庫中,使用的是latin字符集,所以無法正常的支持中文字符,中文在數(shù)據(jù)庫中顯示為亂碼“?”號。為了讓mysql可以正常使用中文,尤其是當使用jsp連接mysql的時候,我們需要使用gbk的字符集,因此我們要對mysql進行以下設(shè)置,以便其有效的支持中文:
1.修改my.cnf文件
my.cnf文件是mysql的配置文件,我們可以從mysql的安裝目錄根據(jù)其自帶模板來
建立
#cp /usr/local/mysql/support-files/my-huge.cnf /etc/my.cnf
#vi /etc/my.cnf
在此文件中相應(yīng)位置加入
default-character-set = gbk
########################
[client]
default-character-set = gbk
[mysqld]
default-character-set = gbk
#########################
修改結(jié)束以后,保存,然后使用客戶端登錄
#mysql -u root -p
在客戶端中輸入
status;
顯示的數(shù)據(jù)中如果出現(xiàn):
Server characterset: gbk
Db characterset: gbk
Client characterset: gbk
Conn. characterset: gbk
則表示修改成功。
2.建立庫表時指定gbk字符集
在建立庫表的時候我們需要指定gbk字符集
建立數(shù)據(jù)庫:
CREATE DATABASE dbname DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci
建立數(shù)據(jù)表
Create table tablename(
id int(10) unsigned NOT NULL AUTO_INCREMENT,
name varchar(15) NOT NULL default '',
PRIMARY KEY (id)
) TYPE=MyISAM DEFAULT CHARACTER SET gbk
建立好以后,在客戶端中使用:
show cereate table tablename;
如果最后一行顯示gbk,則表示成功
3.修改jdbc驅(qū)動
jsp連接mysql需要使用jdbc驅(qū)動,在使用的時候,我們需要設(shè)置好字符集
String user="root";
String password="123";
String url="jdbc:mysql://localhost:3306/dbname?useUnicode=truecharacterEncoding=gbk"
Class.forNname("com.mysql.jdbc.Driver");//裝載驅(qū)動類;
Connection con=DriverManager.getConnection(url,user,password);//取得連接
其中dbname為你數(shù)據(jù)庫的名字,url中的gbk即為使用的字符集
做好以上三步以后,mysql就可以支持gbk中文了。
數(shù)據(jù)庫里的編碼沒有問題,uft8_general_ci就可以了,在腳本里別忘了執(zhí)行mysql_query('set names utf8'),關(guān)鍵你要把你的文件保存為UTF-8格式,使用EditPlus或者UE編輯器來另存為,提示框會有保存的編碼選項。