這篇文章給大家介紹MySQL中如何處理字符集,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。
成都創(chuàng)新互聯(lián)公司長(zhǎng)期為上千多家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開(kāi)放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為科爾沁左翼企業(yè)提供專業(yè)的網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè),科爾沁左翼網(wǎng)站改版等技術(shù)服務(wù)。擁有10年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開(kāi)發(fā)。
MySQL的字符集怎么處理
發(fā)送請(qǐng)求
客戶端(character_set_client)=》數(shù)據(jù)庫(kù)連接(character_set_connection)=》存儲(chǔ)(table,column)
返回請(qǐng)求
存儲(chǔ)(table,column)=》數(shù)據(jù)庫(kù)連接(character_set_connection)=》客戶端(character_set_results)
在每一個(gè)非初始節(jié)點(diǎn),都會(huì)做一次從上一個(gè)結(jié)點(diǎn)到當(dāng)前節(jié)點(diǎn)的字符集轉(zhuǎn)換操作。舉個(gè)例子,有如下環(huán)境:
character_set_connectionutf-8character_set_resultsgbkcharacter_set_clientgb2312有表A,字段字符集全部為BIG5
發(fā)送請(qǐng)求的時(shí)候,首先數(shù)據(jù)從gbk轉(zhuǎn)換為utf-8,再轉(zhuǎn)換為BIG5,然后再存儲(chǔ)。
返回請(qǐng)求的時(shí)候,首先數(shù)據(jù)從BIG5轉(zhuǎn)換為utf-8,再轉(zhuǎn)換為gb2312,然后再發(fā)送給客戶端。
MySQL字符集架構(gòu)作用有哪些
1.允許不同的客戶端具有不同的字符集。典型的例子就是,我有一個(gè)utf-8的站點(diǎn),這個(gè)站點(diǎn)就是一個(gè)charsetclient為utf-8的客戶端。與此同時(shí),我有可能需要在一個(gè)gbk的終端上讀寫(xiě)數(shù)據(jù)庫(kù),這又是一個(gè)客戶端,不過(guò)它的字符集是gbk。
2.通過(guò)數(shù)據(jù)庫(kù)操作文件系統(tǒng)的時(shí)候,需要把文件路徑轉(zhuǎn)為文件系統(tǒng)的字符集。例如我的客戶端是gbk,而服務(wù)器文件系統(tǒng)是utf-8。操作”/A片/Rina.rmvb”,發(fā)送過(guò)去的數(shù)據(jù)里,“片”的數(shù)據(jù)和服務(wù)器是不一樣的。這時(shí)候就需要有個(gè)辦法可以把轉(zhuǎn)換GBK的“片”到utf-8。在這里MySQL引入了一個(gè)叫character_filesystem的東西來(lái)完成這個(gè)事情。
除此之外,我暫時(shí)想不到其他的作用了。但是仔細(xì)想想,我們真的需要這樣的處理嗎很多網(wǎng)站,無(wú)非就是希望自己的數(shù)據(jù)能怎么進(jìn)去就怎么出來(lái)。這里又有兩種情況了。
1.希望可以根據(jù)數(shù)據(jù)進(jìn)行排序或者做like操作。首先說(shuō)排序,對(duì)于包含中文的字段來(lái)說(shuō),根據(jù)字符集排序的概念如同雞肋。簡(jiǎn)體中文排序,一般都是希望按拼音來(lái)排序。我沒(méi)有去真正了解過(guò)MySQL里的校驗(yàn),但是從我接觸過(guò)的程序來(lái)看,需要做此類排序,都是專門建一個(gè)存放拼音的字段來(lái)排序。而拼音又存在多音字的情況。如果是UTF-8,還存在某個(gè)區(qū)間的中文同時(shí)被中日韓三國(guó)共用的情況。實(shí)現(xiàn)起來(lái)不是這么容易,所以MySQL無(wú)論的GBK還是UTF-8的校驗(yàn)集應(yīng)該都沒(méi)有實(shí)現(xiàn)拼音。我敢說(shuō),現(xiàn)在國(guó)內(nèi)使用MySQL的大多數(shù)網(wǎng)站,所用到的校驗(yàn)集,只是一個(gè)byte排序而已。而byte排序,根本不需要使用什么字符集。所以說(shuō)對(duì)于中文站點(diǎn),MySQL字符校驗(yàn)在排序上沒(méi)任何意義。
但是在like操作上,倒是有了一點(diǎn)點(diǎn)意義。例如我like‘%a%’,就有可能匹配到某個(gè)中文某個(gè)部分含有a。當(dāng)然這種情況在utf-8下不會(huì)遇到,因?yàn)閡tf-8的存儲(chǔ)格式導(dǎo)致a只可能是a,不可能是一個(gè)多字節(jié)字符的一部分。但是在其他字符集可能就會(huì)有這個(gè)問(wèn)題了。說(shuō)到最后,like又變得和order一樣使得校驗(yàn)沒(méi)意義了。
2.如果完全不需要對(duì)數(shù)據(jù)進(jìn)行排序,like或者全文檢索,那么請(qǐng)停止使用char,varchar,text之類的吧。binary,varbinary,BLOB才是正確的選擇。binary之類的在存儲(chǔ),取出的時(shí)候都不會(huì)進(jìn)行字符集轉(zhuǎn)換,而在排序時(shí)候,只根據(jù)二進(jìn)制內(nèi)容排序,所以在效率上高出char,varchar,text很多。
這種情況更不需要字符集了。但是按照目前MySQL的架構(gòu),在client和connection之間的字符集操作,是忽略字段類型的,在這兩個(gè)節(jié)點(diǎn)之間,依然會(huì)進(jìn)行字符集轉(zhuǎn)換。
另外提一下PHP里的設(shè)置字符集。大家請(qǐng)不要再使用mysql_query(”setnamesutf8″)這樣的語(yǔ)句了。mysql_set_charset()才是最完整的字符集設(shè)置方式。后者比前者多一個(gè)設(shè)置,就是把structMySQL的charset成員也設(shè)置了。這個(gè)成員變量在escape的時(shí)候起著很重要的作用,特別是對(duì)于GBK這種運(yùn)行把“”作為字符一部分的編碼格式。如果你只使用mysql_query(”setnamesXXX”),那么在某些字符集,會(huì)有重大的安全漏洞,導(dǎo)致mysql_real_escape_string變得和addslashes一樣不安全。
計(jì)算機(jī)要準(zhǔn)確的處理各種字符集文字,需要進(jìn)行字符編碼,以便計(jì)算機(jī)能夠識(shí)別和存儲(chǔ)各種文字。
關(guān)于MySQL中如何處理字符集就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。