由于歷史原因,MySQL剛開始設(shè)計的時候,"天真的"認為使用3個字節(jié)就足夠存儲字符串了,因此將UTF-8進行閹割;然而遇到復(fù)雜的漢字或者emoji表情等4字節(jié)的寬字符的時候,存儲就會出現(xiàn)異常,因此在版本5.7.3開始引入utf8mb4,其表示為most bytes 4,即最多占用4個字節(jié)。
成都創(chuàng)新互聯(lián)秉承實現(xiàn)全網(wǎng)價值營銷的理念,以專業(yè)定制企業(yè)官網(wǎng),成都網(wǎng)站設(shè)計、成都網(wǎng)站建設(shè),微信小程序開發(fā),網(wǎng)頁設(shè)計制作,手機網(wǎng)站制作設(shè)計,全網(wǎng)營銷推廣幫助傳統(tǒng)企業(yè)實現(xiàn)“互聯(lián)網(wǎng)+”轉(zhuǎn)型升級專業(yè)定制企業(yè)官網(wǎng),公司注重人才、技術(shù)和管理,匯聚了一批優(yōu)秀的互聯(lián)網(wǎng)技術(shù)人才,對客戶都以感恩的心態(tài)奉獻自己的專業(yè)和所長。
utf8mb4_unicode_ci是基于官方的Unicode規(guī)則進行排序和壓縮,其算法相對負責(zé),對于大部分的語言和字符集排序有著很高的準確率;而uft8mb4_general_ci可以理解為一種為了提升速度的簡化版Unicode規(guī)則,但由于它不完全遵循Unicode規(guī)則,在使用某種特定語言或者字符集時,會出現(xiàn)非預(yù)期的結(jié)果。
例:
總結(jié):
UTF-8編碼的字符可以是1-4個字節(jié),但是在MySQL中最大只能存儲3個字節(jié)。
在版本5.5開始引入innodb_large_prefix,其默認值為off,索引的前綴最大限制為767個字節(jié);若值為on時(版本5.7.7開始作為默認值),最大限制為3072個字節(jié)。
總結(jié):
在后期版本 innodb_large_prefix 將會被逐漸廢棄并移除。從版本8.0開始,索引長度限制由表字段(row format)決定,若為DYNAMIC或COMPRESSED時,限制值為3072;為REDUNDANT或COMPACT時,限制值為767。且row_format=dynamic時,長度3072是基于innodb_page_size=16KB,隨著innodb_page_size的值按比例增減,其索引前綴長度也響應(yīng)減小,如若為8KB時,長度為1536,因此在限制索引長度時,需根據(jù)使用的MySQL版本以及相應(yīng)的參數(shù)進行配置決定。
你的“中文”是固定的文字嗎?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
--下面的語句只支持9999以下的數(shù)字排序
select id,col, right(col,length(col)-LEAST(
if(Locate('0',col) 0,Locate('0',col),9999),
if(Locate('1',col) 0,Locate('1',col),9999),
if(Locate('2',col) 0,Locate('2',col),9999),
if(Locate('3',col) 0,Locate('3',col),9999),
if(Locate('4',col) 0,Locate('4',col),9999),
if(Locate('5',col) 0,Locate('5',col),9999),
if(Locate('6',col) 0,Locate('6',col),9999),
if(Locate('7',col) 0,Locate('7',col),9999),
if(Locate('8',col) 0,Locate('8',col),9999),
if(Locate('9',col) 0,Locate('9',col),9999)
)-1) *1 a
from test4 order by a
前面小節(jié)介紹了如何查詢數(shù)據(jù),并且介紹了如何使用 WHERE 條件對查詢的數(shù)據(jù)結(jié)果集進行篩選,本小節(jié)介紹如何使用 ORDER BY 對查詢結(jié)果集進行排序,排序在實際業(yè)務(wù)中非常有必要,可以較好地對結(jié)果集數(shù)據(jù)分析和處理。
ASC 是對結(jié)果集按照字段從小到大排序(升序),以 teacher 表為例,將查詢出來的所有結(jié)果集按照年齡 age 從小到大排序:
執(zhí)行結(jié)果如下圖:
DESC 是對結(jié)果集按照字段從大到小排序(降序),以 teacher 表為例,將查詢出來的所有結(jié)果集按照年齡 id 從大到小排序:
執(zhí)行結(jié)果如下圖:
以 teacher 表為例,將查詢出來的結(jié)果集按照 age 從大到小排序之后,再按照 id 字段從小到大排序:
執(zhí)行結(jié)果如下圖:
前面排序的 age 和 id 字段是 int 類型,為了演示方便這里先插入幾個 name 字段為英文名的教師測試數(shù)據(jù),并對 name 字段排序,插入數(shù)據(jù) SQL 語句如下:
對查詢結(jié)果集按照 name 字段 ASC 升序排序:
執(zhí)行結(jié)果如下圖:
本小節(jié)介紹了如何使用 ORDER BY 對查詢結(jié)果集按照值字段排序,其中包括 ASC 升序和 DESC 降序,需要注意的是各種數(shù)據(jù)的字符集可能不同,如中文字符編碼 GBK編碼、utf-8編碼, 若需要經(jīng)常對字符串類型字段進行排序,可以給該字符串字段加上普通 Bree索引,二級索引樹字符串默認存儲方式是按照字符集升序存儲的(MySQL8.0 可自定義排序存儲方式),所以有索引的字段排序性能比沒有索引的字段排序性能好。
grouporder.GO_Etime 結(jié)束時間"
按照你的其它代碼來看,結(jié)束時間前面少了個雙引號
排序的時候轉(zhuǎn)換一下數(shù)據(jù)類型就可以了啊,例如:
select?*?from?表名?order?by?convert(decimal(18,?2),字符型字段)
標準的UTF-8 字符集編碼,是可以用 1~4 個字節(jié)去編碼21位字符,是一種變長的編碼格式,這幾乎包含了是世界上所有能看見的語言了。
然而在MySQL里實現(xiàn)的utf8最長使用3個字節(jié),節(jié)省空間但不能表達全部的UTF-8,只支持到了 Unicode 中的“基本多文種平面”(U+0000至U+FFFF,Basic Multilingual Plane,BMP),但并不是所有?,F(xiàn)在手機端常用的表情字符 emoji和一些不常用的漢字需要四個字節(jié)才能編碼出來。
MySQL在 5.5.3 之后增加了 utf8mb4 字符編碼,mb4即 most bytes 4,使用4個字節(jié)來表示完整的UTF-8,是utf8 的超集并完全兼容utf8,能夠用4個字節(jié)存儲更多的字符。
utf8mb4_bin: 將字符串每個字符用二進制數(shù)據(jù)編譯存儲,區(qū)分大小寫,而且可以存二進制的內(nèi)容。
utf8mb4_general_ci :不區(qū)分大小寫,不支持擴展,它僅能夠在字符之間進行逐個比較,沒有實現(xiàn)Unicode排序規(guī)則,在遇到某些特殊語言或者字符集,排序結(jié)果可能不一致。但是,在絕大多數(shù)情況下,這些特殊字符的順序并不需要那么精確。
utf8mb4_unicode_ci :是基于標準的unicode來排序和比較,能夠在各種語言之間精確排序,unicode排序規(guī)則為了能夠處理特殊字符的情況,實現(xiàn)了略微復(fù)雜的排序算法。
_bin : binary case sensitive collation,區(qū)分大小寫的
_cs : case sensitive collation,區(qū)分大小寫
_ci : case insensitive collation,不區(qū)分大小寫
主要從排序準確性和性能兩方面看:
參考鏈接: