NULL 對(duì)外部程序來(lái)說(shuō),具體為不知道、不確切的、無(wú)法表述的值。所以在很多家公司的開(kāi)發(fā)規(guī)范里都明確規(guī)定了,必須為 NOT NULL。
讓客戶(hù)滿(mǎn)意是我們工作的目標(biāo),不斷超越客戶(hù)的期望值來(lái)自于我們對(duì)這個(gè)行業(yè)的熱愛(ài)。我們立志把好的技術(shù)通過(guò)有效、簡(jiǎn)單的方式提供給客戶(hù),將通過(guò)不懈努力成為客戶(hù)在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名注冊(cè)、網(wǎng)頁(yè)空間、營(yíng)銷(xiāo)軟件、網(wǎng)站建設(shè)、坊子網(wǎng)站維護(hù)、網(wǎng)站推廣。
其實(shí)用到 NULL 的場(chǎng)景都可以轉(zhuǎn)換為有意義的字符或者數(shù)值,一是有利用數(shù)據(jù)的易讀性以及后期的易維護(hù)性;二是降低 SQL 語(yǔ)句的編寫(xiě)難度。
關(guān)于 NULL 的特性如下:
1. 參與 NULL 字段拼接的結(jié)果都為 NULL,預(yù)期的可能會(huì)有差異
預(yù)想把字段 r1 做個(gè)拼接,再插入到新的表 t3 里,結(jié)果 t3 表的記錄全為 NULL,跟預(yù)期不符。
mysql show create table t1\G
*************************** 1. row ***************************
Table: t1
Create Table: CREATE TABLE `t1` (
`r1` varchar(10) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
1 row in set (0.00 sec)
mysql show create table t2\G
*************************** 1. row ***************************
Table: t2
Create Table: CREATE TABLE `t2` (
`r1` varchar(10) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci
1 row in set (0.00 sec)
mysql create table t3 like t1
Query OK, 0 rows affected (0.04 sec)
mysql insert into t3 select concat(r1,'database') from t1 limit 2;
Query OK, 2 rows affected (0.02 sec)
Records: 2 Duplicates: 0 Warnings: 0
mysql select * from t3;
+------+
| r1 |
+------+
| NULL |
| NULL |
+------+
2 rows in set (0.00 sec)
那正確的方法如下,對(duì) NULL 用函數(shù) IFNULL 特殊處理。
mysql insert into t3 select concat(ifnull(r1,''),'database') from t1 limit 2;
Query OK, 2 rows affected (0.01 sec)
Records: 2 Duplicates: 0 Warnings: 0
mysql select * from t3;
+----------+
| r1 |
+----------+
| database |
| database |
+----------+
2 rows in set (0.00 sec)
2. 對(duì)于包含 NULL 列的求 COUNT 值也不準(zhǔn)確
t1 和 t2 的記錄數(shù)是一樣的,但是字段 r1 包含了 NULL,這導(dǎo)致結(jié)果忽略了這些值。
mysql select count(r1) as rc from t1;
+-------+
| rc |
+-------+
| 16384 |
+-------+
1 row in set (0.01 sec)
mysql select count(r1) as rc from t2;
+-------+
| rc |
+-------+
| 32768 |
+-------+
1 row in set (0.03 sec)
這時(shí)候我們可能想到了,正確的方法是用 NULL 相關(guān)函數(shù)處理,
mysql select count(ifnull(r1,'')) as rc from t1;
+-------+
| rc |
+-------+
| 32768 |
+-------+
1 row in set (0.03 sec)
或者是直接用 COUNT(*) 包含了所有可能的值
mysql select count(*) as rc from t1;
+-------+
| rc |
+-------+
| 32768 |
+-------+
1 row in set (0.02 sec)
當(dāng)然了不僅僅是 COUNT,除了 NULL 相關(guān)的函數(shù),大部分對(duì) NULL 處理都不友好。
所以其實(shí)從上面兩點(diǎn)來(lái)看,NULL 的處理都得特殊處理,額外增加了編寫(xiě) SQL 的難度。
3. 包含 NULL 的索引列
對(duì)包含 NULL 列建立索引,比不包含的 NULL 的字段,要多占用一個(gè) BIT 位來(lái)存儲(chǔ)。
示例
key_len 分別為 43 和 42,t1 比 t2 多了一個(gè)字節(jié),那這里可能有人要問(wèn)了,不是說(shuō)占了一個(gè) BIT 位嗎?那為什么多了一個(gè)字節(jié)?可以關(guān)注我上一篇文章(第02期:MySQL 數(shù)據(jù)類(lèi)型的藝術(shù) - 大對(duì)象字段)關(guān)于 BIT 的詳細(xì)描述。
mysql pager grep -i 'key_len'
PAGER set to 'grep -i 'key_len''
mysql explain select * from t1 where r1 = ''\G
key_len: 43
1 row in set, 1 warning (0.00 sec)
mysql explain select * from t2 where r1 = ''\G
key_len: 42
1 row in set, 1 warning (0.00 sec)
4. 各存儲(chǔ)引擎相關(guān)的對(duì) NULL 的處理
在 MySQL 8.0 發(fā)布后,僅有 InnoDB、MyISAM 和 Memory 支持對(duì)包含 NULL 列的索引,其他引擎不支持。比如 NDB。
字符串或串(String)是由零個(gè)或多個(gè)字符組成的有限序列。一般記為 s='a1a2???an'(n=0)。它是編程語(yǔ)言中表示文本的數(shù)據(jù)類(lèi)型。
通常以串的整體作為操作對(duì)象,如:在串中查找某個(gè)子串、求取一個(gè)子串、在串的某個(gè)位置上插入一個(gè)子串以及刪除一個(gè)子串等。兩個(gè)字符串相等的充要條件是:長(zhǎng) 度相等,并且各個(gè)對(duì)應(yīng)位置上的字符都相等。設(shè)p、q是兩個(gè)串,求q在p中首次出現(xiàn)的位置的運(yùn)算叫做模式匹配。串的兩種最基本的存儲(chǔ)方式是順序存儲(chǔ)方式和鏈 接存儲(chǔ)方式。
下面我們來(lái)看看MySQL中的字符串函數(shù)
假如結(jié)果的長(zhǎng)度大于 max_allowed_packet 系統(tǒng)變量的最大值時(shí),字符串值函數(shù)的返回值為NULL。
對(duì)于在字符串位置操作的函數(shù),第一個(gè)位置的編號(hào)為 1。
◆ ASCII(str)
返回值為字符串str 的最左字符的數(shù)值。假如str為空字符串,則返回值為 0 。假如str 為NULL,則返回值為 NULL。 ASCII()用于帶有從 0到255的數(shù)值的字符。
mysql SELECT ASCII('2');
- 50
mysql SELECT ASCII(2);
- 50
mysql SELECT ASCII('dx');
- 100
見(jiàn) ORD()函數(shù)。
◆ BIN(N)
返回值為N的二進(jìn)制值的字符串表示,其中 N 為一個(gè)longlong (BIGINT) 數(shù)字。這等同于 CONV(N,10,2)。假如N 為NULL,則返回值為 NULL。
mysql SELECT BIN(12);
- '1100'
◆ BIT_LENGTH(str)
返回值為二進(jìn)制的字符串str 長(zhǎng)度。
mysql SELECT BIT_LENGTH('text');
- 32
◆ CHAR(N,... [USING charset])
CHAR()將每個(gè)參數(shù)N理解為一個(gè)整數(shù),其返回值為一個(gè)包含這些整數(shù)的代碼值所給出的字符的字符串。NULL值被省略。
mysql SELECT CHAR(77,121,83,81,'76');
- 'MySQL'
mysql SELECT CHAR(77,77.3,'77.3');
- 'MMM'
大于 255的CHAR()參數(shù)被轉(zhuǎn)換為多結(jié)果字符。 例如,CHAR(256) 相當(dāng)于 CHAR(1,0), 而CHAR(256*256) 則相當(dāng)于 CHAR(1,0,0):
mysql SELECT HEX(CHAR(1,0)), HEX(CHAR(256));
+----------------+----------------+
| HEX(CHAR(1,0)) | HEX(CHAR(256)) |
+----------------+----------------+
| 0100 | 0100 |
+----------------+----------------+
mysql SELECT HEX(CHAR(1,0,0)), HEX(CHAR(256*256));
+------------------+--------------------+
| HEX(CHAR(1,0,0)) | HEX(CHAR(256*256)) |
+------------------+--------------------+
| 010000 | 010000 |
+------------------+--------------------+
CHAR()的返回值為一個(gè)二進(jìn)制字符串??蛇x擇使用USING語(yǔ)句產(chǎn)生一個(gè)給出的字符集中的字符串:
mysql SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));
mysql SELECT CHARSET(CHAR(0x65)), CHARSET(CHAR(0x65 USING utf8));
+---------------------+--------------------------------+
| CHARSET(CHAR(0x65)) | CHARSET(CHAR(0x65 USING utf8)) |
+---------------------+--------------------------------+
| binary| utf8 |
+---------------------+--------------------------------+
如果 USING已經(jīng)產(chǎn)生,而結(jié)果字符串不符合給出的字符集,則會(huì)發(fā)出警告。同樣,如果嚴(yán)格的SQL模式被激活,則CHAR()的結(jié)果會(huì)成為 NULL。
◆ CHAR_LENGTH(str)
返回值為字符串str 的長(zhǎng)度,長(zhǎng)度的單位為字符。一個(gè)多字節(jié)字符算作一個(gè)單字符。對(duì)于一個(gè)包含五個(gè)二字節(jié)字符集, LENGTH()返回值為 10, 而CHAR_LENGTH()的返回值為5。
◆ CHARACTER_LENGTH(str)
CHARACTER_LENGTH()是CHAR_LENGTH()的同義詞。
◆ COMPRESS(string_to_compress)
壓縮一個(gè)字符串。這個(gè)函數(shù)要求 MySQL已經(jīng)用一個(gè)諸如zlib的壓縮庫(kù)壓縮過(guò)。 否則,返回值始終是NULL。UNCOMPRESS() 可將壓縮過(guò)的字符串進(jìn)行解壓縮。
mysql SELECT LENGTH(COMPRESS(REPEAT('a',1000)));
- 21
mysql SELECT LENGTH(COMPRESS(''));
- 0
mysql SELECT LENGTH(COMPRESS('a'));
- 13
mysql SELECT LENGTH(COMPRESS(REPEAT('a',16)));
- 15
壓縮后的字符串的內(nèi)容按照以下方式存儲(chǔ):
空字符串按照空字符串存儲(chǔ)。
非空字符串未壓縮字符串的四字節(jié)長(zhǎng)度進(jìn)行存儲(chǔ)(首先為低字節(jié)),后面是壓縮字符串。如果字符串以空格結(jié)尾,就會(huì)在后加一個(gè)"."號(hào),以防止當(dāng)結(jié)果值是存儲(chǔ) 在CHAR或VARCHAR類(lèi)型的字段列時(shí),出現(xiàn)自動(dòng)把結(jié)尾空格去掉的現(xiàn)象。(不推薦使用 CHAR 或VARCHAR 來(lái)存儲(chǔ)壓縮字符串。最好使用一個(gè) BLOB 列代替)。
◆ CONCAT(str1,str2,...)
返回結(jié)果為連接參數(shù)產(chǎn)生的字符串。如有任何一個(gè)參數(shù)為NULL ,則返回值為 NULL?;蛟S有一個(gè)或多個(gè)參數(shù)。如果所有參數(shù)均為非二進(jìn)制字符串,則結(jié)果為非二進(jìn)制字符串。如果自變量中含有任一二進(jìn)制字符串,則結(jié)果為一個(gè)二進(jìn)制字符 串。一個(gè)數(shù)字參數(shù)被轉(zhuǎn)化為與之相等的二進(jìn)制字符串格式;若要避免這種情況,可使用顯式類(lèi)型 cast, 例如: SELECT CONCAT(CAST(int_col AS CHAR), char_col)
mysql SELECT CONCAT('My', 'S', 'QL');
- 'MySQL'
mysql SELECT CONCAT('My', NULL, 'QL');
- NULL
mysql SELECT CONCAT(14.3);- '14.3'
◆ CONCAT_WS(separator,str1,str2,...)
CONCAT_WS() 代表 CONCAT With Separator ,是CONCAT()的特殊形式。第一個(gè)參數(shù)是其它參數(shù)的分隔符。分隔符的位置放在要連接的兩個(gè)字符串之間。分隔符可以是一個(gè)字符串,也可以是其它參 數(shù)。如果分隔符為 NULL,則結(jié)果為 NULL。函數(shù)會(huì)忽略任何分隔符參數(shù)后的 NULL 值。
mysql SELECT CONCAT_WS(',','First name','Second name','Last Name');
- 'First name,Second name,Last Name'
mysql SELECT CONCAT_WS(',','First name',NULL,'Last Name');
- 'First name,Last Name'
CONCAT_WS()不會(huì)忽略任何空字符串。 (然而會(huì)忽略所有的 NULL)。
◆ CONV(N,from_base,to_base)
不同數(shù)基間轉(zhuǎn)換數(shù)字。返回值為數(shù)字的N字符串表示,由from_base基轉(zhuǎn)化為 to_base 基。如有任意一個(gè)參數(shù)為NULL,則返回值為 NULL。自變量 N 被理解為一個(gè)整數(shù),但是可以被指定為一個(gè)整數(shù)或字符串。最小基數(shù)為 2 ,而最大基數(shù)則為 36。 If to_base 是一個(gè)負(fù)數(shù),則 N 被看作一個(gè)帶符號(hào)數(shù)。否則, N 被看作無(wú)符號(hào)數(shù)。 CONV() 的運(yùn)行精確度為 64比特。
mysql SELECT CONV('a',16,2);
- '1010'
mysql SELECT CONV('6E',18,8);
- '172'
mysql SELECT CONV(-17,10,-18);
- '-H'
mysql SELECT CONV(10+'10'+'10'+0xa,10,10);
- '40'
◆ ELT(N,str1,str2,str3,...)
若N = 1,則返回值為 str1 ,若N = 2,則返回值為 str2 ,以此類(lèi)推。若N 小于1或大于參數(shù)的數(shù)目,則返回值為 NULL 。 ELT() 是 FIELD()的補(bǔ)數(shù)。
mysql SELECT ELT(1, 'ej', 'Heja', 'hej', 'foo');
- 'ej'
mysql SELECT ELT(4, 'ej', 'Heja', 'hej', 'foo');
- 'foo'
◆ EXPORT_SET(bits,on,off[,separator[,number_of_bits]])
返回值為一個(gè)字符串,其中對(duì)于bits值中的每個(gè)位組,可以得到一個(gè) on 字符串,而對(duì)于每個(gè)清零比特位,可以得到一個(gè)off 字符串。bits 中的比特值按照從右到左的順序接受檢驗(yàn) (由低位比特到高位比特)。字符串被分隔字符串分開(kāi)(默認(rèn)為逗號(hào)‘,’),按照從左到右的順序被添加到結(jié)果中。number_of_bits 會(huì)給出被檢驗(yàn)的二進(jìn)制位數(shù) (默認(rèn)為 64)。
mysql SELECT EXPORT_SET(5,'Y','N',',',4);
- 'Y,N,Y,N'
mysql SELECT EXPORT_SET(6,'1','0',',',10);
- '0,1,1,0,0,0,0,0,0,0'
◆ FIELD(str,str1,str2,str3,...)
返回值為str1, str2, str3,……列表中的str 指數(shù)。在找不到str 的情況下,返回值為 0 。
如果所有對(duì)于FIELD() 的參數(shù)均為字符串,則所有參數(shù)均按照字符串進(jìn)行比較。如果所有的參數(shù)均為數(shù)字,則按照數(shù)字進(jìn)行比較。否則,參數(shù)按照雙倍進(jìn)行比較。
如果str 為NULL,則返回值為0 ,原因是NULL不能同任何值進(jìn)行同等比較。FIELD() 是ELT()的補(bǔ)數(shù)。
mysql SELECT FIELD('ej', 'Hej', 'ej', 'Heja', 'hej', 'foo');
- 2
mysql SELECT FIELD('fo', 'Hej', 'ej', 'Heja', 'hej', 'foo');
- 0
◆ FIND_IN_SET(str,strlist)
假如字符串str 在由N 子鏈組成的字符串列表strlist 中, 則返回值的范圍在 1 到 N 之間。一個(gè)字符串列表就是一個(gè)由一些被‘,’符號(hào)分開(kāi)的自鏈組成的字符串。如果第一個(gè)參數(shù)是一個(gè)常數(shù)字符串,而第二個(gè)是type SET列,則 FIND_IN_SET() 函數(shù)被優(yōu)化,使用比特計(jì)算。如果str不在strlist 或strlist 為空字符串,則返回值為 0 。如任意一個(gè)參數(shù)為NULL,則返回值為 NULL。 這個(gè)函數(shù)在第一個(gè)參數(shù)包含一個(gè)逗號(hào)(‘,’)時(shí)將無(wú)法正常運(yùn)行。
mysql SELECT FIND_IN_SET('b','a,b,c,d');
- 2
◆ FORMAT(X,D)
將number X設(shè)置為格式 '#,###,###.##', 以四舍五入的方式保留到小數(shù)點(diǎn)后D位, 而返回結(jié)果為一個(gè)字符串。
◆ HEX(N_or_S)
如果N_OR_S 是一個(gè)數(shù)字,則返回一個(gè) 十六進(jìn)制值 N 的字符串表示,在這里, N 是一個(gè)longlong (BIGINT)數(shù)。這相當(dāng)于 CONV(N,10,16)。
如果N_OR_S 是一個(gè)字符串,則返回值為一個(gè)N_OR_S的十六進(jìn)制字符串表示, 其中每個(gè)N_OR_S 里的每個(gè)字符被轉(zhuǎn)化為兩個(gè)十六進(jìn)制數(shù)字。
mysql SELECT HEX(255);
- 'FF'
mysql SELECT 0x616263;
- 'abc'
mysql SELECT HEX('abc');
- 616263
◆ INSERT(str,pos,len,newstr)
返回字符串 str, 其子字符串起始于 pos 位置和長(zhǎng)期被字符串 newstr取代的len 字符?!?如果pos 超過(guò)字符串長(zhǎng)度,則返回值為原始字符串。假如len的長(zhǎng)度大于其它字符串的長(zhǎng)度,則從位置pos開(kāi)始替換。若任何一個(gè)參數(shù)為null,則返回值為 NULL。
mysql SELECT INSERT('Quadratic', 3, 4, 'What');
- 'QuWhattic'
mysql SELECT INSERT('Quadratic', -1, 4, 'What');
- 'Quadratic'
mysql SELECT INSERT('Quadratic', 3, 100, 'What');
- 'QuWhat'
這個(gè)函數(shù)支持多字節(jié)字元。
◆ INSTR(str,substr)
返回字符串 str 中子字符串的第一個(gè)出現(xiàn)位置。這和LOCATE()的雙參數(shù)形式相同,除非參數(shù)的順序被顛倒。
mysql SELECT INSTR('foobarbar', 'bar');
- 4
mysql SELECT INSTR('xbar', 'foobar');
- 0
這個(gè)函數(shù)支持多字節(jié)字元,并且只有當(dāng)至少有一個(gè)參數(shù)是二進(jìn)制字符串時(shí)區(qū)分大小寫(xiě)。
◆ LCASE(str)
LCASE() 是 LOWER()的同義詞?!?LEFT(str,len)
返回從字符串str 開(kāi)始的len 最左字符。
mysql SELECT LEFT('foobarbar', 5);
- 'fooba'
◆ LENGTH(str)
返回值為字符串str 的長(zhǎng)度,單位為字節(jié)。一個(gè)多字節(jié)字符算作多字節(jié)。這意味著 對(duì)于一個(gè)包含5個(gè)2字節(jié)字符的字符串, LENGTH() 的返回值為 10, 而 CHAR_LENGTH()的返回值則為5。
mysql SELECT LENGTH('text');
- 4
◆ LOAD_FILE(file_name)
讀取文件并將這一文件按照字符串的格式返回。 文件的位置必須在服務(wù)器上,你必須為文件制定路徑全名,而且你還必須擁有FILE 特許權(quán)。文件必須可讀取,文件容量必須小于 max_allowed_packet字節(jié)。
若文件不存在,或因不滿(mǎn)足上述條件而不能被讀取, 則函數(shù)返回值為 NULL。
mysql UPDATE tbl_name
SET blob_column=LOAD_FILE('/tmp/picture')
WHERE id=1;
◆ LOCATE(substr,str) , LOCATE(substr,str,pos)
第一個(gè)語(yǔ)法返回字符串 str中子字符串substr的第一個(gè)出現(xiàn)位置。第二個(gè)語(yǔ)法返回字符串 str中子字符串substr的第一個(gè)出現(xiàn)位置, 起始位置在pos。如若substr 不在str中,則返回值為0。
mysql SELECT LOCATE('bar', 'foobarbar');
- 4
mysql SELECT LOCATE('xbar', 'foobar');
- 0
mysql SELECT LOCATE('bar', 'foobarbar',5);
- 7
這個(gè)函數(shù)支持多字節(jié)字元,并且只有當(dāng)至少有一個(gè)參數(shù)是二進(jìn)制字符串時(shí)區(qū)分大小寫(xiě)。
這很正常啊,比如一張單據(jù)記錄,有單據(jù)號(hào),有開(kāi)票日期,有開(kāi)票人等字段,任何一條屬性都是極其重要的,在查看明細(xì)的時(shí)候不允許任何一條為空,這個(gè)很常見(jiàn)的,沒(méi)什么奇怪的