一、背景
創(chuàng)新互聯(lián)主要從事成都做網(wǎng)站、網(wǎng)站建設(shè)、外貿(mào)營銷網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)新和,10多年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):18982081108
話說風(fēng)和日麗的一天,為提高隨著業(yè)務(wù)增長(zhǎng)的大表(3510449行吧)的訪問效率,于是決定對(duì)表分區(qū),記錄如下。
二、實(shí)操
結(jié)合業(yè)務(wù),若干條記錄會(huì)集中在一個(gè)日期,查詢時(shí)也往往只查詢一個(gè)日期內(nèi)的數(shù)據(jù),于是選取分區(qū)字段為時(shí)間。
創(chuàng)建分區(qū) 比如
CREATE TABLE message_all (
id int(10) NOT NULL AUTO_INCREMENT,
......
createtime datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '創(chuàng)建時(shí)間'
PRIMARY KEY ( id , createtime )
) ENGINE=InnoDB DEFAULT CHARSET=utf8
PARTITION BY RANGE (YEAR(createtime))
(PARTITION p2015 VALUES LESS THAN (2016) ENGINE = InnoDB,
PARTITION p2016 VALUES LESS THAN (2017) ENGINE = InnoDB,
PARTITION p2017 VALUES LESS THAN (2018) ENGINE = InnoDB,
PARTITION p2018 VALUES LESS THAN MAXVALUE ENGINE = InnoDB)
不過我們表已經(jīng)有了當(dāng)然不能這么建,除非你想導(dǎo)一次數(shù)據(jù)。
如下操作 :
1、
ALTER TABLE message_all PARTITION BY RANGE (to_days(createtime))
(
PARTITION p2015 VALUES LESS THAN (to_days('2016-01-01')),
PARTITION p2016 VALUES LESS THAN (to_days('2017-01-01')),
PARTITION p2017 VALUES LESS THAN (to_days('2018-01-01')),
PARTITION p2018 VALUES LESS THAN MAXVALUE
);
或者
2、ALTER TABLE message_all PARTITION BY RANGE (YEAR(createtime))
(
PARTITION p2015 VALUES LESS THAN (YEAR('2016-01-01'))
);
然后追加。
ALTER TABLE message_all ADD PARTITION
(
PARTITION p2016 VALUES LESS THAN (YEAR('2017-01-01')),
PARTITION p2017 VALUES LESS THAN (YEAR('2018-01-01')),
PARTITION p2018 VALUES LESS THAN MAXVALUE
);
這里會(huì)有幾種錯(cuò)誤情況:
1、ALTER TABLE message_all PARTITION BY RANGE (to_days(createtime)) ;
[Err] 1492 - For RANGE partitions each partition must be defined
解釋:必須指定至少一個(gè)分區(qū)。
2、[Err] 1492 - A PRIMARY KEY must include all columns in the table's partitioning function
解釋:分區(qū)字段必須是主鍵之一。
3、[Err] 1492 - Constant, random or timezone-dependent expressions in (sub)partitioning function are not allowed
解釋:分區(qū)字段為timestamp,換成datetime。
4、[Err] 1526 - Table has no partition for value xxxx
解釋:用追加方式第一次必須覆蓋目前所有數(shù)據(jù)。
總結(jié):
1、創(chuàng)建時(shí)必須指定至少一個(gè)分區(qū)。
2、key必須為主鍵之一。
3、RANGE處必須為INT型,時(shí)間字段用函數(shù)轉(zhuǎn)——YEAR()、YEARWEEK()、TO_DAYS()。
4、THAN處必須為INT型,時(shí)間字段用函數(shù)轉(zhuǎn)——TO_DAYS、TO_SECONDS()、UNIX_TIMESTAMP()。
5、它就是以兩個(gè)INT比大小劃分的文件。
6、所有ENGINE必須一樣。
7、范圍分區(qū)添加只能在最大值后面追加。
8、分區(qū)是有上限的貌似1024個(gè)。
用到的其他操作
1、刪除分區(qū)(直接扔掉分區(qū)文件,數(shù)據(jù)也沒了)
ALTER TABLE message_all DROP PARTITION p2016;
2、清空分區(qū)數(shù)據(jù)
ALTER TABLE message_all TRUNCATE PARTITION p2017;
3、重定義(可實(shí)現(xiàn):分區(qū)拆分、合并、重命名)
ALTER TABLE message_all REORGANIZE PARTITION p201601,p201602,p201603,p201604 INTO
(
PARTITION p2016012 VALUES less than(TO_DAYS('2016-03-01')),
PARTITION p2016034 VALUES less than(TO_DAYS('2016-05-01'))
);
檢查/查看你的分區(qū)
1、SHOW TABLE STATUS LIKE 'message_all';
2、SELECT * FROM information_schema.partitions WHERE table_name='message_all';
3、SHOW CREATE TABLE message_all;
4、EXPLAIN SELECT COUNT(1) FROM message_all WHERE createtime= '2016-01-01' AND createtime '2016-12-30';如果用到了分區(qū)partitions里會(huì)有顯示。
5、指定分區(qū)查
SELECT COUNT(1) FROM message_all PARTITION (p2016) 表別名 WHERE ......;
到這里就結(jié)束啦,土豆白。
一些概念
水平分區(qū)Partition有以下幾種模式
分區(qū)介紹:
一、什么是分區(qū)?
所謂分區(qū),就是將一個(gè)表分成多個(gè)區(qū)塊進(jìn)行操作和保存,從而降低每次操作的數(shù)據(jù),提高性能。而對(duì)于應(yīng)用來說則是透明的,從邏輯上看只有一張表,但在物理上這個(gè)表可能是由多個(gè)物理分區(qū)組成的,每個(gè)分區(qū)都是獨(dú)立的對(duì)象,可以進(jìn)行獨(dú)立處理。
二、分區(qū)作用
1.可以邏輯數(shù)據(jù)分割,分割數(shù)據(jù)能夠有多個(gè)不同的物理文件路徑。
2.可以存儲(chǔ)更多的數(shù)據(jù),突破系統(tǒng)單個(gè)文件最大限制。
3.提升性能,提高每個(gè)分區(qū)的讀寫速度,提高分區(qū)范圍查詢的速度。
4.可以通過刪除相關(guān)分區(qū)來快速刪除數(shù)據(jù)
5.通過跨多個(gè)磁盤來分散數(shù)據(jù)查詢,從而提高磁盤I/O的性能。
6.涉及到例如SUM()、COUNT()這樣聚合函數(shù)的查詢,可以很容易的進(jìn)行并行處理。
7.可以備份和恢復(fù)獨(dú)立的分區(qū),這對(duì)大數(shù)據(jù)量很有好處。
三、分區(qū)能支持的引擎
MySQL支持大部分引擎創(chuàng)建分區(qū),入MyISAM、InnoDB等;不支持MERGE和CSV等來創(chuàng)建分區(qū)。同一個(gè)分區(qū)表中的所有分區(qū)必須是同一個(gè)存儲(chǔ)引擎。值得注意的是,在MySQL8版本中,MyISAM表引擎不支持分區(qū)。
四、確認(rèn)MySQL支持分區(qū)
從MySQL5.1開始引入分區(qū)功能,可以如下方式查看是否支持:
老版本用:SHOW VARIABLES LIKE '%partition%';
新版本用:show plugins;
五、分區(qū)類型
1. RANGE分區(qū):基于屬于一個(gè)給定連續(xù)區(qū)間的列值,把多行分配給分區(qū)。
例如,可以將一個(gè)表通過年份劃分成兩個(gè)分區(qū),2001 -2010年、2011-2020。
2. LIST分區(qū):類似于RANGE分區(qū),LIST是列值匹配一個(gè)離散值集合中的某個(gè)值來進(jìn)行選擇。
比如 根據(jù)字段 把值為1、3、5的放到一起,2、4、6的另外放到一起 等等...
3. HASH分區(qū):基于用戶定義的表達(dá)式的返回值來進(jìn)行選擇分區(qū),該表達(dá)式使用將要插入到表中的這些行的列值來進(jìn)行計(jì)算,這個(gè)函數(shù)必須產(chǎn)生非負(fù)整數(shù)值。
通過HASH運(yùn)算來進(jìn)行分區(qū),分布的比較均勻
4. KEY分區(qū):類似于按HASH分區(qū),由MySQL服務(wù)器提供其自身的哈希函數(shù)。
按照KEY進(jìn)行分區(qū)類似于按照HASH分區(qū)
六、使用分區(qū)注意事項(xiàng)
1. 如果表中存在primary key 或者 unique key 時(shí),分區(qū)的列必須是paimary key或者unique key的一個(gè)組成部分,也就是說,分區(qū)函數(shù)的列只能從pk或者uk這些key中取子集
2. 如果表中不存在任何的paimary key或者unique key,則可以指定任何一個(gè)列作為分區(qū)列
3. 5.5版本前的RANGE、LIST、HASH分區(qū)要求分區(qū)鍵必須是int;MySQL5.5及以上,支持非整形的RANGE和LIST分區(qū),即:range columns 和 list columns (可以用字符串來進(jìn)行分區(qū))。
七、分區(qū)命名
1. 分區(qū)的名字基本上遵循其他MySQL 標(biāo)識(shí)符應(yīng)當(dāng)遵循的原則,例如用于表和數(shù)據(jù)庫名字的標(biāo)識(shí)符。應(yīng)當(dāng)注意的是,分區(qū)的名字是不區(qū)分大小寫的。
2. 無論使用何種類型的分區(qū),分區(qū)總是在創(chuàng)建時(shí)就自動(dòng)的順序編號(hào),且從0開始記錄。
八、 創(chuàng)建分區(qū)
1. RANGE分區(qū):
解讀:以上為 uuid小于5時(shí)放到p0分區(qū)下,uuid大于5且小于10放到p1分區(qū)下,uuid大于10且小于15放到p2分區(qū)下,uuid大于15 一直到最大值的存在p3分區(qū)下
2. LIST分區(qū):
解讀:以上為uuid 等于1/2/3/5時(shí)放到p0分區(qū),7/9/10放到p1分區(qū),11/15放到p2分區(qū)。當(dāng)時(shí)用insert into時(shí) 如果uuid的值不存在p0/p1/p2分區(qū)時(shí),則會(huì)插入失敗而報(bào)錯(cuò)。
3. HASH分區(qū):
HASH分區(qū)主要用來確保數(shù)據(jù)在預(yù)先確定數(shù)目的分區(qū)中平均分布。在RANGE分區(qū)和LIST分區(qū)中必須明確指定一個(gè)指定的列值或列值集合以指定應(yīng)該保存在哪個(gè)分區(qū)中。而在HASH分區(qū)中,MySQL會(huì)自動(dòng)完成這些工作,要做的只是基于將要被哈希的列值指定一個(gè)表達(dá)式,以及指定被分區(qū)的表將要被分割成的分區(qū)數(shù)量,如:
解讀:MySQL自動(dòng)創(chuàng)建3個(gè)分區(qū),在執(zhí)行insert into時(shí),根據(jù)插入的uuid通過算法來自動(dòng)分配區(qū)間。
注意:
(1) 由于每次插入、更新、刪除一行,這個(gè)表達(dá)式都要計(jì)算一次,這意味著非常復(fù)雜的表達(dá)式可能會(huì)引起性能問題,尤其是在執(zhí)行同時(shí)影響大量行的運(yùn)算(例如批量插入)的時(shí)候。
(2) 最有效率的哈希函數(shù)是只對(duì)單個(gè)表列進(jìn)行計(jì)算,并且它的值隨列值進(jìn)行一致的增大或減小,因?yàn)檫@考慮了在分區(qū)范圍上的“修剪”。也就是說,表達(dá)式值和它所基于的列的值變化越接近,就越能有效地使用該表達(dá)式來進(jìn)行HASH分區(qū)。
3.1:線性HASH分區(qū)
線性HASH分區(qū)在“PARTITION BY”子句中添加“LINEAR”關(guān)鍵字。
線性HASH分區(qū)的有點(diǎn)在于增加、刪除、合并和拆分分區(qū)將變得更加快捷,有利于處理含有及其大量數(shù)據(jù)的表。它的缺點(diǎn)在于各個(gè)分區(qū)間數(shù)據(jù)的分布不大可能均衡。
4. KEY分區(qū)
類似于HASH分區(qū),HASH分區(qū)允許用戶自定義的表達(dá)式,而KEY分區(qū)則不允許使用用戶自定義的表達(dá)式;HASH分區(qū)只支持整數(shù)分區(qū),KEY分區(qū)支持除了blob和text類型之外的其他數(shù)據(jù)類型分區(qū)。
與HASH分區(qū)不同,創(chuàng)建KEY分區(qū)表的時(shí)候,可以不指定分區(qū)鍵,默認(rèn)會(huì)選擇使用主鍵或唯一鍵作為分區(qū)鍵,沒有主鍵或唯一鍵,就必須指定分區(qū)鍵。
解讀:根據(jù)分區(qū)鍵來進(jìn)行分區(qū)
5. 子分區(qū)
子分區(qū)是分區(qū)表中,每個(gè)分區(qū)的再次分割,適合保存非常大量的數(shù)據(jù)。
解讀:主分區(qū)使用RANGE按照年來進(jìn)行分區(qū),有3個(gè)RANGE分區(qū)。這3個(gè)分區(qū)中又被進(jìn)一步分成了2個(gè)子分區(qū),實(shí)際上,整個(gè)表被分成了3 * 2 = 6個(gè)分區(qū)。每個(gè)子分區(qū)按照天進(jìn)行HASH分區(qū)。小于2017的放在一起,2017-2020的放在一起,大于2020的放在一起。
注意:
(1) 在MySQL5.1中,對(duì)于已經(jīng)通過RANGE或LIST分區(qū)了的表在進(jìn)行子分區(qū)是可能的。子分區(qū)既可以使用HASH分區(qū),也可以使用KEY分區(qū)。這也被稱為復(fù)合分區(qū)。
(2) 每個(gè)分區(qū)必須有相同數(shù)量的子分區(qū)。
(3) 如果在一個(gè)分區(qū)表上的任何分區(qū)上使用SUBPARTITION來明確定義任何子分區(qū),那么就必須定義所有的子分區(qū)。
(4) 每個(gè)SUBPARTITION子句必須包含(至少)子分區(qū)的一個(gè)名字。
(5) 在每個(gè)子分區(qū)內(nèi),子分區(qū)的名字必須是惟一的,目前在整個(gè)表中,也要保持唯一。例如:
子分區(qū)可以用于特別大的表,可以在多個(gè)磁盤間分配數(shù)據(jù)和索引。例如:
九、MySQL分區(qū)處理NULL值的方式
十、分區(qū)管理概述
可以對(duì)分區(qū)進(jìn)行添加、刪除、重新定義、合并或拆分等管理操作。
① RANGE和LIST分區(qū)的管理
1. 刪除分區(qū)語句如:alter table tbl_test drop partition p0;
注意:
(1) 當(dāng)刪除了一個(gè)分區(qū),也同時(shí)刪除了該分區(qū)中所有的數(shù)據(jù)。
(2) 可以通過show create table tbl_test;來查看新的創(chuàng)建表的語句。
(3) 如果是LIST分區(qū)的話,刪除的數(shù)據(jù)不能新增進(jìn)來,因?yàn)檫@些行的列值包含在已經(jīng)刪除了的分區(qū)的值列表中。
2. 添加分區(qū)語句如:alter table tbl_test add partition(partition p3 values less than(50));
注意:
(1) 對(duì)于RANGE分區(qū)的表,只可以添加新的分區(qū)到分區(qū)列表的最高端。
(2) 對(duì)于LIST分區(qū)的表,不能添加已經(jīng)包含在現(xiàn)有分區(qū)值列表中的任意值。
3. 如果希望能不丟失數(shù)據(jù)的條件下重新定義分區(qū),可以使用如下語句:
REORGANIZE會(huì)對(duì)分區(qū)的數(shù)據(jù)進(jìn)行重構(gòu)。
ALTER TABLE tbl_name REORGANIZE PARTITION partition_list INTO(partition_definitions)
(1) 拆分分區(qū)如:
ALTER TABLE tbl_name REORGANIZE PARTITION partition_list INTO(partition s0 values less than(5),partition s1 values less than(10));
或者如:
ALTER TABLE tbl_name REORGANIZE PARTITION p0 INTO(partition s0 values in(1,2,3), partition s1 values in(4,5));
(2) 合并分區(qū)如:ALTER TABLE tbl_name REORGANIZE PARTITION s0,s1 INTO(partition p0 values in(1,2,3,4,5));
4. 刪除所有分區(qū),但保留數(shù)據(jù),形式:ALTER TABLE tbl_name remove partitioning;
② HASH和KEY分區(qū)的管理
1. 減少分區(qū)數(shù)量語句如:ALTER TABLE tbl_name COALESCE PARTITION 2;
2. 添加分區(qū)數(shù)量語句如:ALTER TABLE tbl_name add PARTITION partitions 2;
③ 其他分區(qū)管理語句
1. 重建分區(qū):類似于先刪除保存在分區(qū)中的所有記錄,然后重新插入它們,可用于整理分區(qū)碎片。如:ALTER table tbl_name REBUILD PARTITION p2,p3;
2. 優(yōu)化分區(qū):如果從分區(qū)中刪除了大量的行,或者對(duì)一個(gè)帶有可變長(zhǎng)度的行(也就是說,有VARCHAR,BLOB或TEXT類型的列)做了許多修改,可以使用 ALTER TABLE tbl_name OPTIMIZE PARTITION來收回沒有使用的空間,并整理分區(qū)數(shù)據(jù)文件的碎片。如:ALTER TABLE tbl_name OPTIMIZE PARTITION p2,p3;
3. 分析分區(qū):讀取并保存分區(qū)的鍵分布,如:ALTER TABLE tbl_name ANALYZE PARTITION p2,p3;
4. 檢查分區(qū):檢查分區(qū)中的數(shù)據(jù)或索引是否已經(jīng)被破壞,如:ALTER TABLE tbl_name CHECK PARTITION p2,p3;
5. 修補(bǔ)分區(qū):修補(bǔ)被破壞的分區(qū),如:ALTER TABLE tbl_name REPAIR PARTITION p2,p3;
十、查看分區(qū)信息
1. 查看分區(qū)信息:select * from information_schema.partitions where table_schema='arch1' and table_name = 'tbl_test' G;
2. 查看分區(qū)上的數(shù)據(jù):select * from tbl_test partition(p0);
3. 查看MySQL會(huì)操作的分區(qū):explain partitions select * from tbl_test where uuid = 2;
十一、 局限性
1. 最大分區(qū)數(shù)目不能超過1024,一般建議對(duì)單表的分區(qū)數(shù)不要超過50個(gè)。
2. 如果含有唯一索引或者主鍵,則分區(qū)列必須包含在所有的唯一索引或者主鍵在內(nèi)。
3. 不支持外鍵。
4. 不支持全文索引,對(duì)分區(qū)表的分區(qū)鍵創(chuàng)建索引,那么這個(gè)索引也將被分區(qū)。
5. 按日期進(jìn)行分區(qū)很合適,因?yàn)楹芏嗳掌诤瘮?shù)可以用。但是對(duì)字符串來說合適的分區(qū)函數(shù)不太多。
6. 只有RANGE和LIST分區(qū)能進(jìn)行子分區(qū),HASH和KEY分區(qū)不能進(jìn)行子分區(qū)。
7. 臨時(shí)表不能被分區(qū)。
8. 分區(qū)表對(duì)于單條記錄的查詢沒有優(yōu)勢(shì)。
9. 要注意選擇分區(qū)的成本,沒插入一行數(shù)據(jù)都需要按照表達(dá)式篩選插入的分區(qū)。
10. 分區(qū)字段盡量不要可以為null
當(dāng)數(shù)據(jù)表中的數(shù)據(jù)量很大時(shí),分區(qū)帶來的效率提升才會(huì)顯現(xiàn)出來。
只有檢索字段為分區(qū)字段時(shí),分區(qū)帶來的效率提升才會(huì)比較明顯。因此, 分區(qū)字段的選擇很重要 ,并且 業(yè)務(wù)邏輯要盡可能地根據(jù)分區(qū)字段做相應(yīng)調(diào)整 (盡量使用分區(qū)字段作為查詢條件)。
1、分區(qū)表對(duì)業(yè)務(wù)透明,只需要維護(hù)一個(gè)表的數(shù)據(jù)結(jié)構(gòu)。
2、DML操作加鎖僅影響操作的分區(qū),不會(huì)影響未訪問分區(qū)。
3、通過分區(qū)交換快速將數(shù)據(jù)換入和換出分區(qū)表。
4、通過TRUNCATE操作快速清理特定分區(qū)數(shù)據(jù)。
5、通過強(qiáng)制分區(qū)僅訪問特定分區(qū)數(shù)據(jù),減少操作影響。
6、通過大數(shù)據(jù)量分區(qū)能有效降低索引層數(shù),提高查詢性能。
1、創(chuàng)建表時(shí)指定分區(qū)
物理文件:
2、插入數(shù)據(jù)
3、查詢 information_schema.partitions 表得到該表的分區(qū)信息
4、查詢計(jì)劃分析
5、添加分區(qū)
若報(bào)錯(cuò):
6、修改/覆蓋/合并分區(qū)
報(bào)錯(cuò)
所以需要添加pmax 分區(qū),一同修改
7、刪除分區(qū)
8、查詢具體分區(qū)的下數(shù)據(jù)
MySQL分區(qū)的限制