真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

mysql庫(kù)內(nèi)分表怎么分 mysql如何分庫(kù)分表

MySQL數(shù)據(jù)庫(kù)性能優(yōu)化之分區(qū)分表分庫(kù)

分表是分散數(shù)據(jù)庫(kù)壓力的好方法。

創(chuàng)新互聯(lián)建站主營(yíng)城陽網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,重慶APP軟件開發(fā),城陽h5微信小程序搭建,城陽網(wǎng)站營(yíng)銷推廣歡迎城陽等地區(qū)企業(yè)咨詢

分表,最直白的意思,就是將一個(gè)表結(jié)構(gòu)分為多個(gè)表,然后,可以再同一個(gè)庫(kù)里,也可以放到不同的庫(kù)。

當(dāng)然,首先要知道什么情況下,才需要分表。個(gè)人覺得單表記錄條數(shù)達(dá)到百萬到千萬級(jí)別時(shí)就要使用分表了。

分表的分類

**1、縱向分表**

將本來可以在同一個(gè)表的內(nèi)容,人為劃分為多個(gè)表。(所謂的本來,是指按照關(guān)系型數(shù)據(jù)庫(kù)的第三范式要求,是應(yīng)該在同一個(gè)表的。)

分表理由:根據(jù)數(shù)據(jù)的活躍度進(jìn)行分離,(因?yàn)椴煌钴S的數(shù)據(jù),處理方式是不同的)

案例:

對(duì)于一個(gè)博客系統(tǒng),文章標(biāo)題,作者,分類,創(chuàng)建時(shí)間等,是變化頻率慢,查詢次數(shù)多,而且最好有很好的實(shí)時(shí)性的數(shù)據(jù),我們把它叫做冷數(shù)據(jù)。而博客的瀏覽量,回復(fù)數(shù)等,類似的統(tǒng)計(jì)信息,或者別的變化頻率比較高的數(shù)據(jù),我們把它叫做活躍數(shù)據(jù)。所以,在進(jìn)行數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)的時(shí)候,就應(yīng)該考慮分表,首先是縱向分表的處理。

這樣縱向分表后:

首先存儲(chǔ)引擎的使用不同,冷數(shù)據(jù)使用MyIsam 可以有更好的查詢數(shù)據(jù)?;钴S數(shù)據(jù),可以使用Innodb ,可以有更好的更新速度。

其次,對(duì)冷數(shù)據(jù)進(jìn)行更多的從庫(kù)配置,因?yàn)楦嗟牟僮鲿r(shí)查詢,這樣來加快查詢速度。對(duì)熱數(shù)據(jù),可以相對(duì)有更多的主庫(kù)的橫向分表處理。

其實(shí),對(duì)于一些特殊的活躍數(shù)據(jù),也可以考慮使用memcache ,redis之類的緩存,等累計(jì)到一定量再去更新數(shù)據(jù)庫(kù)。或者mongodb 一類的nosql 數(shù)據(jù)庫(kù),這里只是舉例,就先不說這個(gè)。

**2、橫向分表**

字面意思,就可以看出來,是把大的表結(jié)構(gòu),橫向切割為同樣結(jié)構(gòu)的不同表,如,用戶信息表,user_1,user_2等。表結(jié)構(gòu)是完全一樣,但是,根據(jù)某些特定的規(guī)則來劃分的表,如根據(jù)用戶ID來取模劃分。

分表理由:根據(jù)數(shù)據(jù)量的規(guī)模來劃分,保證單表的容量不會(huì)太大,從而來保證單表的查詢等處理能力。

案例:同上面的例子,博客系統(tǒng)。當(dāng)博客的量達(dá)到很大時(shí)候,就應(yīng)該采取橫向分割來降低每個(gè)單表的壓力,來提升性能。例如博客的冷數(shù)據(jù)表,假如分為100個(gè)表,當(dāng)同時(shí)有100萬個(gè)用戶在瀏覽時(shí),如果是單表的話,會(huì)進(jìn)行100萬次請(qǐng)求,而現(xiàn)在分表后,就可能是每個(gè)表進(jìn)行1萬個(gè)數(shù)據(jù)的請(qǐng)求(因?yàn)?,不可能絕對(duì)的平均,只是假設(shè)),這樣壓力就降低了很多很多。

延伸:為什么要分表和分區(qū)?

日常開發(fā)中我們經(jīng)常會(huì)遇到大表的情況,所謂的大表是指存儲(chǔ)了百萬級(jí)乃至千萬級(jí)條記錄的表。這樣的表過于龐大,導(dǎo)致數(shù)據(jù)庫(kù)在查詢和插入的時(shí)候耗時(shí)太長(zhǎng),性能低下,如果涉及聯(lián)合查詢的情況,性能會(huì)更加糟糕。分表和表分區(qū)的目的就是減少數(shù)據(jù)庫(kù)的負(fù)擔(dān),提高數(shù)據(jù)庫(kù)的效率,通常點(diǎn)來講就是提高表的增刪改查效率。

什么是分表?

分表是將一個(gè)大表按照一定的規(guī)則分解成多張具有獨(dú)立存儲(chǔ)空間的實(shí)體表,我們可以稱為子表,每個(gè)表都對(duì)應(yīng)三個(gè)文件,MYD數(shù)據(jù)文件,.MYI索引文件,.frm表結(jié)構(gòu)文件。這些子表可以分布在同一塊磁盤上,也可以在不同的機(jī)器上。app讀寫的時(shí)候根據(jù)事先定義好的規(guī)則得到對(duì)應(yīng)的子表名,然后去操作它。

什么是分區(qū)?

分區(qū)和分表相似,都是按照規(guī)則分解表。不同在于分表將大表分解為若干個(gè)獨(dú)立的實(shí)體表,而分區(qū)是將數(shù)據(jù)分段劃分在多個(gè)位置存放,可以是同一塊磁盤也可以在不同的機(jī)器。分區(qū)后,表面上還是一張表,但數(shù)據(jù)散列到多個(gè)位置了。app讀寫的時(shí)候操作的還是大表名字,db自動(dòng)去組織分區(qū)的數(shù)據(jù)。

**MySQL分表和分區(qū)有什么聯(lián)系呢?**

1、都能提高mysql的性高,在高并發(fā)狀態(tài)下都有一個(gè)良好的表現(xiàn)。

2、分表和分區(qū)不矛盾,可以相互配合的,對(duì)于那些大訪問量,并且表數(shù)據(jù)比較多的表,我們可以采取分表和分區(qū)結(jié)合的方式(如果merge這種分表方式,不能和分區(qū)配合的話,可以用其他的分表試),訪問量不大,但是表數(shù)據(jù)很多的表,我們可以采取分區(qū)的方式等。

3、分表技術(shù)是比較麻煩的,需要手動(dòng)去創(chuàng)建子表,app服務(wù)端讀寫時(shí)候需要計(jì)算子表名。采用merge好一些,但也要?jiǎng)?chuàng)建子表和配置子表間的union關(guān)系。

4、表分區(qū)相對(duì)于分表,操作方便,不需要?jiǎng)?chuàng)建子表。

我們知道對(duì)于大型的互聯(lián)網(wǎng)應(yīng)用,數(shù)據(jù)庫(kù)單表的數(shù)據(jù)量可能達(dá)到千萬甚至上億級(jí)別,同時(shí)面臨這高并發(fā)的壓力。Master-Slave結(jié)構(gòu)只能對(duì)數(shù)據(jù)庫(kù)的讀能力進(jìn)行擴(kuò)展,寫操作還是集中在Master中,Master并不能無限制的掛接Slave庫(kù),如果需要對(duì)數(shù)據(jù)庫(kù)的吞吐能力進(jìn)行進(jìn)一步的擴(kuò)展,可以考慮采用分庫(kù)分表的策略。

**1、分表**

在分表之前,首先要選中合適的分表策略(以哪個(gè)字典為分表字段,需要將數(shù)據(jù)分為多少?gòu)埍恚?,使?shù)據(jù)能夠均衡的分布在多張表中,并且不影響正常的查詢。在企業(yè)級(jí)應(yīng)用中,往往使用org_id(組織主鍵)做為分表字段,在互聯(lián)網(wǎng)應(yīng)用中往往是userid。在確定分表策略后,當(dāng)數(shù)據(jù)進(jìn)行存儲(chǔ)及查詢時(shí),需要確定到哪張表里去查找數(shù)據(jù),

數(shù)據(jù)存放的數(shù)據(jù)表 = 分表字段的內(nèi)容 % 分表數(shù)量

**2、分庫(kù)**

分表能夠解決單表數(shù)據(jù)量過大帶來的查詢效率下降的問題,但是不能給數(shù)據(jù)庫(kù)的并發(fā)訪問帶來質(zhì)的提升,面對(duì)高并發(fā)的寫訪問,當(dāng)Master無法承擔(dān)高并發(fā)的寫入請(qǐng)求時(shí),不管如何擴(kuò)展Slave服務(wù)器,都沒有意義了。我們通過對(duì)數(shù)據(jù)庫(kù)進(jìn)行拆分,來提高數(shù)據(jù)庫(kù)的寫入能力,即所謂的分庫(kù)。分庫(kù)采用對(duì)關(guān)鍵字取模的方式,對(duì)數(shù)據(jù)庫(kù)進(jìn)行路由。

數(shù)據(jù)存放的數(shù)據(jù)庫(kù)=分庫(kù)字段的內(nèi)容%數(shù)據(jù)庫(kù)的數(shù)量

**3、即分表又分庫(kù)**

數(shù)據(jù)庫(kù)分表可以解決單表海量數(shù)據(jù)的查詢性能問題,分庫(kù)可以解決單臺(tái)數(shù)據(jù)庫(kù)的并發(fā)訪問壓力問題。

當(dāng)數(shù)據(jù)庫(kù)同時(shí)面臨海量數(shù)據(jù)存儲(chǔ)和高并發(fā)訪問的時(shí)候,需要同時(shí)采取分表和分庫(kù)策略。一般分表分庫(kù)策略如下:

中間變量 = 關(guān)鍵字%(數(shù)據(jù)庫(kù)數(shù)量*單庫(kù)數(shù)據(jù)表數(shù)量)

庫(kù) = 取整(中間變量/單庫(kù)數(shù)據(jù)表數(shù)量)

表 = (中間變量%單庫(kù)數(shù)據(jù)表數(shù)量)

實(shí)例:

1、分庫(kù)分表

很明顯,一個(gè)主表(也就是很重要的表,例如用戶表)無限制的增長(zhǎng)勢(shì)必嚴(yán)重影響性能,分庫(kù)與分表是一個(gè)很不錯(cuò)的解決途徑,也就是性能優(yōu)化途徑,現(xiàn)在的案例是我們有一個(gè)1000多萬條記錄的用戶表members,查詢起來非常之慢,同事的做法是將其散列到100個(gè)表中,分別從members0到members99,然后根據(jù)mid分發(fā)記錄到這些表中,牛逼的代碼大概是這樣子:

復(fù)制代碼 代碼如下:

?php

for($i=0;$i 100; $i++ ){

//echo "CREATE TABLE db2.members{$i} LIKE db1.members

";

echo "INSERT INTO members{$i} SELECT * FROM members WHERE mid%100={$i}

";

}

?

2、不停機(jī)修改mysql表結(jié)構(gòu)

同樣還是members表,前期設(shè)計(jì)的表結(jié)構(gòu)不盡合理,隨著數(shù)據(jù)庫(kù)不斷運(yùn)行,其冗余數(shù)據(jù)也是增長(zhǎng)巨大,同事使用了下面的方法來處理:

先創(chuàng)建一個(gè)臨時(shí)表:

/*創(chuàng)建臨時(shí)表*/

CREATE TABLE members_tmp LIKE members

然后修改members_tmp的表結(jié)構(gòu)為新結(jié)構(gòu),接著使用上面那個(gè)for循環(huán)來導(dǎo)出數(shù)據(jù),因?yàn)?000萬的數(shù)據(jù)一次性導(dǎo)出是不對(duì)的,mid是主鍵,一個(gè)區(qū)間一個(gè)區(qū)間的導(dǎo),基本是一次導(dǎo)出5萬條吧,這里略去了

接著重命名將新表替換上去:

/*這是個(gè)頗為經(jīng)典的語句哈*/

RENAME TABLE members TO members_bak,members_tmp TO members;

就是這樣,基本可以做到無損失,無需停機(jī)更新表結(jié)構(gòu),但實(shí)際上RENAME期間表是被鎖死的,所以選擇在線少的時(shí)候操作是一個(gè)技巧。經(jīng)過這個(gè)操作,使得原先8G多的表,一下子變成了2G多。

分庫(kù)分表技術(shù)及技術(shù)方案

一、分庫(kù)分表的必要性

分庫(kù)分表技術(shù)的使用,主要是數(shù)據(jù)庫(kù)產(chǎn)生了瓶頸,如單庫(kù)的并發(fā)訪問或單表的查詢都超出了閾值。對(duì)系統(tǒng)使用造成一定的影響,不得已而產(chǎn)生的技術(shù)。

通過分庫(kù)分表技術(shù)來解決此類問題,但正因?yàn)槭褂么思夹g(shù),會(huì)產(chǎn)生ACID一系列的問題,各類中間件解決此類問題各有各的優(yōu)勢(shì)。

提示:如場(chǎng)景無必要,千萬不要使用分庫(kù)分表。

二、分庫(kù)分表的思路

1、垂直區(qū)分

垂直分庫(kù):從業(yè)務(wù)角度,一個(gè)庫(kù)分成多個(gè)庫(kù),如把訂單和用戶信息分成兩個(gè)庫(kù)來存儲(chǔ)。這樣的好處就是可以微服務(wù)了。每塊的業(yè)務(wù)單獨(dú)部署,互不影響,通過接口去調(diào)用。

垂直分表:把大表分成多個(gè)小表,如熱點(diǎn)數(shù)據(jù)和非熱點(diǎn)數(shù)據(jù)分開,提高查詢速度。

2、水平區(qū)分

水平分表:同一業(yè)務(wù)如數(shù)據(jù)量大了以后,根據(jù)一定的規(guī)則分為不同的表進(jìn)行存儲(chǔ)。

水平分庫(kù):如訂單分成多個(gè)庫(kù)存儲(chǔ),分解服務(wù)器壓力。

以上一般來說,垂直分庫(kù)和水平分表用的會(huì)多些。

三、分庫(kù)分表的原理分析

分庫(kù)分表常用的方案:Hash取模方案和range范圍方案;

路由算法為最主要的算法,指得是把路由的Key按照指定的算法進(jìn)行存放;

1、Hash取模方案

根據(jù)取余分配到不同的表里。要根據(jù)實(shí)際情況確認(rèn)模的大小。此方案由于平均分配,不存在熱點(diǎn)問題,但數(shù)據(jù)遷移很復(fù)雜。

2、Range范圍方案

range根據(jù)范圍進(jìn)行劃分,如日期,大小。此方案不存在數(shù)據(jù)遷移,但存在熱點(diǎn)問題。

四、分庫(kù)分表的技術(shù)選型

1、技術(shù)選型

解決方案主要分為4種:MySQL的分區(qū)技術(shù)、NoSql、NewSQL、MySQL的分庫(kù)分表。

(1)mysql分區(qū)技術(shù):把一張表存放在不同存儲(chǔ)文件。由于無法負(fù)載,使用較少。

(2)NoSQL(如MongoDB):如是訂單等比較重要數(shù)據(jù),強(qiáng)關(guān)聯(lián)關(guān)系,需約束一致性,不太適應(yīng)。

(3)NewSql(具有NoSQL對(duì)海量數(shù)據(jù)的存儲(chǔ)管理能力,還保持了傳統(tǒng)數(shù)據(jù)庫(kù)支持ACID和SQL等特性):如TiDB可滿足需求。

(4)MySQL的分庫(kù)分表:如使用mysql,此種方案為主流方式。

2、中間件

解決此類問題的中間件主要為:Proxy模式、Client模式。

(1)Proxy模式

(2)Client模式

把分庫(kù)分表相關(guān)邏輯存放在客戶端,一版客戶端的應(yīng)用會(huì)引用一個(gè)jar,然后再jar中處理SQL組合、數(shù)據(jù)庫(kù)路由、執(zhí)行結(jié)果合并等相關(guān)功能。

(3)中間件的比較

由于Client模式少了一層,運(yùn)維方便,相對(duì)來說容易些。

五、分庫(kù)分表的實(shí)踐

根據(jù)容量(當(dāng)前容量和增長(zhǎng)量)評(píng)估分庫(kù)或分表個(gè)數(shù) - 選key(均勻)- 分表規(guī)則(hash或range等)- 執(zhí)行(一般雙寫)- 擴(kuò)容問題(盡量減少數(shù)據(jù)的移動(dòng))。

在這里我們選用中間件share-jdbc。

1、引入maven依賴

2、spring boot規(guī)則配置

行表達(dá)式標(biāo)識(shí)符可以使用${...}或$-{...},但前者與Spring本身的屬性文件占位符沖突,因此在Spring環(huán)境中使用行表達(dá)式標(biāo)識(shí)符建議使用$-{...}。

3、創(chuàng)建DataSource

通過ShardingDataSourceFactory工廠和規(guī)則配置對(duì)象獲取ShardingDataSource,ShardingDataSource實(shí)現(xiàn)自JDBC的標(biāo)準(zhǔn)接口DataSource。然后即可通過DataSource選擇使用原生JDBC開發(fā),或者使用JPA, MyBatis等ORM工具。

淺談mysql數(shù)據(jù)庫(kù)分庫(kù)分表那些事-億級(jí)數(shù)據(jù)存儲(chǔ)方案

mysql分庫(kù)分表一般有如下場(chǎng)景

其中1,2相對(duì)較容易實(shí)現(xiàn),本文重點(diǎn)講講水平拆表和水平拆庫(kù),以及基于mybatis插件方式實(shí)現(xiàn)水平拆分方案落地。

在 《聊一聊擴(kuò)展字段設(shè)計(jì)》 一文中有講解到基于KV水平存儲(chǔ)擴(kuò)展字段方案,這就是非常典型的可以水平分表的場(chǎng)景。主表和kv表是一對(duì)N關(guān)系,隨著主表數(shù)據(jù)量增長(zhǎng),KV表最大N倍線性增長(zhǎng)。

這里我們以分KV表水平拆分為場(chǎng)景

對(duì)于kv擴(kuò)展字段查詢,只會(huì)根據(jù)id + key 或者 id 為條件的方式查詢,所以這里我們可以按照id 分片即可

分512張表(實(shí)際場(chǎng)景具體分多少表還得根據(jù)字段增加的頻次而定)

分表后表名為kv_000 ~ kv_511

id % 512 = 1 .... 分到 kv_001,

id % 512 = 2 .... 分到 kv_002

依次類推!

水平分表相對(duì)比較容易,后面會(huì)講到基于mybatis插件實(shí)現(xiàn)方案

場(chǎng)景:以下我們基于博客文章表分庫(kù)場(chǎng)景來分析

目標(biāo):

表結(jié)構(gòu)如下(節(jié)選部分字段):

按照user_id sharding

假如分1024個(gè)庫(kù),按照user_id % 1024 hash

user_id % 1024 = 1 分到db_001庫(kù)

user_id % 1024 = 2 分到db_002庫(kù)

依次類推

目前是2個(gè)節(jié)點(diǎn),假如后期達(dá)到瓶頸,我們可以增加至4個(gè)節(jié)點(diǎn)

最多可以增加只1024個(gè)節(jié)點(diǎn),性能線性增長(zhǎng)

對(duì)于水平分表/分庫(kù)后,非shardingKey查詢首先得考慮到

基于mybatis分庫(kù)分表,一般常用的一種是基于spring AOP方式, 另外一種基于mybatis插件。其實(shí)兩種方式思路差不多。

為了比較直觀解決這個(gè)問題,我分別在Executor 和StatementHandler階段2個(gè)攔截器

實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)源獲取接口

測(cè)試結(jié)果如下

由此可知,我們需要在Executor階段 切換數(shù)據(jù)源

對(duì)于分庫(kù):

原始sql:

目標(biāo)sql:

其中定義了三個(gè)注解

@useMaster 是否強(qiáng)制讀主

@shardingBy 分片標(biāo)識(shí)

@DB 定義邏輯表名 庫(kù)名以及分片策略

1)編寫entity

Insert

select

以上順利實(shí)現(xiàn)mysql分庫(kù),同樣的道理實(shí)現(xiàn)同時(shí)分庫(kù)分表也很容易實(shí)現(xiàn)。

此插件具體實(shí)現(xiàn)方案已開源:

目錄如下:

mysql分庫(kù)分表,首先得找到瓶頸在哪里(IO or CPU),是分庫(kù)還是分表,分多少?不能為了分庫(kù)分表而拆分。

原則上是盡量先垂直拆分 后 水平拆分。

以上基于mybatis插件分庫(kù)分表是一種實(shí)現(xiàn)思路,還有很多不完善的地方,

例如:


標(biāo)題名稱:mysql庫(kù)內(nèi)分表怎么分 mysql如何分庫(kù)分表
當(dāng)前鏈接:http://weahome.cn/article/doiijhh.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部