如何提高MySQL Limit查詢的性能?\x0d\x0a在MySQL數(shù)據(jù)庫操作中,我們在做一些查詢的時候總希望能避免數(shù)據(jù)庫引擎做全表掃描,因為全表掃描時間長,而且其中大部分掃描對客戶端而言是沒有意義的。其實我們可以使用Limit關鍵字來避免全表掃描的情況,從而提高效率。\x0d\x0a有個幾千萬條記錄的表 on MySQL 5.0.x,現(xiàn)在要讀出其中幾十萬萬條左右的記錄。常用方法,依次循環(huán): \x0d\x0aselect * from mytable where index_col = xxx limit offset, limit; \x0d\x0a\x0d\x0a經(jīng)驗:如果沒有blob/text字段,單行記錄比較小,可以把 limit 設大點,會加快速度。\x0d\x0a問題:頭幾萬條讀取很快,但是速度呈線性下降,同時 mysql server cpu 99% ,速度不可接受。 \x0d\x0a調(diào)用 explain select * from mytable where index_col = xxx limit offset, limit; \x0d\x0a顯示 type = ALL \x0d\x0a在 MySQL optimization 的文檔寫到"All"的解釋 \x0d\x0aA full table scan is done for each combination of rows from the previous tables. This is normally not good if the table is the first table not marked const, and usually very bad in all other cases. Normally, you can avoid ALL by adding indexes that allow row retrieval from the table based on constant values or column values from earlier tables. \x0d\x0a看樣子對于 all, mysql 就使用比較笨的方法,那就改用 range 方式? 因為 id 是遞增的,也很好修改 sql 。\x0d\x0aselect * from mytable where id offset and id SELECT * FROM table LIMIT 5,10; //檢索記錄行6-15\x0d\x0a\x0d\x0a//為了檢索從某一個偏移量到記錄集的結束所有的記錄行,可以指定第二個參數(shù)為-1\x0d\x0amysql SELECT * FROM table LIMIT 95,-1; //檢索記錄行96-last\x0d\x0a\x0d\x0a//如果只給定一個參數(shù),它表示返回最大的記錄行數(shù)目,換句話說,LIMIT n 等價于 LIMIT 0,n\x0d\x0amysql SELECT * FROM table LIMIT 5; //檢索前5個記錄行\(zhòng)x0d\x0a\x0d\x0aMySQL的limit給分頁帶來了極大的方便,但數(shù)據(jù)量一大的時候,limit的性能就急劇下降。同樣是取10條數(shù)據(jù),下面兩句就不是一個數(shù)量級別的。\x0d\x0aselect * from table limit 10000,10\x0d\x0aselect * from table limit 0,10\x0d\x0a\x0d\x0a文中不是直接使用limit,而是首先獲取到offset的id然后直接使用limit size來獲取數(shù)據(jù)。根據(jù)他的數(shù)據(jù),明顯要好于直接使用limit。\x0d\x0a這里我具體使用數(shù)據(jù)分兩種情況進行測試。\x0d\x0a1、offset比較小的時候:\x0d\x0aselect * from table limit 10,10 \x0d\x0a//多次運行,時間保持在0.0004-0.0005之間\x0d\x0aSelect * From table Where vid >=(Select vid From table Order By vid limit 10,1) limit 10 \x0d\x0a//多次運行,時間保持在0.0005-0.0006之間,主要是0.0006\x0d\x0a\x0d\x0a結論:偏移offset較小的時候,直接使用limit較優(yōu)。這個顯然是子查詢的原因。\x0d\x0a2、offset大的時候:\x0d\x0aselect * from table limit 10000,10 \x0d\x0a//多次運行,時間保持在0.0187左右\x0d\x0a\x0d\x0aSelect * From table Where vid >=(Select vid From table Order By vid limit 10000,1) limit 10\x0d\x0a//多次運行,時間保持在0.0061左右,只有前者的1/3??梢灶A計offset越大,后者越優(yōu)。
發(fā)展壯大離不開廣大客戶長期以來的信賴與支持,我們將始終秉承“誠信為本、服務至上”的服務理念,堅持“二合一”的優(yōu)良服務模式,真誠服務每家企業(yè),認真做好每個細節(jié),不斷完善自我,成就企業(yè),實現(xiàn)共贏。行業(yè)涉及成都效果圖設計等,在重慶網(wǎng)站建設、全網(wǎng)整合營銷推廣、WAP手機網(wǎng)站、VI設計、軟件開發(fā)等項目上具有豐富的設計經(jīng)驗。
數(shù)據(jù)庫優(yōu)化一方面是找出系統(tǒng)的瓶頸,提高MySQL數(shù)據(jù)庫的整體性能,而另一方面需要合理的結構設計和參數(shù)調(diào)整,以提高用戶的相應速度,同時還要盡可能的節(jié)約系統(tǒng)資源,以便讓系統(tǒng)提供更大的負荷.
1. 優(yōu)化一覽圖
2. 優(yōu)化
筆者將優(yōu)化分為了兩大類,軟優(yōu)化和硬優(yōu)化,軟優(yōu)化一般是操作數(shù)據(jù)庫即可,而硬優(yōu)化則是操作服務器硬件及參數(shù)設置.
2.1 軟優(yōu)化
2.1.1 查詢語句優(yōu)化
1.首先我們可以用EXPLAIN或DESCRIBE(簡寫:DESC)命令分析一條查詢語句的執(zhí)行信息.
2.例:
顯示:
其中會顯示索引和查詢數(shù)據(jù)讀取數(shù)據(jù)條數(shù)等信息.
2.1.2 優(yōu)化子查詢
在MySQL中,盡量使用JOIN來代替子查詢.因為子查詢需要嵌套查詢,嵌套查詢時會建立一張臨時表,臨時表的建立和刪除都會有較大的系統(tǒng)開銷,而連接查詢不會創(chuàng)建臨時表,因此效率比嵌套子查詢高.
2.1.3 使用索引
索引是提高數(shù)據(jù)庫查詢速度最重要的方法之一,關于索引可以參高筆者MySQL數(shù)據(jù)庫索引一文,介紹比較詳細,此處記錄使用索引的三大注意事項:
2.1.4 分解表
對于字段較多的表,如果某些字段使用頻率較低,此時應當,將其分離出來從而形成新的表,
2.1.5 中間表
對于將大量連接查詢的表可以創(chuàng)建中間表,從而減少在查詢時造成的連接耗時.
2.1.6 增加冗余字段
類似于創(chuàng)建中間表,增加冗余也是為了減少連接查詢.
2.1.7 分析表,,檢查表,優(yōu)化表
分析表主要是分析表中關鍵字的分布,檢查表主要是檢查表中是否存在錯誤,優(yōu)化表主要是消除刪除或更新造成的表空間浪費.
1. 分析表: 使用 ANALYZE 關鍵字,如ANALYZE TABLE user;
2. 檢查表: 使用 CHECK關鍵字,如CHECK TABLE user [option]
option 只對MyISAM有效,共五個參數(shù)值:
3. 優(yōu)化表:使用OPTIMIZE關鍵字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;
LOCAL|NO_WRITE_TO_BINLOG都是表示不寫入日志.,優(yōu)化表只對VARCHAR,BLOB和TEXT有效,通過OPTIMIZE TABLE語句可以消除文件碎片,在執(zhí)行過程中會加上只讀鎖.
2.2 硬優(yōu)化
2.2.1 硬件三件套
1.配置多核心和頻率高的cpu,多核心可以執(zhí)行多個線程.
2.配置大內(nèi)存,提高內(nèi)存,即可提高緩存區(qū)容量,因此能減少磁盤I/O時間,從而提高響應速度.
3.配置高速磁盤或合理分布磁盤:高速磁盤提高I/O,分布磁盤能提高并行操作的能力.
2.2.2 優(yōu)化數(shù)據(jù)庫參數(shù)
優(yōu)化數(shù)據(jù)庫參數(shù)可以提高資源利用率,從而提高MySQL服務器性能.MySQL服務的配置參數(shù)都在my.cnf或my.ini,下面列出性能影響較大的幾個參數(shù).
2.2.3 分庫分表
因為數(shù)據(jù)庫壓力過大,首先一個問題就是高峰期系統(tǒng)性能可能會降低,因為數(shù)據(jù)庫負載過高對性能會有影響。另外一個,壓力過大把你的數(shù)據(jù)庫給搞掛了怎么辦?所以此時你必須得對系統(tǒng)做分庫分表 + 讀寫分離,也就是把一個庫拆分為多個庫,部署在多個數(shù)據(jù)庫服務上,這時作為主庫承載寫入請求。然后每個主庫都掛載至少一個從庫,由從庫來承載讀請求。
2.2.4 緩存集群
如果用戶量越來越大,此時你可以不停的加機器,比如說系統(tǒng)層面不停加機器,就可以承載更高的并發(fā)請求。然后數(shù)據(jù)庫層面如果寫入并發(fā)越來越高,就擴容加數(shù)據(jù)庫服務器,通過分庫分表是可以支持擴容機器的,如果數(shù)據(jù)庫層面的讀并發(fā)越來越高,就擴容加更多的從庫。但是這里有一個很大的問題:數(shù)據(jù)庫其實本身不是用來承載高并發(fā)請求的,所以通常來說,數(shù)據(jù)庫單機每秒承載的并發(fā)就在幾千的數(shù)量級,而且數(shù)據(jù)庫使用的機器都是比較高配置,比較昂貴的機器,成本很高。如果你就是簡單的不停的加機器,其實是不對的。所以在高并發(fā)架構里通常都有緩存這個環(huán)節(jié),緩存系統(tǒng)的設計就是為了承載高并發(fā)而生。所以單機承載的并發(fā)量都在每秒幾萬,甚至每秒數(shù)十萬,對高并發(fā)的承載能力比數(shù)據(jù)庫系統(tǒng)要高出一到兩個數(shù)量級。所以你完全可以根據(jù)系統(tǒng)的業(yè)務特性,對那種寫少讀多的請求,引入緩存集群。具體來說,就是在寫數(shù)據(jù)庫的時候同時寫一份數(shù)據(jù)到緩存集群里,然后用緩存集群來承載大部分的讀請求。這樣的話,通過緩存集群,就可以用更少的機器資源承載更高的并發(fā)。
一個完整而復雜的高并發(fā)系統(tǒng)架構中,一定會包含:各種復雜的自研基礎架構系統(tǒng)。各種精妙的架構設計.因此一篇小文頂多具有拋磚引玉的效果,但是數(shù)據(jù)庫優(yōu)化的思想差不多就這些了.
我們都知道,服務器數(shù)據(jù)庫的開發(fā)一般都是通過java或者是PHP語言來編程實現(xiàn)的,而為了提高我們數(shù)據(jù)庫的運行速度和效率,數(shù)據(jù)庫優(yōu)化也成為了我們每日的工作重點,今天,昌平IT培訓就一起來了解一下mysql服務器數(shù)據(jù)庫的優(yōu)化方法。
為什么要了解索引真實案例案例一:大學有段時間學習爬蟲,爬取了知乎300w用戶答題數(shù)據(jù),存儲到mysql數(shù)據(jù)中。
那時不了解索引,一條簡單的“根據(jù)用戶名搜索全部回答的sql“需要執(zhí)行半分鐘左右,完全滿足不了正常的使用。
案例二:近線上應用的數(shù)據(jù)庫頻頻出現(xiàn)多條慢sql風險提示,而工作以來,對數(shù)據(jù)庫優(yōu)化方面所知甚少。
例如一個用戶數(shù)據(jù)頁面需要執(zhí)行很多次數(shù)據(jù)庫查詢,性能很慢,通過增加超時時間勉強可以訪問,但是性能上需要優(yōu)化。
索引的優(yōu)點合適的索引,可以大大減小mysql服務器掃描的數(shù)據(jù)量,避免內(nèi)存排序和臨時表,提高應用程序的查詢性能。
索引的類型mysql數(shù)據(jù)中有多種索引類型,primarykey,unique,normal,但底層存儲的數(shù)據(jù)結構都是BTREE;有些存儲引擎還提供hash索引,全文索引。
BTREE是常見的優(yōu)化要面對的索引結構,都是基于BTREE的討論。
B-TREE查詢數(shù)據(jù)簡單暴力的方式是遍歷所有記錄;如果數(shù)據(jù)不重復,就可以通過組織成一顆排序二叉樹,通過二分查找算法來查詢,大大提高查詢性能。
而BTREE是一種更強大的排序樹,支持多個分支,高度更低,數(shù)據(jù)的插入、刪除、更新更快。
現(xiàn)代數(shù)據(jù)庫的索引文件和文件系統(tǒng)的文件塊都被組織成BTREE。
btree的每個節(jié)點都包含有key,data和只想子節(jié)點指針。
btree有度的概念d=1。
假設btree的度為d,則每個內(nèi)部節(jié)點可以有n=[d+1,2d+1)個key,n+1個子節(jié)點指針。
樹的大高度為h=Logb[(N+1)/2]。
索引和文件系統(tǒng)中,B-TREE的節(jié)點常設計成接近一個內(nèi)存頁大小(也是磁盤扇區(qū)大小),且樹的度非常大。
這樣磁盤I/O的次數(shù),就等于樹的高度h。
假設b=100,一百萬個節(jié)點的樹,h將只有3層。
即,只有3次磁盤I/O就可以查找完畢,性能非常高。
索引查詢建立索引后,合適的查詢語句才能大發(fā)揮索引的優(yōu)勢。
另外,由于查詢優(yōu)化器可以解析客戶端的sql語句,會調(diào)整sql的查詢語句的條件順序去匹配合適的索引。
優(yōu)化“mysql數(shù)據(jù)庫”來提高“mysql性能”的方法有:
1、選取最適用的字段屬性。
MySQL可以很好的支持大數(shù)據(jù)量的存取,但是一般說來,數(shù)據(jù)庫中的表越小,在它上面執(zhí)行的查詢也就會越快。因此,在創(chuàng)建表的時候,為了獲得更好的性能,我們可以將表中字段的寬度設得盡可能小。
2、使用連接(JOIN)來代替子查詢(Sub-Queries)。
MySQL從4.1開始支持SQL的子查詢。這個技術可以使用SELECT語句來創(chuàng)建一個單列的查詢結果,然后把這個結果作為過濾條件用在另一個查詢中。
3、使用聯(lián)合(UNION)來代替手動創(chuàng)建的臨時表。 ?
MySQL 從4.0的版本開始支持UNION查詢,它可以把需要使用臨時表的兩條或更多的SELECT查詢合并的一個查詢中。在客戶端的查詢會話結束的時候,臨時表會被自動刪除,從而保證數(shù)據(jù)庫整齊、高效。
4、事務。
要把某個數(shù)據(jù)同時插入兩個相關聯(lián)的表中,可能會出現(xiàn)這樣的情況:第一個表中成功更新后,數(shù)據(jù)庫突然出現(xiàn)意外狀況,造成第二個表中的操作沒有完成,這樣,就會造成數(shù)據(jù)的不完整,甚至會破壞數(shù)據(jù)庫中的數(shù)據(jù)。要避免這種情況,就應該使用事務,它的作用是:要么語句塊中每條語句都操作成功,要么都失敗。
5、鎖定表。
盡管事務是維護數(shù)據(jù)庫完整性的一個非常好的方法,但卻因為它的獨占性,有時會影響數(shù)據(jù)庫的性能,尤其是在很大的應用系統(tǒng)中。由于在事務執(zhí)行的過程中,數(shù)據(jù)庫將會被鎖定,因此其它的用戶請求只能暫時等待直到該事務結束。
6、使用外鍵。
鎖定表的方法可以維護數(shù)據(jù)的完整性,但是它卻不能保證數(shù)據(jù)的關聯(lián)性。這個時候我們就可以使用外鍵。
7、使用索引?
索引是提高數(shù)據(jù)庫性能的常用方法,它可以令數(shù)據(jù)庫服務器以比沒有索引快得多的速度檢索特定的行,尤其是在查詢語句當中包含有MAX(), MIN()和ORDERBY這些命令的時候,性能提高更為明顯。
8、優(yōu)化的查詢語句?
絕大多數(shù)情況下,使用索引可以提高查詢的速度,但如果SQL語句使用不恰當?shù)脑挘饕龑o法發(fā)揮它應有的作用。