當業(yè)務(wù)上按照月份分表,但是前端h5需要分頁展示,小伙伴們不知有沒有遇到這個這個需求最后怎么完成的。
按需網(wǎng)站開發(fā)可以根據(jù)自己的需求進行定制,網(wǎng)站設(shè)計、成都網(wǎng)站制作構(gòu)思過程中功能建設(shè)理應(yīng)排到主要部位公司網(wǎng)站設(shè)計、成都網(wǎng)站制作的運用實際效果公司網(wǎng)站制作網(wǎng)站建立與制做的實際意義
我這里想了一個解決思路,可能還不完善,希望能拋轉(zhuǎn)引玉。
1、入?yún)ageNo 為頁號碼,如果為1那么就是第一頁。pageSize 可以是入?yún)⒁部啥ㄋ?,這里定死10條。Limit 是數(shù)據(jù)偏移標記,根據(jù)入?yún)ageNo 計算出來的,Limit=(pageNo-1)*pageSize。假設(shè)A表有41條數(shù)據(jù)符合,B表有51條數(shù)據(jù)符合,如下圖。
有幾種種情況? ?1.如果limitA表41條 那么需要從A表中取數(shù)據(jù),(1)如果Limit+pageSizeCount直接獲取數(shù)據(jù)即可(2)如果Limit+pageSizeCount,那么需要從A 表取部分數(shù)據(jù)從B表取一部分數(shù)據(jù)。
1.如果limitA表41條? 那么需要從B表取數(shù)據(jù),如果B數(shù)據(jù)依然不足,那么重復(fù)以上的步驟。如下圖
很多應(yīng)用往往只展示最新或最熱門的幾條記錄,但為了舊記錄仍然可訪問,所以就需要個分頁的導(dǎo)航欄。然而,如何通過MySQL更好的實現(xiàn)分頁,始終是比較令人頭疼的問題。雖然沒有拿來就能用的解決辦法,但了解數(shù)據(jù)庫的底層或多或少有助于優(yōu)化分頁查詢。
我們先從一個常用但性能很差的查詢來看一看。
SELECT *
FROM city
ORDER BY id DESC
LIMIT 0, 15
這個查詢耗時0.00sec。So,這個查詢有什么問題呢?實際上,這個查詢語句和參數(shù)都沒有問題,因為它用到了下面表的主鍵,而且只讀取15條記錄。
CREATE TABLE city (
id int(10) unsigned NOT NULL AUTO_INCREMENT,
city varchar(128) NOT NULL,
PRIMARY KEY (id)
) ENGINE=InnoDB;
真正的問題在于offset(分頁偏移量)很大的時候,像下面這樣:
SELECT *
FROM city
ORDER BY id DESC
LIMIT 100000, 15;
上面的查詢在有2M行記錄時需要0.22sec,通過EXPLAIN查看SQL的執(zhí)行計劃可以發(fā)現(xiàn)該SQL檢索了100015行,但最后只需要15行。大的分頁偏移量會增加使用的數(shù)據(jù),MySQL會將大量最終不會使用的數(shù)據(jù)加載到內(nèi)存中。就算我們假設(shè)大部分網(wǎng)站的用戶只訪問前幾頁數(shù)據(jù),但少量的大的分頁偏移量的請求也會對整個系統(tǒng)造成危害。Facebook意識到了這一點,但Facebook并沒有為了每秒可以處理更多的請求而去優(yōu)化數(shù)據(jù)庫,而是將重心放在將請求響應(yīng)時間的方差變小。
對于分頁請求,還有一個信息也很重要,就是總共的記錄數(shù)。我們可以通過下面的查詢很容易的獲取總的記錄數(shù)。
SELECT COUNT(*)
FROM city;
然而,上面的SQL在采用InnoDB為存儲引擎時需要耗費9.28sec。一個不正確的優(yōu)化是采用 SQL_CALC_FOUND_ROWS,SQL_CALC_FOUND_ROWS 可以在能夠在分頁查詢時事先準備好符合條件的記錄數(shù),隨后只要執(zhí)行一句 select FOUND_ROWS(); 就能獲得總記錄數(shù)。但是在大多數(shù)情況下,查詢語句簡短并不意味著性能的提高。不幸的是,這種分頁查詢方式在許多主流框架中都有用到,下面看看這個語句的查詢性能。
SELECT SQL_CALC_FOUND_ROWS *
FROM city
ORDER BY id DESC
LIMIT 100000, 15;
這個語句耗時20.02sec,是上一個的兩倍。事實證明使用 SQL_CALC_FOUND_ROWS 做分頁是很糟糕的想法。
下面來看看到底如何優(yōu)化。文章分為兩部分,第一部分是如何獲取記錄的總數(shù)目,第二部分是獲取真正的記錄。
高效的計算行數(shù)
如果采用的引擎是MyISAM,可以直接執(zhí)行COUNT(*)去獲取行數(shù)即可。相似的,在堆表中也會將行數(shù)存儲到表的元信息中。但如果引擎是InnoDB情況就會復(fù)雜一些,因為InnoDB不保存表的具體行數(shù)。
我們可以將行數(shù)緩存起來,然后可以通過一個守護進程定期更新或者用戶的某些操作導(dǎo)致緩存失效時,執(zhí)行下面的語句:
SELECT COUNT(*)
FROM city
USE INDEX(PRIMARY);
獲取記錄
下面進入這篇文章最重要的部分,獲取分頁要展示的記錄。上面已經(jīng)說過了,大的偏移量會影響性能,所以我們要重寫查詢語句。為了演示,我們創(chuàng)建一個新的表“news”,按照時事性排序(最新發(fā)布的在最前面),實現(xiàn)一個高性能的分頁。為了簡單,我們就假設(shè)最新發(fā)布的新聞的Id也是最大的。
CREATE TABLE news(
id INT UNSIGNED PRIMARY KEY AUTO_INCREMENT,
title VARCHAR(128) NOT NULL
) ENGINE=InnoDB;
一個比較高效的方式是基于用戶展示的最后一個新聞Id。查詢下一頁的語句如下,需要傳入當前頁面展示的最后一個Id。
SELECT *
FROM news WHERE id $last_id
ORDER BY id DESC
LIMIT $perpage
查詢上一頁的語句類似,只不過需要傳入當前頁的第一個Id,并且要逆序。
SELECT *
FROM news WHERE id $last_id
ORDER BY id ASC
LIMIT $perpage
上面的查詢方式適合實現(xiàn)簡易的分頁,即不顯示具體的頁數(shù)導(dǎo)航,只顯示“上一頁”和“下一頁”,例如博客中頁腳顯示“上一頁”,“下一頁”的按鈕。但如果要實現(xiàn)真正的頁面導(dǎo)航還是很難的,下面看看另一種方式。
SELECT id
FROM (
SELECT id, ((@cnt:= @cnt + 1) + $perpage - 1) % $perpage cnt
FROM news
JOIN (SELECT @cnt:= 0)T
WHERE id $last_id
ORDER BY id DESC
LIMIT $perpage * $buttons
)C
WHERE cnt = 0;
通過上面的語句可以為每一個分頁的按鈕計算出一個offset對應(yīng)的id。這種方法還有一個好處。假設(shè),網(wǎng)站上正在發(fā)布一片新的文章,那么所有文章的位置都會往后移一位,所以如果用戶在發(fā)布文章時換頁,那么他會看見一篇文章兩次。如果固定了每個按鈕的offset Id,這個問題就迎刃而解了。Mark Callaghan發(fā)表過一篇類似的博客,利用了組合索引和兩個位置變量,但是基本思想是一致的。
如果表中的記錄很少被刪除、修改,還可以將記錄對應(yīng)的頁碼存儲到表中,并在該列上創(chuàng)建合適的索引。采用這種方式,當新增一個記錄的時候,需要執(zhí)行下面的查詢重新生成對應(yīng)的頁號。
SET p:= 0;
UPDATE news SET page=CEIL((p:= p + 1) / $perpage) ORDER BY id DESC;
當然,也可以新增一個專用于分頁的表,可以用個后臺程序來維護。
UPDATE pagination T
JOIN (
SELECT id, CEIL((p:= p + 1) / $perpage) page
FROM news
ORDER BY id
)C
ON C.id = T.id
SET T.page = C.page;
現(xiàn)在想獲取任意一頁的元素就很簡單了:
SELECT *
FROM news A
JOIN pagination B ON A.id=B.ID
WHERE page=$offset;
還有另外一種與上種方法比較相似的方法來做分頁,這種方式比較試用于數(shù)據(jù)集相對小,并且沒有可用的索引的情況下—比如處理搜索結(jié)果時。在一個普通的服務(wù)器上執(zhí)行下面的查詢,當有2M條記錄時,要耗費2sec左右。這種方式比較簡單,創(chuàng)建一個用來存儲所有Id的臨時表即可(這也是最耗費性能的地方)。
CREATE TEMPORARY TABLE _tmp (KEY SORT(random))
SELECT id, FLOOR(RAND() * 0x8000000) random
FROM city;
ALTER TABLE _tmp ADD OFFSET INT UNSIGNED PRIMARY KEY AUTO_INCREMENT, DROP INDEX SORT,ORDER BY random;
接下來就可以向下面一樣執(zhí)行分頁查詢了。
SELECT *
FROM _tmp
WHERE OFFSET = $offset
ORDER BY OFFSET
LIMIT $perpage;
簡單來說,對于分頁的優(yōu)化就是。。。避免數(shù)據(jù)量大時掃描過多的記錄。
1、UNION
2、若是innodb分表,則可以用merge處理。
直接搞一張專門針對統(tǒng)計數(shù)據(jù)用的匯總表
如果可能的話,不要采用分表的設(shè)計,采用表分區(qū),這樣就對于查詢就不需要特殊處理了。規(guī)劃好索引,性能應(yīng)該不會有問題。
select a.id,(case when b.quantity is NULL then 0 else b.quantity end) quantity
from
(SELECT a.id from tb_a a LIMIT 0,4) a
LEFT JOIN
(SELECT b.a_id,(count(b.a_id)) quantity from tb_b b
GROUP BY b.a_id) b
ON
a.id=b.a_id
分頁寫內(nèi)部應(yīng)該比在外面快
數(shù)據(jù)庫分庫分表是緩解數(shù)據(jù)庫服務(wù)器壓力和增加并發(fā)量的途徑之一,但是隨著分庫分表之后,也不可避免的帶來了一些問題,很顯而易見的問題就是如何解決分庫后的查詢統(tǒng)計。分庫之后沒有SQL可以用了,簡單的過濾后再合并還可以做,但分組都會很麻煩,必須把分庫分組匯總結(jié)集再分組匯總。這對很多java應(yīng)用程序員來講是個挑戰(zhàn)。但是,數(shù)據(jù)量太大大,不分庫也不行,進退兩難。
這時候,采用集算器來做后一步的匯總計算就很容易,比如剛才說的分組匯總問題,寫出來只要這么幾行:
?這里實現(xiàn)分組的代碼還考慮了讓分庫并行執(zhí)行SQL。
利用集算器實現(xiàn)分庫匯總里包含幾個典型例子來說明分庫匯總的用法,跨庫數(shù)據(jù)表的運算 是有關(guān)分庫后統(tǒng)計查詢的更詳細解釋,還有講解視頻分庫后的統(tǒng)計查詢梳理要點和難點。集算器還很容易嵌入到Java應(yīng)用程序中,Java 如何調(diào)用 SPL 腳本 有使用和獲得它的方法。關(guān)于集算器安裝使用、獲得免費授權(quán)和相關(guān)技術(shù)資料,可以參見 集算器如何使用 。