前幾天參加了一個公司的面試,到了后面面試官出了一個SQL相關(guān)的題目:
創(chuàng)新互聯(lián)專注為客戶提供全方位的互聯(lián)網(wǎng)綜合服務(wù),包含不限于網(wǎng)站制作、成都網(wǎng)站設(shè)計、行唐網(wǎng)絡(luò)推廣、小程序制作、行唐網(wǎng)絡(luò)營銷、行唐企業(yè)策劃、行唐品牌公關(guān)、搜索引擎seo、人物專訪、企業(yè)宣傳片、企業(yè)代運營等,從售前售中售后,我們都將竭誠為您服務(wù),您的肯定,是我們最大的嘉獎;創(chuàng)新互聯(lián)為所有大學(xué)生創(chuàng)業(yè)者提供行唐建站搭建服務(wù),24小時服務(wù)熱線:028-86922220,官方網(wǎng)址:www.cdcxhl.com
數(shù)據(jù)的形式類似于以下這樣(表名為views):
當(dāng)時為了穩(wěn)妥起見,我的第一反應(yīng)是使用窗口函數(shù),
然后面試官問:“還有沒有什么簡便的方法么?”
很明顯他的意思是要用傳統(tǒng)的groupby來完成這個查詢,確實我之前的查詢又是用窗口函數(shù)又是加了distinct確實是復(fù)雜一些。
于是我用group by再寫了一遍。
看完我的查詢之后,面試官又問了一句:“可以不需要使用嵌套查詢嗎?”
當(dāng)時我的回答是”應(yīng)該不行,如果不使用嵌套而直接在group by后面加having的話sql會報錯,就和where如果使用別名查詢就會報錯一樣“
后面面試完想了一下,發(fā)現(xiàn)自己當(dāng)時回答得不好,不是正確的但也不完全錯,不是正確的原因是按照sql的規(guī)則having后面是可以拿聚合函數(shù)做判斷的,但是不完全錯的原因是如果having用的是像我之前設(shè)置的別名來判斷的話,確實是會出錯的。(雖然mysql在5.6之后基于sql的規(guī)則對group by進行拓展,支持這種寫法。但在其它sql上面用別名having還是不行的)
我們可以從SQL運行時各部分的執(zhí)行順序來進行分析,當(dāng)我們選擇執(zhí)行一個SQL語句的時候,它會按照以下的順序來進行操作,
這個執(zhí)行順序的設(shè)計是很巧妙的,我說一下我自己對于上述順序的理解,
1. FROM
顧名思義,當(dāng)執(zhí)行查詢語句的時候,首先需要知道的是它需要哪些表,正如我們?nèi)ヒ粋€地方需要知道它的具體位置一樣。如果需要多個表的話在這一部分也需要按照一定的順序進行表的join操作。
2. WHERE
當(dāng)確定我們需要讀取哪一張表(或者多張表)的數(shù)據(jù)之后,我們就需要進行where的filter操作,根據(jù)filter盡量減少讀取的數(shù)據(jù)數(shù)量。
那么問題來了,為什么where的優(yōu)先級要比group by,having, select之類的要高呢?
第一個原因是可以減少不必要的查詢量,加快執(zhí)行語句的速度,類似于Apache Spark在對查詢語句進行邏輯優(yōu)化時需要用到的謂詞下推類似的道理。舉個栗子,比如我們可能需要userid從100到300的用戶對于某一個頁面的瀏覽次數(shù),那么如果先執(zhí)行g(shù)roup by再執(zhí)行where的話,userid小于100的用戶的數(shù)據(jù)也會被匯總進去,但實際上這些部分的數(shù)據(jù)是完全不需要的,計算它們完全是浪費系統(tǒng)資源(而且group by操作本身就是很耗資源的操作)
3. GROUP BY
在完成where操作的過濾之后,如果語句中有g(shù)roup by的話則會對過濾后的數(shù)據(jù)進行聚合操作,聚合操作是多對一的轉(zhuǎn)換,因此在聚合操作過后,除了用于group by的字段之外,其它字段的原始數(shù)據(jù)將會丟失,只能得到它們相應(yīng)的聚合結(jié)果(比如sum(), avg()這樣)
在完成聚合操作之后,參與group by的字段以及其它字段對應(yīng)的聚合值已經(jīng)處于已知狀態(tài),后續(xù)的操作可以直接使用它們。
4. HAVING
HAVING操作主要做的是對group by之后的分組結(jié)果進行過濾,可以根據(jù)參與group by的字段進行過濾,也可以根據(jù)其它字段的聚合值進行過濾。(因為聚合值在這里已經(jīng)算是已知數(shù)據(jù))因此這里是可以拿聚合函數(shù)做判斷的,比如最開始的那個查詢的例子,可以直接寫成以下的形式,
HAVING并不是一定要和group by成對出現(xiàn)的,它也可以單獨存在,在沒有g(shù)roup by的時候,此時默認(rèn)只有一個組,但是需要注意的是這時having里面參與過濾的字段需要在select里面存在,不然having會不知道這是分組里面的內(nèi)容而導(dǎo)致報錯。
5. SELECT
選取結(jié)果集中相對應(yīng)的字段,在select中為字段設(shè)置的別名在此階段及之后的操作中生效。
6. DISTINCT
去重操作,放在select之后有個原因是去重操作是要根據(jù)select里面所選字段來進行的。
7. ORDER BY
對得到的結(jié)果按照特定字段順序進行排列,這里可以使用別名
8. LIMIT
設(shè)置顯示結(jié)果集中的幾條數(shù)據(jù)
通過分析MySQL中各部分的執(zhí)行順序,我們就不難理解為什么where不能有別名,而having可以用聚合函數(shù)來判斷的原因,而且借此機會重新溫習(xí)一遍SQL各部分對應(yīng)的功能,加深理解,可以說是一舉兩得。
存儲過程:
create procedure p()
begin
/*thi procedure does nothing*/
end;
1.參數(shù)
Parameters 參數(shù)
讓我們更進一步的研究怎么在存儲過程中定義參數(shù)1. CREATE PROCEDURE p5
() ...
2. CREATE PROCEDURE p5
([IN] name data-type) ...
3. CREATE PROCEDURE p5
(OUT name data-type) ...
4. CREATE PROCEDURE p5
(INOUT name data-type) ...
2.Conditions and if-then-else 條件式和 if-then-else
3.Loops 循環(huán)語句
WHILE ... END WHILE
LOOP ... END LOOP
REPEAT ... END REPEAT
GOTO
4.DECLARE HANDLER syntax 聲明異常處理的語法
DECLARE
{ EXIT | CONTINUE }
HANDLER FOR
{ error-number | { SQLSTATE error-string } | condition }
SQL statement
5.Cursors 游標(biāo)
游標(biāo)實現(xiàn)功能摘要:
DECLARE cursor-name CURSOR FOR SELECT ...;
OPEN cursor-name;
FETCH cursor-name INTO variable [, variable];
CLOSE cursor-name;
已現(xiàn)經(jīng)在可我以們完開成始基著本眼的游事標(biāo)了務(wù)如。聲雖明然游我標(biāo)們,的打存開儲游過標(biāo)程,中從的游游標(biāo)標(biāo)里語法讀取還,并關(guān)沒閉有完游整標(biāo)。
6.Functions 函數(shù)
Summary:
摘要 CREATE FUNCTION
Limitations of functions
函數(shù)的限制
我們已經(jīng)很清楚可以在存儲過程中使用的元素了。下面我要講的是前面沒有提到的函數(shù)。
工具/材料:NavicatForMysql。
1、首先在桌面上,點擊“NavicatForMysql”圖標(biāo)。
2、然后在該界面中,點擊“新建查詢”按鈕。
3、之后在該界面中,輸入多條SQL語句。
4、接著在該界面中,點擊上方“執(zhí)行”按鈕。
5、最后在該界面中,顯示多條SQL語句執(zhí)行成功。