假設員工信工資在一個表里,命名為表A (NAME ,GONGZI)
網(wǎng)站建設哪家好,找成都創(chuàng)新互聯(lián)公司!專注于網(wǎng)頁設計、網(wǎng)站建設、微信開發(fā)、微信小程序、集團企業(yè)網(wǎng)站建設等服務項目。為回饋新老客戶創(chuàng)新互聯(lián)還提供了十堰鄖陽免費建站歡迎大家使用!
UPDATE A SET A.GONGZI=A.GONGZI+1000 WHERE NAME ='張三';commit;
什么是數(shù)據(jù)庫事務,MySQL 為什么會使用 InnoDB 作為默認選項?
1.原子性(一個原子事務中的所有操作要么全部成功,要么全部失?。?實現(xiàn)主要基于undo log(回滾日志)
2.一致性(數(shù)據(jù)庫總是從一個一致性的狀態(tài)轉(zhuǎn)換到另一個一致性的狀態(tài))
3. 隔離性(針對并發(fā)事務而言,事務必須在不干擾其他進程或事務的前提下獨立執(zhí)行)
4.持久性(一旦事務提交成功,它對于數(shù)據(jù)的修改就會永久保存到數(shù)據(jù)庫中)
也就是我們常說的事務ACID,這樣才能保證事務中數(shù)據(jù)的正確性。
InnoDB支持事務安全,InnoDB支持表、行(默認)級鎖,而MyISAM支持表級鎖;
篇幅所限本文只寫了MySQL25題,像其他的Redis,SSM框架,算法,計網(wǎng)等技術棧的面試題后面會持續(xù)更新,個人整理的1000余道面試八股文會放在文末給大家白嫖,最近有面試需要刷題的同學可以直接翻到文末領取。
如果表使用自增主鍵,那么每次插入新的記錄,記錄就會順序添加到當前索引節(jié)點的后續(xù)位置,當一頁寫滿,就會自動開辟一個新的頁。如果使用非自增主鍵(如果身份證號或?qū)W號等),由于每次插入主鍵的值近似于隨機,因此每次新紀錄都要被插到現(xiàn)有索引頁得中間某個位置, 頻繁的移動、分頁操作造成了大量的碎片,得到了不夠緊湊的索引結(jié)構,后續(xù)不得不通過OPTIMIZE TABLE(optimize table)來重建表并優(yōu)化填充頁面。
Server層按順序執(zhí)行sql的步驟為:
簡單概括:
可以分為服務層和存儲引擎層兩部分,其中:
服務層包括連接器、查詢緩存、分析器、優(yōu)化器、執(zhí)行器等 ,涵蓋MySQL的大多數(shù)核心服務功能,以及所有的內(nèi)置函數(shù)(如日期、時間、數(shù)學和加密函數(shù)等),所有跨存儲引擎的功能都在這一層實現(xiàn),比如存儲過程、觸發(fā)器、視圖等。
存儲引擎層負責數(shù)據(jù)的存儲和提取 。其架構模式是插件式的,支持InnoDB、MyISAM、Memory等多個存儲引擎。現(xiàn)在最常用的存儲引擎是InnoDB,它從MySQL 5.5.5版本開始成為了默認的存儲引擎。
Drop、Delete、Truncate都表示刪除,但是三者有一些差別:
Delete 用來刪除表的全部或者一部分數(shù)據(jù)行,執(zhí)行Delete之后,用戶需要提交(commmit)或者回滾(rollback)來執(zhí)行刪除或者撤銷刪除,會觸發(fā)這個表上所有的delete觸發(fā)器。
Truncate 刪除表中的所有數(shù)據(jù),這個操作不能回滾,也不會觸發(fā)這個表上的觸發(fā)器,TRUNCATE比Delete更快,占用的空間更小。
Drop 命令從數(shù)據(jù)庫中刪除表,所有的數(shù)據(jù)行,索引和權限也會被刪除,所有的DML觸發(fā)器也不會被觸發(fā),這個命令也不能回滾。
因此,在不再需要一張表的時候,用Drop;在想刪除部分數(shù)據(jù)行時候,用Delete;在保留表而刪除所有數(shù)據(jù)的時候用Truncate。
隔離級別臟讀不可重復讀幻影讀 READ-UNCOMMITTED 未提交讀 READ-COMMITTED 提交讀 REPEATABLE-READ 重復讀 SERIALIZABLE 可串行化讀
MySQL InnoDB 存儲引擎的默認支持的隔離級別是 REPEATABLE-READ (可重讀)
這里需要注意的是 :與 SQL 標準不同的地方在于InnoDB 存儲引擎在 REPEATABLE-READ(可重讀)事務隔離級別 下使用的是 Next-Key Lock 鎖 算法,因此可以避免幻讀的產(chǎn)生,這與其他數(shù)據(jù)庫系統(tǒng)(如 SQL Server)是不同的。所以 說InnoDB 存儲引擎的默認支持的隔離級別是 REPEATABLE-READ(可重讀) 已經(jīng)可以完全保證事務的隔離性要 求,即達到了 SQL標準的SERIALIZABLE(可串行化)隔離級別。
因為隔離級別越低,事務請求的鎖越少,所以大部分數(shù)據(jù)庫系統(tǒng)的隔離級別都是READ-COMMITTED(讀取提交內(nèi) 容):,但是你要知道的是InnoDB 存儲引擎默認使用 REPEATABLE-READ(可重讀)并不會有任何性能損失 。
InnoDB 存儲引擎在分布式事務 的情況下一般會用到SERIALIZABLE(可串行化)隔離級別。
主要原因:B+樹只要遍歷葉子節(jié)點就可以實現(xiàn)整棵樹的遍歷,而且在數(shù)據(jù)庫中基于范圍的查詢是非常頻繁的,而B樹只能中序遍歷所有節(jié)點,效率太低。
文件與數(shù)據(jù)庫都是需要較大的存儲,也就是說,它們都不可能全部存儲在內(nèi)存中,故需要存儲到磁盤上。而所謂索引,則為了數(shù)據(jù)的快速定位與查找,那么索引的結(jié)構組織要盡量減少查找過程中磁盤I/O的存取次數(shù),因此B+樹相比B樹更為合適。數(shù)據(jù)庫系統(tǒng)巧妙利用了局部性原理與磁盤預讀原理,將一個節(jié)點的大小設為等于一個頁,這樣每個節(jié)點只需要一次I/O就可以完全載入,而紅黑樹這種結(jié)構,高度明顯要深的多,并且由于邏輯上很近的節(jié)點(父子)物理上可能很遠,無法利用局部性。
最重要的是,B+樹還有一個最大的好處:方便掃庫。
B樹必須用中序遍歷的方法按序掃庫,而B+樹直接從葉子結(jié)點挨個掃一遍就完了,B+樹支持range-query非常方便,而B樹不支持,這是數(shù)據(jù)庫選用B+樹的最主要原因。
B+樹查找效率更加穩(wěn)定,B樹有可能在中間節(jié)點找到數(shù)據(jù),穩(wěn)定性不夠。
B+tree的磁盤讀寫代價更低:B+tree的內(nèi)部結(jié)點并沒有指向關鍵字具體信息的指針(紅色部分),因此其內(nèi)部結(jié)點相對B 樹更小。如果把所有同一內(nèi)部結(jié)點的關鍵字存放在同一塊盤中,那么盤塊所能容納的關鍵字數(shù)量也越多。一次性讀入內(nèi)存中的需要查找的關鍵字也就越多,相對來說IO讀寫次數(shù)也就降低了;
B+tree的查詢效率更加穩(wěn)定:由于內(nèi)部結(jié)點并不是最終指向文件內(nèi)容的結(jié)點,而只是葉子結(jié)點中關鍵字的索引,所以,任何關鍵字的查找必須走一條從根結(jié)點到葉子結(jié)點的路。所有關鍵字查詢的路徑長度相同,導致每一個數(shù)據(jù)的查詢效率相當;
視圖是一種虛擬的表,通常是有一個表或者多個表的行或列的子集,具有和物理表相同的功能 游標是對查詢出來的結(jié)果集作為一個單元來有效的處理。一般不使用游標,但是需要逐條處理數(shù)據(jù)的時候,游標顯得十分重要。
而在 MySQL 中,恢復機制是通過回滾日志(undo log)實現(xiàn)的,所有事務進行的修改都會先記錄到這個回滾日志中,然后在對數(shù)據(jù)庫中的對應行進行寫入。當事務已經(jīng)被提交之后,就無法再次回滾了。
回滾日志作用:1)能夠在發(fā)生錯誤或者用戶執(zhí)行 ROLLBACK 時提供回滾相關的信息 2) 在整個系統(tǒng)發(fā)生崩潰、數(shù)據(jù)庫進程直接被殺死后,當用戶再次啟動數(shù)據(jù)庫進程時,還能夠立刻通過查詢回滾日志將之前未完成的事務進行回滾,這也就需要回滾日志必須先于數(shù)據(jù)持久化到磁盤上,是我們需要先寫日志后寫數(shù)據(jù)庫的主要原因。
InnoDB
MyISAM
總結(jié)
數(shù)據(jù)庫并發(fā)會帶來臟讀、幻讀、丟棄更改、不可重復讀這四個常見問題,其中:
臟讀 :在第一個修改事務和讀取事務進行的時候,讀取事務讀到的數(shù)據(jù)為100,這是修改之后的數(shù)據(jù),但是之后該事務滿足一致性等特性而做了回滾操作,那么讀取事務得到的結(jié)果就是臟數(shù)據(jù)了。
幻讀 :一般是T1在某個范圍內(nèi)進行修改操作(增加或者刪除),而T2讀取該范圍導致讀到的數(shù)據(jù)是修改之間的了,強調(diào)范圍。
丟棄修改 :兩個寫事務T1 T2同時對A=0進行遞增操作,結(jié)果T2覆蓋T1,導致最終結(jié)果是1 而不是2,事務被覆蓋
不可重復讀 :T2 讀取一個數(shù)據(jù),然后T1 對該數(shù)據(jù)做了修改。如果 T2 再次讀取這個數(shù)據(jù),此時讀取的結(jié)果和第一次讀取的結(jié)果不同。
第一個事務首先讀取var變量為50,接著準備更新為100的時,并未提交,第二個事務已經(jīng)讀取var為100,此時第一個事務做了回滾。最終第二個事務讀取的var和數(shù)據(jù)庫的var不一樣。
T1 讀取某個范圍的數(shù)據(jù),T2 在這個范圍內(nèi)插入新的數(shù)據(jù),T1 再次讀取這個范圍的數(shù)據(jù),此時讀取的結(jié)果和和第一次讀取的結(jié)果不同。
T1 和 T2 兩個事務都對一個數(shù)據(jù)進行修改,T1 先修改,T2 隨后修改,T2 的修改覆蓋了 T1 的修改。例如:事務1讀取某表中的數(shù)據(jù)A=50,事務2也讀取A=50,事務1修改A=A+50,事務2也修改A=A+50,最終結(jié)果A=100,事務1的修改被丟失。
T2 讀取一個數(shù)據(jù),T1 對該數(shù)據(jù)做了修改。如果 T2 再次讀取這個數(shù)據(jù),此時讀取的結(jié)果和第一次讀取的結(jié)果不同。
悲觀鎖,先獲取鎖,再進行業(yè)務操作,一般就是利用類似 SELECT … FOR UPDATE 這樣的語句,對數(shù)據(jù)加鎖,避免其他事務意外修改數(shù)據(jù)。當數(shù)據(jù)庫執(zhí)行SELECT … FOR UPDATE時會獲取被select中的數(shù)據(jù)行的行鎖,select for update獲取的行鎖會在當前事務結(jié)束時自動釋放,因此必須在事務中使用。
樂觀鎖,先進行業(yè)務操作,只在最后實際更新數(shù)據(jù)時進行檢查數(shù)據(jù)是否被更新過。Java 并發(fā)包中的 AtomicFieldUpdater 類似,也是利用 CAS 機制,并不會對數(shù)據(jù)加鎖,而是通過對比數(shù)據(jù)的時間戳或者版本號,來實現(xiàn)樂觀鎖需要的版本判斷。
分庫與分表的目的在于,減小數(shù)據(jù)庫的單庫單表負擔,提高查詢性能,縮短查詢時間。
通過分表 ,可以減少數(shù)據(jù)庫的單表負擔,將壓力分散到不同的表上,同時因為不同的表上的數(shù)據(jù)量少了,起到提高查詢性能,縮短查詢時間的作用,此外,可以很大的緩解表鎖的問題。分表策略可以歸納為垂直拆分和水平拆分:
水平分表 :取模分表就屬于隨機分表,而時間維度分表則屬于連續(xù)分表。如何設計好垂直拆分,我的建議:將不常用的字段單獨拆分到另外一張擴展表. 將大文本的字段單獨拆分到另外一張擴展表, 將不經(jīng)常修改的字段放在同一張表中,將經(jīng)常改變的字段放在另一張表中。對于海量用戶場景,可以考慮取模分表,數(shù)據(jù)相對比較均勻,不容易出現(xiàn)熱點和并發(fā)訪問的瓶頸。
庫內(nèi)分表 ,僅僅是解決了單表數(shù)據(jù)過大的問題,但并沒有把單表的數(shù)據(jù)分散到不同的物理機上,因此并不能減輕 MySQL 服務器的壓力,仍然存在同一個物理機上的資源競爭和瓶頸,包括 CPU、內(nèi)存、磁盤 IO、網(wǎng)絡帶寬等。
分庫與分表帶來的分布式困境與應對之策 數(shù)據(jù)遷移與擴容問題----一般做法是通過程序先讀出數(shù)據(jù),然后按照指定的分表策略再將數(shù)據(jù)寫入到各個分表中。分頁與排序問題----需要在不同的分表中將數(shù)據(jù)進行排序并返回,并將不同分表返回的結(jié)果集進行匯總和再次排序,最后再返回給用戶。
不可重復讀的重點是修改,幻讀的重點在于新增或者刪除。
視圖是虛擬的表,與包含數(shù)據(jù)的表不一樣,視圖只包含使用時動態(tài)檢索數(shù)據(jù)的查詢;不包含任何列或數(shù)據(jù)。使用視圖可以簡化復雜的 sql 操作,隱藏具體的細節(jié),保護數(shù)據(jù);視圖創(chuàng)建后,可以使用與表相同的方式利用它們。
視圖不能被索引,也不能有關聯(lián)的觸發(fā)器或默認值,如果視圖本身內(nèi)有order by 則對視圖再次order by將被覆蓋。
創(chuàng)建視圖:create view xxx as xxxx
對于某些視圖比如未使用聯(lián)結(jié)子查詢分組聚集函數(shù)Distinct Union等,是可以對其更新的,對視圖的更新將對基表進行更新;但是視圖主要用于簡化檢索,保護數(shù)據(jù),并不用于更新,而且大部分視圖都不可以更新。
B+tree的磁盤讀寫代價更低,B+tree的查詢效率更加穩(wěn)定 數(shù)據(jù)庫索引采用B+樹而不是B樹的主要原因:B+樹只要遍歷葉子節(jié)點就可以實現(xiàn)整棵樹的遍歷,而且在數(shù)據(jù)庫中基于范圍的查詢是非常頻繁的,而B樹只能中序遍歷所有節(jié)點,效率太低。
B+樹的特點
在最頻繁使用的、用以縮小查詢范圍的字段,需要排序的字段上建立索引。不宜:1)對于查詢中很少涉及的列或者重復值比較多的列 2)對于一些特殊的數(shù)據(jù)類型,不宜建立索引,比如文本字段(text)等。
如果一個索引包含(或者說覆蓋)所有需要查詢的字段的值,我們就稱 之為“覆蓋索引”。
我們知道在InnoDB存儲引 擎中,如果不是主鍵索引,葉子節(jié)點存儲的是主鍵+列值。最終還是要“回表”,也就是要通過主鍵再查找一次,這樣就 會比較慢。覆蓋索引就是把要查詢出的列和索引是對應的,不做回表操作!
舉例 :
學號姓名性別年齡系別專業(yè) 20020612李輝男20計算機軟件開發(fā) 20060613張明男18計算機軟件開發(fā) 20060614王小玉女19物理力學 20060615李淑華女17生物動物學 20060616趙靜男21化學食品化學 20060617趙靜女20生物植物學
主鍵為候選鍵的子集,候選鍵為超鍵的子集,而外鍵的確定是相對于主鍵的。