作者 | 安卓大叔
成都創(chuàng)新互聯(lián)一直通過網(wǎng)站建設和網(wǎng)站營銷幫助企業(yè)獲得更多客戶資源。 以"深度挖掘,量身打造,注重實效"的一站式服務,以成都網(wǎng)站制作、網(wǎng)站建設、移動互聯(lián)產(chǎn)品、網(wǎng)絡營銷推廣服務為核心業(yè)務。十載網(wǎng)站制作的經(jīng)驗,使用新網(wǎng)站建設技術,全新開發(fā)出的標準網(wǎng)站,不但價格便宜而且實用、靈活,特別適合中小公司網(wǎng)站制作。網(wǎng)站管理系統(tǒng)簡單易用,維護方便,您可以完全操作網(wǎng)站資料,是中小公司快速網(wǎng)站建設的選擇。來源 | www.jianshu.com/u/1d933ff900e7
本文將通過圖文的方式講解紅黑樹的知識點,并且不會涉及到任何代碼,相信我,在懂得紅黑樹實現(xiàn)原理前,看代碼會一頭霧水的,當原理懂了,代碼也就按部就班寫而已,沒任何難度。
閱讀本文你需具備知識點:
二叉查找樹
完美平衡二叉樹
事不宜遲,讓我們進入正題吧。
紅黑樹也是二叉查找樹,我們知道,二叉查找樹這一數(shù)據(jù)結構并不難,而紅黑樹之所以難是難在它是自平衡的二叉查找樹,在進行插入和刪除等可能會破壞樹的平衡的操作時,需要重新自處理達到平衡狀態(tài)?,F(xiàn)在在腦海想下怎么實現(xiàn)?是不是太多情景需要考慮了?嘖嘖,先別急,通過本文的學習后,你會覺得,其實也不過如此而已。好吧,我們先來看下紅黑樹的定義和一些基本性質。
紅黑樹定義和性質
紅黑樹是一種含有紅黑結點并能自平衡的二叉查找樹。它必須滿足下面性質:
性質1:每個節(jié)點要么是黑色,要么是紅色。
性質2:根節(jié)點是黑色。
性質3:每個葉子節(jié)點(NIL)是黑色。
性質4:每個紅色結點的兩個子結點一定都是黑色。
性質5:任意一結點到每個葉子結點的路徑都包含數(shù)量相同的黑結點。
從性質5又可以推出:
性質5.1:如果一個結點存在黑子結點,那么該結點肯定有兩個子結點
圖1就是一顆簡單的紅黑樹。其中Nil為葉子結點,并且它是黑色的。(值得提醒注意的是,在Java中,葉子結點是為null的結點。)
圖1 一顆簡單的紅黑樹
紅黑樹并不是一個完美平衡二叉查找樹,從圖1可以看到,根結點P的左子樹顯然比右子樹高,但左子樹和右子樹的黑結點的層數(shù)是相等的,也即任意一個結點到到每個葉子結點的路徑都包含數(shù)量相同的黑結點(性質5)。所以我們叫紅黑樹這種平衡為黑色完美平衡。
介紹到此,為了后面講解不至于混淆,我們還需要來約定下紅黑樹一些結點的叫法,如圖2所示。
圖2 結點叫法約定
我們把正在處理(遍歷)的結點叫做當前結點,如圖2中的D,它的父親叫做父結點,它的父親的另外一個子結點叫做兄弟結點,父親的父親叫做祖父結點。
前面講到紅黑樹能自平衡,它靠的是什么?三種操作:左旋、右旋和變色。
左旋:以某個結點作為支點(旋轉結點),其右子結點變?yōu)樾D結點的父結點,右子結點的左子結點變?yōu)樾D結點的右子結點,左子結點保持不變。如圖3。
右旋:以某個結點作為支點(旋轉結點),其左子結點變?yōu)樾D結點的父結點,左子結點的右子結點變?yōu)樾D結點的左子結點,右子結點保持不變。如圖4。
變色:結點的顏色由紅變黑或由黑變紅。
圖3 左旋
圖4 右旋
上面所說的旋轉結點也即旋轉的支點,圖4和圖5中的P結點。
我們先忽略顏色,可以看到旋轉操作不會影響旋轉結點的父結點,父結點以上的結構還是保持不變的。
左旋只影響旋轉結點和其右子樹的結構,把右子樹的結點往左子樹挪了。
右旋只影響旋轉結點和其左子樹的結構,把左子樹的結點往右子樹挪了。
所以旋轉操作是局部的。另外可以看出旋轉能保持紅黑樹平衡的一些端詳了:當一邊子樹的結點少了,那么向另外一邊子樹“借”一些結點;當一邊子樹的結點多了,那么向另外一邊子樹“租”一些結點。
但要保持紅黑樹的性質,結點不能亂挪,還得靠變色了。怎么變?具體情景又不同變法,后面會具體講到,現(xiàn)在只需要記住紅黑樹總是通過旋轉和變色達到自平衡。
balabala了這么多,相信你對紅黑樹有一定印象了,那么現(xiàn)在來考考你:
思考題1:黑結點可以同時包含一個紅子結點和一個黑子結點嗎? (答案見文末)
接下來先講解紅黑樹的查找熱熱身。
紅黑樹查找
因為紅黑樹是一顆二叉平衡樹,并且查找不會破壞樹的平衡,所以查找跟二叉平衡樹的查找無異:
從根結點開始查找,把根結點設置為當前結點;
若當前結點為空,返回null;
若當前結點不為空,用當前結點的key跟查找key作比較;
若當前結點key等于查找key,那么該key就是查找目標,返回當前結點;
若當前結點key大于查找key,把當前結點的左子結點設置為當前結點,重復步驟2;
若當前結點key小于查找key,把當前結點的右子結點設置為當前結點,重復步驟2;
如圖5所示:
圖5 二叉樹查找流程圖
非常簡單,但簡單不代表它效率不好。正由于紅黑樹總保持黑色完美平衡,所以它的查找最壞時間復雜度為O(2lgN),也即整顆樹剛好紅黑相隔的時候。能有這么好的查找效率得益于紅黑樹自平衡的特性,而這背后的付出,紅黑樹的插入操作功不可沒~
紅黑樹插入
插入操作包括兩部分工作:一查找插入的位置;二插入后自平衡。查找插入的父結點很簡單,跟查找操作區(qū)別不大:
從根結點開始查找;
若根結點為空,那么插入結點作為根結點,結束。
若根結點不為空,那么把根結點作為當前結點;
若當前結點為null,返回當前結點的父結點,結束。
若當前結點key等于查找key,那么該key所在結點就是插入結點,更新結點的值,結束。
若當前結點key大于查找key,把當前結點的左子結點設置為當前結點,重復步驟4;
若當前結點key小于查找key,把當前結點的右子結點設置為當前結點,重復步驟4;
如圖6所示:
圖6 紅黑樹插入位置查找
ok,插入位置已經(jīng)找到,把插入結點放到正確的位置就可以啦,但插入結點是應該是什么顏色呢?答案是紅色。理由很簡單,紅色在父結點(如果存在)為黑色結點時,紅黑樹的黑色平衡沒被破壞,不需要做自平衡操作。但如果插入結點是黑色,那么插入位置所在的子樹黑色結點總是多1,必須做自平衡。
所有插入情景如圖7所示:
圖7 紅黑樹插入情景
嗯,插入情景很多呢,8種插入情景!但情景1、2和3的處理很簡單,而情景4.2和情景4.3只是方向反轉而已,懂得了一種情景就能推出另外一種情景,所以總體來看,并不復雜,后續(xù)我們將一個一個情景來看,把它徹底搞懂。
另外,根據(jù)二叉樹的性質,除了情景2,所有插入操作都是在葉子結點進行的。這點應該不難理解,因為查找插入位置時,我們就是在找子結點為空的父結點的。
在開始每個情景的講解前,我們還是先來約定下,如圖8所示:
圖8 插入操作結點的叫法約定
圖8的字母并不代表結點Key的大小。I表示插入結點,P表示插入結點的父結點,S表示插入結點的叔叔結點,PP表示插入結點的祖父結點。
好了,下面讓我們一個一個來分析每個插入的情景以其處理。
最簡單的一種情景,直接把插入結點作為根結點就行,但注意,根據(jù)紅黑樹性質2:根節(jié)點是黑色。還需要把插入結點設為黑色。
處理:把插入結點作為根結點,并把結點設置為黑色。
插入結點的Key已存在,既然紅黑樹總保持平衡,在插入前紅黑樹已經(jīng)是平衡的,那么把插入結點設置為將要替代結點的顏色,再把結點的值更新就完成插入。
處理:
把I設為當前結點的顏色
更新當前結點的值為插入結點的值
由于插入的結點是紅色的,當插入結點的黑色時,并不會影響紅黑樹的平衡,直接插入即可,無需做自平衡。
處理:直接插入。
再次回想下紅黑樹的性質2:根結點是黑色。如果插入的父結點為紅結點,那么該父結點不可能為根結點,所以插入結點總是存在祖父結點。這點很重要,因為后續(xù)的旋轉操作肯定需要祖父結點的參與。
情景4又分為很多子情景,下面將進入重點部分,各位看官請留神了。
插入情景4.1:叔叔結點存在并且為紅結點
從紅黑樹性質4可以,祖父結點肯定為黑結點,因為不可以同時存在兩個相連的紅結點。那么此時該插入子樹的紅黑層數(shù)的情況是:黑紅紅。顯然最簡單的處理方式是把其改為:紅黑紅。如圖9和圖10所示。
處理:
將P和S設置為黑色
將PP設置為紅色
把PP設置為當前插入結點
圖9 插入情景4.1_1
圖10 插入情景4.1_2
可以看到,我們把PP結點設為紅色了,如果PP的父結點是黑色,那么無需再做任何處理;但如果PP的父結點是紅色,根據(jù)性質4,此時紅黑樹已不平衡了,所以還需要把PP當作新的插入結點,繼續(xù)做插入操作自平衡處理,直到平衡為止。
試想下PP剛好為根結點時,那么根據(jù)性質2,我們必須把PP重新設為黑色,那么樹的紅黑結構變?yōu)椋汉诤诩t。換句話說,從根結點到葉子結點的路徑中,黑色結點增加了。這也是唯一一種會增加紅黑樹黑色結點層數(shù)的插入情景。
我們還可以總結出另外一個經(jīng)驗:紅黑樹的生長是自底向上的。這點不同于普通的二叉查找樹,普通的二叉查找樹的生長是自頂向下的。
插入情景4.2:叔叔結點不存在或為黑結點,并且插入結點的父親結點是祖父結點的左子結點
單純從插入前來看,也即不算情景4.1自底向上處理時的情況,叔叔結點非紅即為葉子結點(Nil)。因為如果叔叔結點為黑結點,而父結點為紅結點,那么叔叔結點所在的子樹的黑色結點就比父結點所在子樹的多了,這不滿足紅黑樹的性質5。后續(xù)情景同樣如此,不再多做說明了。
前文說了,需要旋轉操作時,肯定一邊子樹的結點多了或少了,需要租或借給另一邊。插入顯然是多的情況,那么把多的結點租給另一邊子樹就可以了。
插入情景4.2.1:插入結點是其父結點的左子結點
處理:
將P設為黑色
將PP設為紅色
對PP進行右旋
圖11 插入情景4.2.1
由圖11可得,左邊兩個紅結點,右邊不存在,那么一邊一個剛剛好,并且因為為紅色,肯定不會破壞樹的平衡。
咦,可以把PP設為紅色,I和P設為黑色嗎?答案是可以!看過《算法:第4版》的同學可能知道,書中講解的就是把PP設為紅色,I和P設為黑色。但把PP設為紅色,顯然又會出現(xiàn)情景4.1的情況,需要自底向上處理,做多了無謂的操作,既然能自己消化就不要麻煩祖輩們啦~
插入情景4.2.2:插入結點是其父結點的右子結點
這種情景顯然可以轉換為情景4.2.1,如圖12所示,不做過多說明了。
處理:
對P進行左旋
把P設置為插入結點,得到情景4.2.1
進行情景4.2.1的處理
圖12 插入情景4.2.2
插入情景4.3:叔叔結點不存在或為黑結點,并且插入結點的父親結點是祖父結點的右子結點
該情景對應情景4.2,只是方向反轉,不做過多說明了,直接看圖。
插入情景4.3.1:插入結點是其父結點的右子結點
處理:
將P設為黑色
將PP設為紅色
對PP進行左旋
圖13 插入情景4.3.1
插入情景4.3.2:插入結點是其父結點的右子結點
處理:
對P進行右旋
把P設置為插入結點,得到情景4.3.1
進行情景4.3.1的處理
圖14 插入情景4.3.2
好了,講完插入的所有情景了??赡苡滞瑢W會想:上面的情景舉例的都是第一次插入而不包含自底向上處理的情況,那么上面所說的情景都適合自底向上的情況嗎?答案是肯定的。理由很簡單,但每棵子樹都能自平衡,那么整棵樹最終總是平衡的。好吧,在出個習題,請大家拿出筆和紙畫下試試(請務必動手畫下,加深印象):
習題1:請畫出圖15的插入自平衡處理過程。(答案見文末)
圖15 習題1
紅黑樹刪除
紅黑樹插入已經(jīng)夠復雜了,但刪除更復雜,也是紅黑樹最復雜的操作了。但穩(wěn)住,勝利的曙光就在前面了!
紅黑樹的刪除操作也包括兩部分工作:一查找目標結點;而刪除后自平衡。查找目標結點顯然可以復用查找操作,當不存在目標結點時,忽略本次操作;當存在目標結點時,刪除后就得做自平衡處理了。刪除了結點后我們還需要找結點來替代刪除結點的位置,不然子樹跟父輩結點斷開了,除非刪除結點剛好沒子結點,那么就不需要替代。
二叉樹刪除結點找替代結點有3種情情景:
情景1:若刪除結點無子結點,直接刪除
情景2:若刪除結點只有一個子結點,用子結點替換刪除結點
情景3:若刪除結點有兩個子結點,用后繼結點(大于刪除結點的最小結點)替換刪除結點
補充說明下,情景3的后繼結點是大于刪除結點的最小結點,也是刪除結點的右子樹種最右結點。那么可以拿前繼結點(刪除結點的左子樹最左結點)替代嗎?可以的。但習慣上大多都是拿后繼結點來替代,后文的講解也是用后繼結點來替代。另外告訴大家一種找前繼和后繼結點的直觀的方法(不知為何沒人提過,大家都知道?):把二叉樹所有結點投射在X軸上,所有結點都是從左到右排好序的,所有目標結點的前后結點就是對應前繼和后繼結點。如圖16所示。
圖16 二叉樹投射x軸后有序
接下來,講一個重要的思路:刪除結點被替代后,在不考慮結點的鍵值的情況下,對于樹來說,可以認為刪除的是替代結點!話很蒼白,我們看圖17。在不看鍵值對的情況下,圖17的紅黑樹最終結果是刪除了Q所在位置的結點!這種思路非常重要,大大簡化了后文講解紅黑樹刪除的情景!
圖17 刪除結點換位思路
基于此,上面所說的3種二叉樹的刪除情景可以相互轉換并且最終都是轉換為情景1!
情景2:刪除結點用其唯一的子結點替換,子結點替換為刪除結點后,可以認為刪除的是子結點,若子結點又有兩個子結點,那么相當于轉換為情景3,一直自頂向下轉換,總是能轉換為情景1。(對于紅黑樹來說,根據(jù)性質5.1,只存在一個子結點的結點肯定在樹末了)
情景3:刪除結點用后繼結點(肯定不存在左結點),如果后繼結點有右子結點,那么相當于轉換為情景2,否則轉為為情景1。
二叉樹刪除結點情景關系圖如圖18所示。
圖18 二叉樹刪除情景轉換
綜上所述,刪除操作刪除的結點可以看作刪除替代結點,而替代結點最后總是在樹末。有了這結論,我們討論的刪除紅黑樹的情景就少了很多,因為我們只考慮刪除樹末結點的情景了。
同樣的,我們也是先來總體看下刪除操作的所有情景,如圖19所示。
圖19 紅黑樹刪除情景
哈哈,是的,即使簡化了還是有9種情景!但跟插入操作一樣,存在左右對稱的情景,只是方向變了,沒有本質區(qū)別。同樣的,我們還是來約定下,如圖20所示。
圖20 刪除操作結點的叫法約定
圖20的字母并不代表結點Key的大小。R表示替代結點,P表示替代結點的父結點,S表示替代結點的兄弟結點,SL表示兄弟結點的左子結點,SR表示兄弟結點的右子結點。灰色結點表示它可以是紅色也可以是黑色。
值得特別提醒的是,R是即將被替換到刪除結點的位置的替代結點,在刪除前,它還在原來所在位置參與樹的子平衡,平衡后再替換到刪除結點的位置,才算刪除完成。
萬事具備,我們進入最后的也是最難的講解。
我們把替換結點換到了刪除結點的位置時,由于替換結點時紅色,刪除也了不會影響紅黑樹的平衡,只要把替換結點的顏色設為刪除的結點的顏色即可重新平衡。
處理:顏色變?yōu)閯h除結點的顏色
當替換結點是黑色時,我們就不得不進行自平衡處理了。我們必須還得考慮替換結點是其父結點的左子結點還是右子結點,來做不同的旋轉操作,使樹重新平衡。
刪除情景2.1:替換結點是其父結點的左子結點
刪除情景2.1.1:替換結點的兄弟結點是紅結點
若兄弟結點是紅結點,那么根據(jù)性質4,兄弟結點的父結點和子結點肯定為黑色,不會有其他子情景,我們按圖21處理,得到刪除情景2.1.2.3(后續(xù)講解,這里先記住,此時R仍然是替代結點,它的新的兄弟結點SL和兄弟結點的子結點都是黑色)。
處理:
將S設為黑色
將P設為紅色
對P進行左旋,得到情景2.1.2.3
進行情景2.1.2.3的處理
圖21 刪除情景2.1.1
刪除情景2.1.2:替換結點的兄弟結點是黑結點
當兄弟結點為黑時,其父結點和子結點的具體顏色也無法確定(如果也不考慮自底向上的情況,子結點非紅即為葉子結點Nil,Nil結點為黑結點),此時又得考慮多種子情景。
刪除情景2.1.2.1:替換結點的兄弟結點的右子結點是紅結點,左子結點任意顏色
即將刪除的左子樹的一個黑色結點,顯然左子樹的黑色結點少1了,然而右子樹又又紅色結點,那么我們直接向右子樹“借”個紅結點來補充黑結點就好啦,此時肯定需要用旋轉處理了。如圖22所示。
處理:
將S的顏色設為P的顏色
將P設為黑色
將SR設為黑色
對P進行左旋
圖22 刪除情景2.1.2.1
平衡后的圖怎么不滿足紅黑樹的性質?前文提醒過,R是即將替換的,它還參與樹的自平衡,平衡后再替換到刪除結點的位置,所以R最終可以看作是刪除的。另外圖2.1.2.1是考慮到第一次替換和自底向上處理的情況,如果只考慮第一次替換的情況,根據(jù)紅黑樹性質,SL肯定是紅色或為Nil,所以最終結果樹是平衡的。如果是自底向上處理的情況,同樣,每棵子樹都保持平衡狀態(tài),最終整棵樹肯定是平衡的。后續(xù)的情景同理,不做過多說明了。
刪除情景2.1.2.2:替換結點的兄弟結點的右子結點為黑結點,左子結點為紅結點
兄弟結點所在的子樹有紅結點,我們總是可以向兄弟子樹借個紅結點過來,顯然該情景可以轉換為情景2.1.2.1。圖如23所示。
處理:
將S設為紅色
將SL設為黑色
對S進行右旋,得到情景2.1.2.1
進行情景2.1.2.1的處理
圖23 刪除情景2.1.2.2
刪除情景2.1.2.3:替換結點的兄弟結點的子結點都為黑結點
好了,此次兄弟子樹都沒紅結點“借”了,兄弟幫忙不了,找父母唄,這種情景我們把兄弟結點設為紅色,再把父結點當作替代結點,自底向上處理,去找父結點的兄弟結點去“借”。但為什么需要把兄弟結點設為紅色呢?顯然是為了在P所在的子樹中保證平衡(R即將刪除,少了一個黑色結點,子樹也需要少一個),后續(xù)的平衡工作交給父輩們考慮了,還是那句,當每棵子樹都保持平衡時,最終整棵總是平衡的。
處理:
將S設為紅色
把P作為新的替換結點
重新進行刪除結點情景處理
圖24 情景2.1.2.3
刪除情景2.2:替換結點是其父結點的右子結點
好啦,右邊的操作也是方向相反,不做過多說明了,相信理解了刪除情景2.1后,肯定可以理解2.2。
刪除情景2.2.1:替換結點的兄弟結點是紅結點
處理:
將S設為黑色
將P設為紅色
對P進行右旋,得到情景2.2.2.3
進行情景2.2.2.3的處理
圖25 刪除情景2.2.1
刪除情景2.2.2:替換結點的兄弟結點是黑結點
刪除情景2.2.2.1:替換結點的兄弟結點的左子結點是紅結點,右子結點任意顏色
處理:
將S的顏色設為P的顏色
將P設為黑色
將SL設為黑色
對P進行右旋
圖26 刪除情景2.2.2.1
刪除情景2.2.2.2:替換結點的兄弟結點的左子結點為黑結點,右子結點為紅結點
處理:
將S設為紅色
將SR設為黑色
對S進行左旋,得到情景2.2.2.1
進行情景2.2.2.1的處理
圖27 刪除情景2.2.2.2
刪除情景2.2.2.3:替換結點的兄弟結點的子結點都為黑結點
處理:
將S設為紅色
把P作為新的替換結點
重新進行刪除結點情景處理
圖28 刪除情景2.2.2.3
綜上,紅黑樹刪除后自平衡的處理可以總結為:
自己能搞定的自消化(情景1)
自己不能搞定的叫兄弟幫忙(除了情景1、情景2.1.2.3和情景2.2.2.3)
兄弟都幫忙不了的,通過父母,找遠方親戚(情景2.1.2.3和情景2.2.2.3)
哈哈,是不是跟現(xiàn)實中很像,當我們有困難時,首先先自己解決,自己無力了總兄弟姐妹幫忙,如果連兄弟姐妹都幫不上,再去找遠方的親戚了。這里記憶應該會好記點~
最后再做個習題加深理解(請不熟悉的同學務必動手畫下):
習題2:請畫出圖29的刪除自平衡處理過程。