本篇文章給大家分享的是有關(guān)如何從PHP數(shù)組實(shí)現(xiàn)原理看線性表數(shù)據(jù)結(jié)構(gòu),小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
創(chuàng)新互聯(lián)公司服務(wù)項(xiàng)目包括蒼溪網(wǎng)站建設(shè)、蒼溪網(wǎng)站制作、蒼溪網(wǎng)頁制作以及蒼溪網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,蒼溪網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到蒼溪省份的部分城市,未來相信會繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!
線性表,全名為線性存儲結(jié)構(gòu)。使用線性表存儲數(shù)據(jù)的方式可以這樣理解,即“把所有數(shù)據(jù)用一根線串起來,再存儲到物理空間中”。最簡單的線性表就是數(shù)組了。雖然PHP的數(shù)組本身不是由基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)構(gòu)成,但是其內(nèi)部實(shí)現(xiàn)方式應(yīng)用到了大部分的線性表數(shù)據(jù)結(jié)構(gòu)。今天,借著學(xué)習(xí)線性表數(shù)據(jù)結(jié)構(gòu)的機(jī)會,重新回顧PHP數(shù)組的內(nèi)部實(shí)現(xiàn)原理。
PHP數(shù)組的內(nèi)部實(shí)現(xiàn)
數(shù)組是PHP中很強(qiáng)大且非常重要的數(shù)據(jù)類型。它既支持單純的數(shù)字索引數(shù)組又支持鍵值對數(shù)組,其中鍵值對數(shù)組類似于 java的 HashMap。由于采用了哈希表實(shí)現(xiàn)能夠保證基本查找時(shí)間復(fù)雜度為 O(1),而且還能夠保證數(shù)據(jù)遍歷的順序。
首先看看PHP在內(nèi)核C語言的數(shù)據(jù)結(jié)構(gòu)長什么樣
看一下在php代碼中,給數(shù)組插入一個(gè)元素會發(fā)生什么
$arr = ['name'=>'admin'];
1.內(nèi)核首先會創(chuàng)建一個(gè)_zend_array數(shù)據(jù)對象。初始化數(shù)組的大小為HT_MIN_SIZE,PHP中定義了HT_MIN_SIZE為8;所以當(dāng)數(shù)組元素小于8的時(shí)候,插入數(shù)據(jù)并不會進(jìn)行數(shù)組擴(kuò)容。
2.使用Times 33hash算法,將 name轉(zhuǎn)換成一個(gè)長整形的數(shù)。
3.在arData[nNumUsed++]中保存 Bucket 數(shù)據(jù)中 key是數(shù)組的鍵名,h中保存key的hash之后的整數(shù)(負(fù)數(shù)),val的u2.next 保存 arData[h]的地址。將轉(zhuǎn)換表存儲以 arData 起始指針為起點(diǎn)做鏡面映射存儲。這樣,我們不需要額外的空間存儲,在分配 arData 空間的同時(shí)也分配了轉(zhuǎn)換表。
查找數(shù)組的時(shí)候,根據(jù)鍵名直接hash之后,可以直接定位到實(shí)際保存鍵值的Bucket,遍歷的時(shí)候,因?yàn)閍rData本身是有序的C數(shù)組,遍歷數(shù)組之后可以獲取到保存鍵值的Bucket。因此PHP的數(shù)組既能夠以O(shè)(1)的復(fù)雜度查詢到數(shù)組,又能夠順序的遍歷數(shù)組元素。
對應(yīng)源碼實(shí)現(xiàn)邏輯的主要核心代碼如下:
上面的過程省略了hash沖突的情況。但是即使是從上面簡單的版本中也可以發(fā)現(xiàn)PHP數(shù)組的實(shí)現(xiàn)運(yùn)用了很多的數(shù)據(jù)結(jié)構(gòu)知識。
Bucket *arData;是一個(gè)C語言數(shù)組,對應(yīng)數(shù)據(jù)結(jié)構(gòu)中的有序表。Bucket之間,通過val的u2.next又構(gòu)成了一個(gè)鏈表結(jié)構(gòu)。
同時(shí),PHP在處理hash沖突情況的時(shí)候,是將所有的沖突的鍵名數(shù)據(jù)退化成一個(gè)鏈表。而這種處理方式,是絕大部分hash處理的方式。
順序表
順序表的定義如下:
所謂順序表就是順序存儲的線性表。順序存儲是用一組地址連續(xù)的存儲單元依次存放線性表中各個(gè)元素的存儲結(jié)構(gòu)。
上面PHP核心代碼中 arData就是一個(gè)順序表。
序表的特點(diǎn):
1. 在線性表中邏輯上相鄰的數(shù)據(jù)元素,在物理存儲上也是相鄰的。
2. 存儲密度高,但要預(yù)先分配“足夠應(yīng)用”的存儲空間,這可能會造成存儲空間的浪費(fèi)。
3. 便于隨機(jī)存儲。只要確定了存儲線性表的起始位置,線性表中任一數(shù)據(jù)元素都可隨機(jī)存取,所以線性表的順序存儲結(jié)構(gòu)是一種隨機(jī)存取的存儲結(jié)構(gòu)。
4. 不便于插入和刪除操作,這是因?yàn)樵陧樞虮砩线M(jìn)行的插入和刪除操作會引起大量數(shù)據(jù)元素的移動(dòng)。
順序表存在的問題:
1. 物理上相鄰存儲,不便于內(nèi)存利用。例如一個(gè)容量為10的數(shù)組,需要內(nèi)存為10字節(jié),但是目前沒有連續(xù)10個(gè)字節(jié)空余的內(nèi)存空間,但是有很多不連續(xù)的小于10字節(jié)的內(nèi)存空間,這樣也沒辦法分配;
2. 順序表的容量很難確定。對于C語言而言,定義一個(gè)數(shù)組是需要指定數(shù)組大小的。這個(gè)大小就是為了方便底層用于申請連續(xù)內(nèi)存空間。PHP源碼中在初始化一個(gè)空數(shù)組的時(shí)候,也會先創(chuàng)建一個(gè)長度為16的arData數(shù)組,在需要擴(kuò)容的時(shí)候在進(jìn)行數(shù)組擴(kuò)容。
3. 插入元素不方便,需要移動(dòng)整個(gè)順序表元素
鏈表
鏈表的數(shù)據(jù)結(jié)構(gòu),是針對順序表的問題而提出的。鏈表是一種物理存儲結(jié)構(gòu)上非連續(xù),非順序的存儲結(jié)構(gòu),數(shù)據(jù)元素的邏輯順序是通過鏈表中的指針鏈接次序?qū)崿F(xiàn)的。在PHP的數(shù)組的源碼中,每個(gè)Bucket就是鏈表中的一個(gè)節(jié)點(diǎn)。通過Bucket.u2.next指向下一個(gè)節(jié)點(diǎn)(雖然本身是為了實(shí)現(xiàn)hash查找)。
根據(jù)鏈表的鏈接方式,分為單鏈表,雙鏈表。
單鏈表的每一個(gè)節(jié)點(diǎn)中只有指向下一個(gè)結(jié)點(diǎn)的指針,不能進(jìn)行回溯,適用于節(jié)點(diǎn)的增加和刪除。
雙鏈表的每一個(gè)節(jié)點(diǎn)中既有指向下一個(gè)結(jié)點(diǎn)的指針,也有指向上一個(gè)結(jié)點(diǎn)的指針,可以快速的找到當(dāng)前節(jié)點(diǎn)的前一個(gè)節(jié)點(diǎn),適用于需要雙向查找節(jié)點(diǎn)值的情況
鏈表的優(yōu)點(diǎn):
插入和刪除的效率高,只需要改變指針的指向就可以進(jìn)行插入和刪除。
內(nèi)存利用率高,不會浪費(fèi)內(nèi)存,可以使用內(nèi)存中細(xì)小的不連續(xù)的空間,只有在需要的時(shí)候才去創(chuàng)建空間。大小不固定,拓展很靈活。
以上就是如何從PHP數(shù)組實(shí)現(xiàn)原理看線性表數(shù)據(jù)結(jié)構(gòu),小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。