在使用Go語言的時候,碰到了需要對數(shù)組進行去重操作的問題。Java語言有Set集合這個數(shù)據(jù)結(jié)構(gòu),可以很方便的將數(shù)組轉(zhuǎn)為集合,但是Go語言沒有Set,如果僅僅是因為去重操作就手動實現(xiàn)一個Set太繁瑣了??梢愿鶕?jù)Go語言中的map的特性來簡單實現(xiàn)一下
成都創(chuàng)新互聯(lián)公司10多年企業(yè)網(wǎng)站制作服務(wù);為您提供網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)頁設(shè)計及高端網(wǎng)站定制服務(wù),企業(yè)網(wǎng)站制作及推廣,對成都攪拌罐車等多個方面擁有多年的網(wǎng)站營銷經(jīng)驗的網(wǎng)站建設(shè)公司。
這個是對字符串?dāng)?shù)組去重操作。可以根據(jù)需要的類型稍作修改即可。需要注意的是只支持可以作為map鍵的結(jié)構(gòu)進行去重!
map 是Go語言中基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu),在日常的使用中經(jīng)常被用到。但是它底層是如何實現(xiàn)的呢?
總體來說golang的map是hashmap,是使用數(shù)組+鏈表的形式實現(xiàn)的,使用拉鏈法消除hash沖突。
golang的map由兩種重要的結(jié)構(gòu),hmap和bmap(下文中都有解釋),主要就是hmap中包含一個指向bmap數(shù)組的指針,key經(jīng)過hash函數(shù)之后得到一個數(shù),這個數(shù)低位用于選擇bmap(當(dāng)作bmap數(shù)組指針的下表),高位用于放在bmap的[8]uint8數(shù)組中,用于快速試錯。然后一個bmap可以指向下一個bmap(拉鏈)。
Golang中map的底層實現(xiàn)是一個散列表,因此實現(xiàn)map的過程實際上就是實現(xiàn)散表的過程。在這個散列表中,主要出現(xiàn)的結(jié)構(gòu)體有兩個,一個叫 hmap (a header for a go map),一個叫 bmap (a bucket for a Go map,通常叫其bucket)。這兩種結(jié)構(gòu)的樣子分別如下所示:
hmap :
圖中有很多字段,但是便于理解map的架構(gòu),你只需要關(guān)心的只有一個,就是標紅的字段: buckets數(shù)組 。Golang的map中用于存儲的結(jié)構(gòu)是bucket數(shù)組。而bucket(即bmap)的結(jié)構(gòu)是怎樣的呢?
bucket :
相比于hmap,bucket的結(jié)構(gòu)顯得簡單一些,標紅的字段依然是“核心”,我們使用的map中的key和value就存儲在這里?!案呶还V怠睌?shù)組記錄的是當(dāng)前bucket中key相關(guān)的“索引”,稍后會詳細敘述。還有一個字段是一個指向擴容后的bucket的指針,使得bucket會形成一個鏈表結(jié)構(gòu)。例如下圖:
由此看出hmap和bucket的關(guān)系是這樣的:
而bucket又是一個鏈表,所以,整體的結(jié)構(gòu)應(yīng)該是這樣的:
哈希表的特點是會有一個哈希函數(shù),對你傳來的key進行哈希運算,得到唯一的值,一般情況下都是一個數(shù)值。Golang的map中也有這么一個哈希函數(shù),也會算出唯一的值,對于這個值的使用,Golang也是很有意思。
Golang把求得的值按照用途一分為二:高位和低位。
如圖所示,藍色為高位,紅色為低位。 然后低位用于尋找當(dāng)前key屬于hmap中的哪個bucket,而高位用于尋找bucket中的哪個key。上文中提到:bucket中有個屬性字段是“高位哈希值”數(shù)組,這里存的就是藍色的高位值,用來聲明當(dāng)前bucket中有哪些“key”,便于搜索查找。 需要特別指出的一點是:我們map中的key/value值都是存到同一個數(shù)組中的。數(shù)組中的順序是這樣的:
并不是key0/value0/key1/value1的形式,這樣做的好處是:在key和value的長度不同的時候,可 以消除padding(內(nèi)存對齊)帶來的空間浪費 。
現(xiàn)在,我們可以得到Go語言map的整個的結(jié)構(gòu)圖了:(hash結(jié)果的低位用于選擇把KV放在bmap數(shù)組中的哪一個bmap中,高位用于key的快速預(yù)覽,用于快速試錯)
map的擴容
當(dāng)以上的哈希表增長的時候,Go語言會將bucket數(shù)組的數(shù)量擴充一倍,產(chǎn)生一個新的bucket數(shù)組,并將舊數(shù)組的數(shù)據(jù)遷移至新數(shù)組。
加載因子
判斷擴充的條件,就是哈希表中的加載因子(即loadFactor)。
加載因子是一個閾值,一般表示為:散列包含的元素數(shù) 除以 位置總數(shù)。是一種“產(chǎn)生沖突機會”和“空間使用”的平衡與折中:加載因子越小,說明空間空置率高,空間使用率小,但是加載因子越大,說明空間利用率上去了,但是“產(chǎn)生沖突機會”高了。
每種哈希表的都會有一個加載因子,數(shù)值超過加載因子就會為哈希表擴容。
Golang的map的加載因子的公式是:map長度 / 2^B(這是代表bmap數(shù)組的長度,B是取的低位的位數(shù))閾值是6.5。其中B可以理解為已擴容的次數(shù)。
當(dāng)Go的map長度增長到大于加載因子所需的map長度時,Go語言就會將產(chǎn)生一個新的bucket數(shù)組,然后把舊的bucket數(shù)組移到一個屬性字段oldbucket中。注意:并不是立刻把舊的數(shù)組中的元素轉(zhuǎn)義到新的bucket當(dāng)中,而是,只有當(dāng)訪問到具體的某個bucket的時候,會把bucket中的數(shù)據(jù)轉(zhuǎn)移到新的bucket中。
如下圖所示:當(dāng)擴容的時候,Go的map結(jié)構(gòu)體中,會保存舊的數(shù)據(jù),和新生成的數(shù)組
上面部分代表舊的有數(shù)據(jù)的bucket,下面部分代表新生成的新的bucket。藍色代表存有數(shù)據(jù)的bucket,橘黃色代表空的bucket。
擴容時map并不會立即把新數(shù)據(jù)做遷移,而是當(dāng)訪問原來舊bucket的數(shù)據(jù)的時候,才把舊數(shù)據(jù)做遷移,如下圖:
注意:這里并不會直接刪除舊的bucket,而是把原來的引用去掉,利用GC清除內(nèi)存。
map中數(shù)據(jù)的刪除
如果理解了map的整體結(jié)構(gòu),那么查找、更新、刪除的基本步驟應(yīng)該都很清楚了。這里不再贅述。
值得注意的是,找到了map中的數(shù)據(jù)之后,針對key和value分別做如下操作:
1
2
3
4
1、如果``key``是一個指針類型的,則直接將其置為空,等待GC清除;
2、如果是值類型的,則清除相關(guān)內(nèi)存。
3、同理,對``value``做相同的操作。
4、最后把key對應(yīng)的高位值對應(yīng)的數(shù)組index置為空。
// 先聲明map
var m1 map[string]string
// 再使用make函數(shù)創(chuàng)建一個非nil的map,nil map不能賦值
m1 = make(map[string]string)
// 最后給已聲明的map賦值
m1["a"] = "aa"
m1["b"] = "bb"
// 直接創(chuàng)建
m2 := make(map[string]string)
// 然后賦值
m2["a"] = "aa"
m2["b"] = "bb"
// 初始化 + 賦值一體化
m3 := map[string]string{
"a": "aa",
"b": "bb",
}
望采納。。
// ==========================================
// 查找鍵值是否存在
if v, ok := m1["a"]; ok {
fmt.Println(v)
} else {
fmt.Println("Key Not Found")
}
// 遍歷map
for k, v := range m1 {
fmt.Println(k, v)
}