哈希桶:哈希桶就是盛放不同key鏈表的容器(即是哈希表),我們可以把每個key的位置看作是一個指針,該指針所指向的位置里放了一個鏈表,可以認為是指針數(shù)組,故該方法也叫開鏈式。
創(chuàng)新互聯(lián)專注于軹城網(wǎng)站建設服務及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供軹城營銷型網(wǎng)站建設,軹城網(wǎng)站制作、軹城網(wǎng)頁設計、軹城網(wǎng)站官網(wǎng)定制、成都微信小程序服務,打造軹城網(wǎng)絡公司原創(chuàng)品牌,更為您提供軹城網(wǎng)站排名全網(wǎng)營銷落地服務。
相比閉散列,哈希桶提高了空間利用率:在實現(xiàn)哈希表時,常見的方法是線性探測、二次探測,這兩個算法的具體實現(xiàn)可以查看我的博客。但是這兩個算法有一個共同點就是:空間利用率低。為什么這么說呢?線性探測、二次探測的高效性很大程度上要取決于它的載荷因子,載荷因子即:存放關鍵字個數(shù) / 空間大小。
通過查閱資料,我發(fā)現(xiàn),使用素數(shù)做除數(shù)可以減少哈希沖突。見下:
素數(shù)表:使用素數(shù)做除數(shù)可以減少哈希沖突
// 使用素數(shù)表對齊做哈希表的容量,降低哈希沖突
const int _PrimeSize = 28;
static const unsigned long _PrimeList [_PrimeSize] =
{
53ul, 97ul, 193ul, 389ul, 769ul,
1543ul, 3079ul, 6151ul, 12289ul, 24593ul,
49157ul, 98317ul, 196613ul, 393241ul, 786433ul,
1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul,
50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul,
1610612741ul, 3221225473ul, 4294967291ul
};
下圖進行哈希桶處理哈希沖突的展示
下面通過庫中的vactor進行存放指向鏈表的指針,每個結(jié)點里包含_key,_value和_next。
#pragma templatestruct DefaultHashFunc { size_t operator()(const K& key) { return key; } }; static size_t BKDRHash(const char * str)//字符串哈希算法 { unsigned int seed = 131; // 31 131 1313 13131 131313 unsigned int hash = 0; while (*str) { hash = hash * seed + (unsigned int)(*str++); } return (hash & 0x7FFFFFFF); } template<> struct DefaultHashFunc { size_t operator()(const string& str) { return BKDRHash(str.c_str()); } }; template struct HashTableNode//結(jié)點 { K _key; V _value; HashTableNode* _next; HashTableNode(const K& key, const V& value) :_key(key) , _value(value) , _next(NULL) {} }; template > class HashTableBucket { typedef HashTableNode Node; public: HashTableBucket(); HashTableBucket(const HashTableBucket & htb); HashTableBucket & operator=(HashTableBucket htb); void PrintTables(); bool Insert(const K& key,const V& value);//防冗余,在刪除和查找時只需要key Node* Find(const K& key); bool Remove(const K& key); protected: size_t _HashFunc(const K& key); size_t _GetNextPrime(size_t size);//獲取下一個素數(shù)(利用素數(shù)表,使用素數(shù)做除數(shù)可以減少哈希沖突) void _CheckExpand(); private: vector _tables;//開鏈式為指針數(shù)組,指針指向鏈表 size_t _size;//有效數(shù)據(jù)數(shù),vector中的size()為有效空間數(shù) };
實現(xiàn)_HashFunc(const K& key),通過偽函數(shù)來判斷不同類型的key所在鏈表的位置。
template> size_t HashTableBucket ::_HashFunc(const K& key) { HashFunc htb; return htb(key) % (_tables.size());//htb(key)偽函數(shù) }
1. 插入函數(shù)的實現(xiàn)(Insert)
(1)檢查容量。調(diào)用_CheckExpand()函數(shù)檢查負載因子a,考慮是否擴張,當a為1時進行擴容。
(2)檢查插入的key是否已經(jīng)存在,不存在返回false,存在進行(3)操作。
(3)進行頭插。
template> bool HashTableBucket ::Insert(const K& key, const V& value) {//防冗余,在刪除和查找時只需要key _CheckExpand();//檢查是否擴容 for (size_t i = 0; i < _tables.size(); ++i) { Node* cur = _tables[i]; while (cur) {//如果插入的元素存在就返回false if (cur->_key == key) { return false; } cur = cur->_next; } } //頭插 size_t index = _HashFunc(key); Node* tmp = new Node(key, value); tmp->_next = _tables[index]; _tables[index] = tmp; ++_size; return true;
2. 查找函數(shù)的實現(xiàn)(Find)
(1)調(diào)用_HashFunc()函數(shù)找到要尋找的Key所在的鏈表位置。
(2)通過遍歷鏈表查找key。
template> HashTableNode * HashTableBucket ::Find(const K& key)//查找 { size_t index = _HashFunc(key);//鏈表結(jié)點位置 Node* cur = _tables[index]; while (cur) { if (cur->_key == key) { return cur; } cur = cur->_next; } return NULL; }
3. 刪除函數(shù)的實現(xiàn)(Remove)
(1)調(diào)用Find()函數(shù),判斷需要刪除的key是否存在,不存在就返回false,存在就進行(2)操作。
(2)調(diào)用_HashFunc()函數(shù)找到key所在鏈表的位置,先通過遍歷鏈表找到del結(jié)點的上一個結(jié)點prev,然后使prev的下一個結(jié)點指向del的下一個結(jié)點。
template> bool HashTableBucket ::Remove(const K& key)//刪除 { if (Find(key) == NULL) { return false; } size_t index = _HashFunc(key); //需要找到刪除結(jié)點的前后結(jié)點 Node* del = Find(key); Node* next = del->_next; Node* prev = _tables[index]; while (prev) { if (prev->_next == del) { break; } prev = prev->_next; } if (next)//如果next存在時,進行鏈接 { prev->_next = next; } del = NULL; return true; }
檢查是否需要擴容_CheckExpand()的實現(xiàn)。
template> void HashTableBucket ::_CheckExpand()//檢查負載因子,考慮是否擴容 { if (_size >= _tables.size())//負載因子達到了1,進行擴容 { size_t NewSize = _GetNextPrime(_size); //進行結(jié)點復制 vector NewTables; NewTables.resize(NewSize); for (size_t i = 0; i < _tables.size(); ++i) { Node* cur = _tables[i]; while (cur)//頭插 { Node* tmp = cur; cur = cur->_next; size_t index = _HashFunc(tmp->_key);//重新確定元素在表中位置 tmp->_next = NewTables[index]; NewTables[index] = tmp; } } _tables.swap(NewTables);//調(diào)用vector中的swap接口進行交換 } } template > size_t HashTableBucket ::_GetNextPrime(size_t size) {//獲取下一個素數(shù)(利用素數(shù)表,使用素數(shù)做除數(shù)可以減少哈希沖突) //使用素數(shù)表對齊做哈希表的容量,降低哈希沖突 const int _PrimeSize = 28; static const unsigned long _PrimeList[_PrimeSize] = { 53ul, 97ul, 193ul, 389ul, 769ul, 1543ul, 3079ul, 6151ul, 12289ul, 24593ul, 49157ul, 98317ul, 196613ul, 393241ul, 786433ul, 1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul, 50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul, 1610612741ul, 3221225473ul, 4294967291ul }; for (size_t i = 0; i < _PrimeSize; ++i) { if (_PrimeList[i] > size) { return _PrimeList[i]; } return _PrimeList[i - 1]; } return _PrimeList[_PrimeSize];//如果size大于或等于素數(shù)表中數(shù)據(jù),就返回表中最大數(shù) }
測試用例如下,實現(xiàn)字典(可以一對多)查詢。
HashTableBucket> dict; vector v; v.push_back("manager"); dict.Insert("經(jīng)理", v); v.clear(); v.push_back("移動"); v.push_back("距離"); dict.Insert("remove",v); HashTableNode >* ret = dict.Find("remove"); ret->_value.push_back("搬家"); vector & words = ret->_value; for (size_t i = 0; i < words.size(); ++i)//打印對應的多個字符串 { cout << words[i].c_str() << endl; }