链地址法(哈希桶)详解与C++实现
创作时间:
作者:
@小白创作中心
链地址法(哈希桶)详解与C++实现
引用
CSDN
1.
https://m.blog.csdn.net/2301_82135086/article/details/144973584
链地址法(哈希桶)
链地址法是一种解决哈希冲突的方法。与开放定址法不同,链地址法中所有的数据不再直接存储在哈希表中,而是通过指针将冲突的数据链接成一个链表,挂在哈希表的相应位置下。这种方法也被称为拉链法或哈希桶。
负载因子与扩容机制
链地址法的负载因子没有限制,可以大于1。负载因子越大,哈希冲突的概率越高,但空间利用率也越高;负载因子越小,哈希冲突的概率越低,但空间利用率也越低。在STL中,unordered_xxx容器的最大负载因子通常控制在1,当负载因子大于1时就会触发扩容操作。
示例演示
下面演示一组数值{19, 30, 5, 36, 13, 20, 21, 12, 24, 96}映射到M=11的哈希表中的过程:
- h(19) = 8
- h(30) = 8
- h(5) = 5
- h(36) = 3
- h(13) = 2
- h(20) = 9
- h(21) = 10
- h(12) = 1
- h(24) = 2
- h(96) = 8
C++代码实现
链地址法的C++代码实现如下:
namespace hash_bucket
{
// 仿函数
template<class K>
struct HashFunc
{
size_t operator()(const K& key)
{
return (size_t)key;
}
};
// string类型的特化版本
template<>
struct HashFunc<string>
{
size_t operator()(const string& s)
{
size_t hash = 0;
for (auto ch : s)
{
hash += ch;
}
return hash;
}
};
// 哈希表节点结构
template<class K, class V>
struct HashNode
{
pair<K, V> _kv;
HashNode<K, V>* _next;
HashNode(const pair<K, V>& kv)
: _kv(kv)
, _next(nullptr)
{}
};
// 哈希表类
template<class K, class V, class Hash = HashFunc<K>>
class HashTable
{
public:
HashTable()
: _tables(__stl_next_prime(0))
, _n(0)
{}
~HashTable()
{
for (size_t i = 0; i < _tables.size(); i++)
{
Node* cur = _tables[i];
while (cur)
{
Node* next = cur->_next;
delete cur;
cur = next;
}
_tables[i] = nullptr;
}
}
Hash hash;
Node* Find(const K& key)
{
size_t hashi = hash(key) % _tables.size();
Node* cur = _tables[hashi];
while (cur)
{
if (key == cur->_kv.first)
{
return cur;
}
cur = cur->_next;
}
return nullptr;
}
bool Erase(const K& key)
{
size_t hashi = hash(key) % _tables.size();
Node* cur = _tables[hashi];
Node* prev = nullptr;
while (cur)
{
if (key == cur->_kv.first)
{
if (prev == nullptr)
{
_tables[hashi] = cur->_next;
}
else
{
prev->_next = cur->_next;
}
delete cur;
--_n;
return true;
}
prev = cur;
cur = cur->_next;
}
return false;
}
bool Insert(const pair<K, V>& kv)
{
if (_n == _tables.size())
{
vector<Node*> newtables(__stl_next_prime(_tables.size()) + 1);
for (size_t i = 0; i < _tables.size(); i++)
{
Node* cur = _tables[i];
while (cur)
{
Node* next = cur->_next;
size_t hashi = hash(cur->_kv.first) % newtables.size();
cur->_next = newtables[hashi];
newtables[hashi] = cur;
cur = next;
}
_tables[i] = nullptr;
}
_tables.swap(newtables);
}
size_t hashi = hash(kv.first) % _tables.size();
Node* newnode = new Node(kv);
newnode->_next = _tables[hashi];
_tables[hashi] = newnode;
++_n;
return true;
}
private:
vector<Node*> _tables;
size_t _n = 0;
};
}
实现细节
- 在扩容时,我们创建一个新的vector而不是复用Insert函数,因为这样可以避免不必要的节点创建和释放操作。
- 如果链表过长,可以考虑使用红黑树等其他数据结构来优化性能。
- 由于vector存储的是内置类型Node*,因此需要手动处理析构、拷贝构造和赋值重载等操作。
热门推荐
团体意外险和雇主责任险哪个贵?哪个险种更好?
明朝三次中兴:挽救危局的辉煌时刻
猫可以吃苹果吗?揭秘猫咪能否食用苹果的真相
游戏氪金的利与弊:享乐与陷阱并存的虚拟消费世界
张学良是丰田开山鼻祖?丰田公司创始人丰田喜一郎:我们要感恩他
公积金显示封存是什么意思?
移民签证申请:避免常见错误
外地人在北京退休,异地社保如何转入合并?
每年有3亿心血管病患者,远离7个危险因素,记住几点,控制病情
维普查重中怎样避免专业术语的重复!
学术期刊投稿格式要求全攻略:从基本格式到参考文献
日元在日柱的含义及其对命运的影响
买新能源车如何验车?喵哥提车iCAR 03手把手教你,这一步很重要
痛风的人做好一件小事,有利于尿酸排出
1997年属牛人2025年运势及运程详解
机器学习策略 – 中国股票收益预测
桃乃木香奈 韩国:桃乃木香奈的影响力并不局限于表演领域
明明穿很厚了却还是冷?羽绒服“这样穿”才暖和!很多人都穿错了
赛马娘繁体中文版官方版 v1.34.0最新版
今晚足球赛事转播渠道一览
中学语文教材的课文注释
暖心动物故事:收养不同物种的孤儿
企业如何承担网络安全责任:全面指南
IDEA算法安全性详解:加密结构、应用领域与未来展望
社保没交满15年的有救了,新规下,2025年开始全都这样处理
没有阳台的房子如何巧妙装修与利用空间
Excel表格怎么复制列粘贴行
直播电脑配置全攻略:从入门到专业打造高质量直播体验
国际经济政治格局分析:全球化的挑战与机遇
加班补贴和加班费在劳动法中的区别是什么