问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

HashMap的工作原理详解:数组、链表与红黑树的完美结合

创作时间:
作者:
@小白创作中心

HashMap的工作原理详解:数组、链表与红黑树的完美结合

引用
CSDN
1.
https://blog.csdn.net/Huang405267467/article/details/124688466

什么是HashMap?

HashMap是基于哈希表的Map接口实现,提供了所有可选的映射操作,并允许使用null值和null键。除了非同步和允许使用null之外,HashMap类与Hashtable大致相同。此类不保证映射的顺序,特别是它不保证该顺序恒久不变。此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get和put)提供稳定的性能。迭代collection视图所需的时间与HashMap实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。因此,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。

HashMap的内部结构

HashMap是由数组和链表组成的复合结构,其主干是数组,数组被分为一个个桶(bucket),每个桶存储有一个或多个键值对,每个键值对也称为Entry,通过哈希值决定了Entry对象在这个数组的下标;哈希值相同的Entry对象(键值对),则以链表形式存储。

内部结构之数组

当我们创建了一个HashMap对象时,并且往HashMap中传入了三个键值对(Entry)时,其结构大致如下:

当插入第一个键值对Entry1时,调用put方法:

map.put(99, "huang");

key为99,此时会通过哈希函数hash()计算key的值,假如计算的结果为333(这里仅为假设,计算的结果并不是真的为333),那么就将键值对(Entry1)放入到对应下标中。

Entry2与Entry3也是如此。

需要注意的是:

  1. HashMap中数组长度的原始大小为16,并不是上面展示的长度,且数组的初始值都为null。
  2. 并不是通过hashCode()计算key来获得hash值,而是通过另外的计算方式,这里不展开讲,具体可以自行搜索hash函数。

结合上面所说的,可以简单做一个小结:

当调用put方法的时候,比如调用map.put(99, "huang"),插入一个Key为99的元素。这时候我们需要利用一个哈希函数来确定Entry1的插入位置(index):

index = Hash(99)

假定最后计算出的index是333,那么就将这个Entry1存入到数组中下标为333的位置。

当然,数组的长度是有限的,而插入的Entry会越来越多,这个时候又该如何存储呢?这个时候就需要用到链表了。

内部结构之链表

此时我们再调用put方法:

map.put(520, "liuliu");

此时通过哈希函数计算得到的下标为333,而下标333处有一个Entry1,这时就出现了"hash冲突"。该如何插入呢?

HashMap数组的每一个元素不止是一个Entry对象,也是一个链表的头节点。每一个Entry对象通过Next指针指向它的下一个Entry节点。当新来的Entry映射到冲突的数组位置时,只需要插入到对应的链表即可,而插入是根据"头插法"进行插入:

接下来,当我们想要修改Entry1中value的值时,过程如下:

调用put方法:

map.put(99, "gege");

key一样,调用哈希函数计算出的值当然也一样!此时已经确定了存入的Entry18应该在下标为333的位置。此时会去查询链表,根据equals方法,查询当前的key:99 是否存在,如果存在,则用新的Entry覆盖旧的Entry。如果不存在则再次使用"头插法"将当前Entry插入到链表中。

所以这里的key=99 是存在的,因为Entry1的key为99,查询到了相同的key,则用Entry18覆盖Entry1:

Put方法与Get方法原理

上面介绍的即为Put方法原理,同时在修改value值中也涉及了Get方法原理。这里也细致展开Get方法原理:

当我们调用Get方法:

map.get(99);

我们想要找到key为99的value,那么过程是怎么样的呢?

首先根据哈希函数计算出key的值,可以算出其结果为333,则此时根据下标333处的链表来查询key。使用equals方法比对Entry17的key,返回结果为false,则继续查询,比对Entry18的key,返回结果为ture。表示已经匹配到了正确的key。再获取对应的value:gege。这就是Get方法的步骤了。

get方法总结:

  1. 通过hash函数计算key的值,得到一个数组下标
  2. 使用equals方法去比对下标处的头节点的key。
  3. 遍历链表,直至找到对应的key,返回value值。

是不是很容易理解了。

JDK1.7与JDK1.8中HashMap的区别

在JDK1.7中HashMap主要结构为:数组+链表。

在JDK1.8中HashMap主要结构为:数组+链表+红黑树。为什么要加入红黑树呢?学过的人都应该知道,红黑树查询是非常快的。设想一个情况,当我们插入的Entry非常多时,我们的链表会长的可怕,这个时候去遍历链表寻找对应的key,所花费的时间可想而知的恐怖。加入红黑树可以优化查询的时间,使查询效率快上不少。那么在JDK1.8的HashMap中,当链表的长度超过8时,链表会自动转化为红黑树,优化查询速度。同时还有一个区别:发生"hash冲突"时,我们上面的做法是"头插法",这是JDK1.7的做法,而在JDK1.8中,使用的是"尾插法"。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号