HashMap的工作原理详解:数组、链表与红黑树的完美结合
HashMap的工作原理详解:数组、链表与红黑树的完美结合
什么是HashMap?
HashMap是基于哈希表的Map接口实现,提供了所有可选的映射操作,并允许使用null值和null键。除了非同步和允许使用null之外,HashMap类与Hashtable大致相同。此类不保证映射的顺序,特别是它不保证该顺序恒久不变。此实现假定哈希函数将元素适当地分布在各桶之间,可为基本操作(get和put)提供稳定的性能。迭代collection视图所需的时间与HashMap实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。因此,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
HashMap的内部结构
HashMap是由数组和链表组成的复合结构,其主干是数组,数组被分为一个个桶(bucket),每个桶存储有一个或多个键值对,每个键值对也称为Entry,通过哈希值决定了Entry对象在这个数组的下标;哈希值相同的Entry对象(键值对),则以链表形式存储。
内部结构之数组
当我们创建了一个HashMap对象时,并且往HashMap中传入了三个键值对(Entry)时,其结构大致如下:
当插入第一个键值对Entry1时,调用put方法:
map.put(99, "huang");
key为99,此时会通过哈希函数hash()计算key的值,假如计算的结果为333(这里仅为假设,计算的结果并不是真的为333),那么就将键值对(Entry1)放入到对应下标中。
Entry2与Entry3也是如此。
需要注意的是:
- HashMap中数组长度的原始大小为16,并不是上面展示的长度,且数组的初始值都为null。
- 并不是通过hashCode()计算key来获得hash值,而是通过另外的计算方式,这里不展开讲,具体可以自行搜索hash函数。
结合上面所说的,可以简单做一个小结:
当调用put方法的时候,比如调用map.put(99, "huang")
,插入一个Key为99的元素。这时候我们需要利用一个哈希函数来确定Entry1的插入位置(index):
index = Hash(99)
假定最后计算出的index是333,那么就将这个Entry1存入到数组中下标为333的位置。
当然,数组的长度是有限的,而插入的Entry会越来越多,这个时候又该如何存储呢?这个时候就需要用到链表了。
内部结构之链表
此时我们再调用put方法:
map.put(520, "liuliu");
此时通过哈希函数计算得到的下标为333,而下标333处有一个Entry1,这时就出现了"hash冲突"。该如何插入呢?
HashMap数组的每一个元素不止是一个Entry对象,也是一个链表的头节点。每一个Entry对象通过Next指针指向它的下一个Entry节点。当新来的Entry映射到冲突的数组位置时,只需要插入到对应的链表即可,而插入是根据"头插法"进行插入:
接下来,当我们想要修改Entry1中value的值时,过程如下:
调用put方法:
map.put(99, "gege");
key一样,调用哈希函数计算出的值当然也一样!此时已经确定了存入的Entry18应该在下标为333的位置。此时会去查询链表,根据equals方法,查询当前的key:99 是否存在,如果存在,则用新的Entry覆盖旧的Entry。如果不存在则再次使用"头插法"将当前Entry插入到链表中。
所以这里的key=99 是存在的,因为Entry1的key为99,查询到了相同的key,则用Entry18覆盖Entry1:
Put方法与Get方法原理
上面介绍的即为Put方法原理,同时在修改value值中也涉及了Get方法原理。这里也细致展开Get方法原理:
当我们调用Get方法:
map.get(99);
我们想要找到key为99的value,那么过程是怎么样的呢?
首先根据哈希函数计算出key的值,可以算出其结果为333,则此时根据下标333处的链表来查询key。使用equals方法比对Entry17的key,返回结果为false,则继续查询,比对Entry18的key,返回结果为ture。表示已经匹配到了正确的key。再获取对应的value:gege。这就是Get方法的步骤了。
get方法总结:
- 通过hash函数计算key的值,得到一个数组下标
- 使用equals方法去比对下标处的头节点的key。
- 遍历链表,直至找到对应的key,返回value值。
是不是很容易理解了。
JDK1.7与JDK1.8中HashMap的区别
在JDK1.7中HashMap主要结构为:数组+链表。
在JDK1.8中HashMap主要结构为:数组+链表+红黑树。为什么要加入红黑树呢?学过的人都应该知道,红黑树查询是非常快的。设想一个情况,当我们插入的Entry非常多时,我们的链表会长的可怕,这个时候去遍历链表寻找对应的key,所花费的时间可想而知的恐怖。加入红黑树可以优化查询的时间,使查询效率快上不少。那么在JDK1.8的HashMap中,当链表的长度超过8时,链表会自动转化为红黑树,优化查询速度。同时还有一个区别:发生"hash冲突"时,我们上面的做法是"头插法",这是JDK1.7的做法,而在JDK1.8中,使用的是"尾插法"。