问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

深入理解一致性Hash和虚拟节点

创作时间:

作者:

@小白创作中心

深入理解一致性Hash和虚拟节点

引用

CSDN

1.

https://blog.csdn.net/weixin_40357923/article/details/140339159

在分布式系统中，如何高效地存储和检索数据是一个核心问题。一致性哈希算法作为一种重要的数据分布策略，被广泛应用于负载均衡、分布式缓存分区和数据库分库分表等场景。本文将深入探讨一致性哈希算法的工作原理及其优势，并介绍虚拟节点的概念及其在解决哈希环倾斜问题中的作用。

为什么需要一致性哈希算法

假设现在有三台缓存服务器（缓存服务器A、缓存服务器B、缓存服务器C），需要将数据预热到这三台服务器上。使用负载均衡的方法可以将数据均匀地分发到三台缓存服务器上，但在读取缓存的热点数据时会遇到困难，因为不清楚数据被缓存在哪台服务器上。

通过轮询缓存服务器的方式读取缓存的热点数据，效率会变得非常低，接口的响应时间也会变长，从而导致用户体验变差。这是因为负载均衡方案无法快速定位数据所在的服务器，需要轮询服务器来获取数据。

为了解决这个问题，提出了使用Hash算法。Hash算法通过计算数据key的hash值，然后将这个hash值与服务器的台数取模，来决定当前的数据存放在哪台服务器上。读取数据时，同样通过计算数据key的hash值并取模来定位数据所在的服务器。

但是，Hash算法也存在一个严重的缺陷：当服务器数量发生变化（增加或减少）时，定位数据的位置也会变动，导致无法获取数据的问题。例如，假设现在增加或减少服务器数量，使用hash（key）% 服务器数量的方式定位数据就会出现问题，因为服务器数量的变化导致原先数据定位不准。这可能会导致大量请求无法命中缓存，从而给资源服务器带来巨大压力，甚至导致服务崩溃。

一致性哈希算法和虚拟节点

为了解决上述问题，提出了一致性哈希算法。一致性哈希算法是对2^32方取模，从0到2^32形成一个圆环，称为hash环。通过计算服务器IP的hash值（hash(服务器的ip) % 2^32 = X），可以确定服务器在圆环上的位置。

数据存储定位

如何确定数据存放在哪个服务器上呢？如下图所示：

对于数据A，可以通过计算hash(数据A) % 2^32 = LA来确定其在圆环上的位置，然后顺时针方向查找距离数据A最近的服务器。发现是服务器A，那么将数据A存放到服务器A上。同理，数据B也会存放在服务器A上。

服务器增减的影响

假设现在服务器C下线了，如下图所示：

此时，数据A的定位没有问题，但数据C从原先的服务器C上定位到服务器A上，导致数据C无法获取。换句话说，虽然服务器C下线了，但只是部分数据异常，不会导致整个服务集群数据错乱。

假设现在增加了一台机器D，那么也只会导致部分数据出现错乱。此时只需要将错乱的这一部分数据迁移到服务器D上，就可以实现数据的同步。理想状态下，一致性哈希算法是很完美的。

解决哈希环倾斜问题

然而，在极端情况下，由于离散性差的问题，服务器可能会集中分布在一起，如下图所示：

此时数据又刚好落在服务器C和服务器A之间的区域上，如下图所示：

这样就导致所有的数据压力都到了服务器A上，服务器B和服务器C几乎不起作用。如果服务器A挂了，那么整个缓存就失效了。为了解决这个问题，引入了虚拟节点的概念。

虚拟节点的作用

虚拟节点是将真实的服务器通过虚拟化的方式复制一些节点出来，成为虚拟节点。通过虚拟节点的加入，可以避免所有数据都集中到一台机器上，同时虚拟节点越多，缓存数据越均匀分布。

总结

一致性哈希算法常用于负载均衡、分布式缓存分区、数据库分库分表等场景。
为防止服务器上的数据倾斜问题，通常通过增加虚拟节点的方式来让数据更加均匀地分布在机器上。

热门推荐

青春践行“两山理论”，助力乡村振兴——南航金城学院“绿融振兴”团队调研纪实

青春践行“两山理论”，助力乡村振兴——南航金城学院“绿融振兴”团队调研纪实

MATLAB拟合工具箱（cftool）使用教程：从基础操作到模型预测

MATLAB拟合工具箱（cftool）使用教程：从基础操作到模型预测

网速慢？网线选对了吗？！网线类型对应带宽等详细参数

网速慢？网线选对了吗？！网线类型对应带宽等详细参数

8家农商行总资产过5000亿这家银行利息净收入逆势增长

8家农商行总资产过5000亿这家银行利息净收入逆势增长

花石榴的分支点高度：如何修剪才能既稳固又美观？

花石榴的分支点高度：如何修剪才能既稳固又美观？

任务管理器怎么打开？六种方法，最后一个简单到只有一步

任务管理器怎么打开？六种方法，最后一个简单到只有一步

【每日收评】全市场近300股涨停！短线炒作持续火爆，并购重组概念强者恒强

【每日收评】全市场近300股涨停！短线炒作持续火爆，并购重组概念强者恒强

上坟用什么蜡烛？红蜡还是白蜡？

上坟用什么蜡烛？红蜡还是白蜡？

专利转让关键注意事项全解析

专利转让关键注意事项全解析

干咳转湿咳是好转还是恶化？

干咳转湿咳是好转还是恶化？

session，cookie和token究竟是什么

session，cookie和token究竟是什么

如何比较不同交易所的黄金ETF产品？这些产品的差异体现在哪些方面？

如何比较不同交易所的黄金ETF产品？这些产品的差异体现在哪些方面？

汽车的空调滤芯多久更换一次？

汽车的空调滤芯多久更换一次？

讲讲阿拉的好日子：上海人眼里的城市生活变化

讲讲阿拉的好日子：上海人眼里的城市生活变化

金九银十！2024全国赏秋地图出炉十大推荐地带你体验绝美秋色

金九银十！2024全国赏秋地图出炉十大推荐地带你体验绝美秋色

释放PoE交换机的潜力：以太网供电交换机综合指南

释放PoE交换机的潜力：以太网供电交换机综合指南

【网络设备POE兼容性解决方案】：保证设备间无缝对接的技巧

【网络设备POE兼容性解决方案】：保证设备间无缝对接的技巧

集团化办学，探索优质教育资源共享新模式

集团化办学，探索优质教育资源共享新模式

氟橡胶定制件的密封性能及应用实例

氟橡胶定制件的密封性能及应用实例

火漆印章的深层含义与使用场合：全面解读其历史、文化及现代应用

火漆印章的深层含义与使用场合：全面解读其历史、文化及现代应用

火漆印章的深层含义与使用场合：全面解读其历史、文化及现代应用

火漆印章的深层含义与使用场合：全面解读其历史、文化及现代应用

探索声品质：如何用心理声学提升车内听觉体验

探索声品质：如何用心理声学提升车内听觉体验

人工智能生成画像的技术原理与应用

人工智能生成画像的技术原理与应用

如何在企业中实施行政管理创新？

如何在企业中实施行政管理创新？

哪里可以找到劳务合同模板？

哪里可以找到劳务合同模板？

宁波栎社国际机场：从抗战英雄机场到全国大型繁忙机场

宁波栎社国际机场：从抗战英雄机场到全国大型繁忙机场

零冷水回水管铺设攻略：多种方案优缺点解析及适用场景

零冷水回水管铺设攻略：多种方案优缺点解析及适用场景

如何实现项目时间管理目标并提高效率？

如何实现项目时间管理目标并提高效率？

【骑行勇士必读】侧风来袭：如何在狂风中稳如泰山

【骑行勇士必读】侧风来袭：如何在狂风中稳如泰山

合肥附近值得一游的地方(合肥周边的旅游城市)

合肥附近值得一游的地方(合肥周边的旅游城市)

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号