资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

什么是负载均衡之LVS？详解其工作原理与应用

创作时间:

作者:

@小白创作中心

什么是负载均衡之LVS？详解其工作原理与应用

引用

来源

https://www.shuhaiyun.com/asy/192192.html

LVS（Linux Virtual Server）是一种高性能、高可用性的负载均衡解决方案，通过将多个真实服务器组合成一个虚拟服务器，以提高系统的处理能力和可靠性。本文将详细介绍LVS的基本概念、工作原理、组成结构、常用术语、工作模式、调度算法以及共享存储机制。

LVS基本介绍

什么是LVS？

LVS是Linux Virtual Server的简称，即Linux虚拟服务器，它是一个基于IP层的负载均衡技术，通过将多个真实服务器（Real Server）组合成一个虚拟服务器（Virtual Server），以提高系统的处理能力和可靠性。LVS不仅能够实现负载均衡，还能提供高可用性和可扩展性。

LVS的架构和原理

LVS的架构主要包括三个部分：负载调度器（Load Balancer）、服务器池（Server Pool）和共享存储（Shared Storage）。负载调度器负责接收客户端请求，并根据设定的调度算法将请求转发到服务器池中的某一台真实服务器。服务器池由多台真实服务器组成，这些服务器可以运行在不同的操作系统上，如Linux、Windows等。共享存储用于存储全局配置文件和状态信息，以保证所有真实服务器的数据一致性。

LVS的优势

高性能：LVS工作在内核层，能够高效处理大量并发请求。
高可用性：通过配置Keepalived等工具，可以实现高可用性，确保服务的持续运行。
灵活性强：支持多种负载均衡算法和转发模式，适应不同的应用场景。
成本低廉：LVS是开源软件，无需支付昂贵的许可证费用。

LVS的工作原理

工作流程

当用户向负载均衡调度器（Director Server）发起请求时，该请求会先到达PREROUTING链。PREROUTING链判断目标IP是否为本机，如果是则将数据包送至INPUT链。IPVS比对数据包请求的服务是否为集群服务，若是则修改数据包的目标IP地址及端口，并将新的数据包发往POSTROUTING链。POSTROUTING链通过选路，将数据包最终发送给后端的真实服务器（Real Server）。

数据包流转详细步骤

用户请求到达Director Server：用户请求首先到达负载均衡调度器的PREROUTING链。
PREROUTING链检查目标IP：如果数据包的目标IP是本机，则将数据包送至INPUT链。
IPVS比对服务：IPVS比对数据包请求的服务是否为集群服务，如果是则进行下一步处理。
修改目标IP地址及端口：IPVS修改数据包的目标IP地址为后端服务器的IP地址，并修改目标端口后，将数据包发往POSTROUTING链。
POSTROUTING链选路：POSTROUTING链通过选路机制，将数据包发送给对应的Real Server。
Real Server处理请求：Real Server接收到请求后进行处理，构建响应报文发回Director Server。
Director Server响应客户端：Director Server在响应客户端前，会将源IP地址修改为自己的VIP地址，然后响应给客户端。

LVS的组成

ipvs：ipvs是一段工作在内核空间的代码，是LVS的核心组件之一，它负责实现负载均衡调度功能，包括数据包的接收、转发以及目标IP地址的修改等操作。
ipvsadm：ipvsadm是一段工作在用户空间的代码，负责为ipvs内核框架编写规则，定义谁是集群服务，而谁是后端真实的服务器（Real Server）。它提供了管理LVS的配置接口，使得用户可以方便地添加、删除和管理虚拟服务器和真实服务器。

LVS相关术语

VS（Virtual Server）：虚拟服务，指LVS提供的虚拟化服务。
DS（Director Server）：前端负载均衡器节点，负责接收客户端请求并将其转发给后端服务器。
RS（Real Server）：后端真实的工作服务器，处理实际的业务逻辑。
VIP（Virtual IP）：虚拟IP地址，对外直接面向用户请求的目标IP地址。
DIP（Director Server IP）：负载均衡器的实际IP地址，主要用于内部通信。
RIP（Real Server IP）：后端真实服务器的IP地址。
CIP（Client IP）：访问客户端的IP地址。

LVS的工作模式

NAT模式（Network Address Translation）

NAT模式原理：NAT模式下，Director Server作为所有服务器节点的网关，客户端请求经过Director Server后被转发到后端的Real Server，Real Server处理完成后将响应返回给Director Server，再由Director Server返回给客户端。这种模式下，外部网络看到的只是Director Server的VIP地址，而不知道后端Real Server的存在。
NAT模式特点：
Real Server使用私有IP地址，网关指向DIP。
DIP与RIP必须在同一网段内。
Director Server作为所有服务器节点的网关，请求和响应报文都需要经过Director Server。
支持端口映射。
高负载场景中，Director Server容易成为性能瓶颈。

DR模式（Direct Routing）

DR模式原理：DR模式下，Director Server仅作为整个群集对外的透明代理，不修改数据包的目标MAC地址，而是将请求报文的MAC地址修改为选出的Real Server的MAC地址，Real Server根据MAC地址接收请求并处理，然后将响应直接返回给客户端。这种模式下，Director Server和Real Server必须在同一个物理网络中。
DR模式特点：
Real Server可以使用私有地址或公网地址。
Real Server和Director Server必须在同一个物理网络中。
请求报文经由Director Server，但响应报文不经过Director Server。
不支持地址转换和端口映射。
Real Server上的lo接口配置VIP的IP地址。

TUN模式（IP Tunneling）

TUN模式原理：TUN模式下，Director Server在原有的IP报文外再次封装多一层IP首部，内部IP首部的源地址为CIP，目标地址为VIP；外部IP首部的源地址为DIP，目标地址为RIP。Real Server收到请求后解开封装，处理完成后将响应报文直接返回给客户端。这种模式适用于后端服务器分散在不同地理位置的场景。
TUN模式特点：
Real Server可以使用公网地址。
Director Server只负责处理入站请求，响应报文由Real Server直接返回给客户端。
支持跨网络的服务器集群部署。
不支持端口映射。

FULLNAT模式：FULLNAT模式是阿里自主研发的一种模式，目前尚未公开详细资料。这种模式下，Director Server同时修改请求报文的源IP地址和目标IP地址进行转发，具体细节较少公开，但在实际应用中有一定的局限性。

LVS的调度算法

静态调度算法

轮询调度（RR, Round Robin）：轮询调度算法将收到的访问请求按照顺序轮流分配给各台内部服务器上，均等地对待每一台服务器，不考虑服务器的实际连接数和系统负载。算法简洁，适用于服务器性能相近的场景。
加权轮询调度（WRR Weighted Round Robin）：加权轮询调度算法根据服务器的处理能力分配不同的权重，权重越高分配到的请求越多。服务器A的权重为1，服务器B的权重为2，那么调度到服务器B的请求将是服务器A的两倍。适用于服务器性能差异较大的场景。
源地址散列调度（SH Source Hashing）：源地址散列调度算法通过哈希函数计算请求源IP地址的散列值，根据散列值将请求分配给固定的服务器资源。这种算法适用于需要会话绑定的场景，确保同一客户端的请求总是分配到同一台服务器。
目标地址散列调度（DH Destination Hashing）：目标地址散列调度算法通过对目标IP地址进行哈希计算，将请求分配给特定的服务器。这种算法适用于缓存服务器的场景，提高缓存命中率。

动态调度算法

最少连接调度（LC Least Connection）：最少连接调度算法将新的连接请求分配给当前连接数最少的服务器，动态地考虑每台服务器的实时连接数。适用于长时间处理请求的场景，确保负载均衡。
加权最少连接调度（WLC Weighted Least Connection）：加权最少连接调度算法在最少连接的基础上引入权重因子，根据服务器的性能分配不同的权重，权重越高的服务器分配到的请求越多。适用于服务器性能差异较大的场景。
最短期望延迟调度（SED Shortest Expectation Delay）：最短期望延迟调度算法不考虑非活动连接，优先选择权重大的服务器接收请求。适用于需要快速响应的场景，确保高优先级的请求得到及时处理。
最少队列调度（NQ Never Queue）：最少队列调度算法无需队列等待，如果有real server的连接数为0就直接分配过去。适用于需要快速响应的场景，减少请求等待时间。
基于局部性的最少连接调度（LBLC Locality-Based Least Connection）：基于局部性的最少连接调度算法针对目标IP地址的负载均衡，确保同一目标IP地址的请求分配到同一台服务器。适用于需要会话保持的场景。
带复制的基于局部性最少连接调度（LBLCR LBLC with Replication）：带复制的基于局部性最少连接调度算法维护一组目标IP地址到服务器的映射表，确保请求尽可能分配到同一台服务器。适用于需要高会话保持的场景，减少服务器间切换带来的开销。