eBPF技术详解:概念、架构与优势
创作时间:
作者:
@小白创作中心
eBPF技术详解:概念、架构与优势
引用
1
来源
1.
https://www.coonote.com/linux-note/ebpf.html
eBPF(扩展的伯克利数据包过滤器)是一种在Linux内核中运行的沙盒程序技术,它允许用户空间程序安全地扩展内核功能。本文将详细介绍eBPF的概念、架构、优势以及相关工具,帮助读者全面了解这一强大的技术。
什么是eBPF
eBPF 是什么呢? 从它的全称“扩展的伯克利数据包过滤器 (Extended Berkeley Packet Filter)” 来看,它是一种数据包过滤技术,是从 BPF (Berkeley Packet Filter) 技术扩展而来的。顾名思义BPF来源于伯克利大学,
最早应用于网络数据包过滤器,它比当时最先进的抓包技术快20倍,其主要得利于它的两个设计:
- 内核态引入一个新的虚拟机,所有指令都在内核虚拟机中运行。
- 用户态使用 BPF 字节码来定义过滤表达式,然后传递给内核,由内核虚拟机解释执行。
BPF 提供了一种在内核事件和用户程序事件发生时安全注入代码的机制,这就让非内核开发人员也可以对内核进行控制。
eBPF 则是对对BPF的一些扩展,将原本单一的数据包过滤事件逐步扩展到了内核态函数、用户态函数、跟踪点、性能事件(perf_events)以及安全控制等。eBPF 不仅扩展了寄存器的数量,引入了全新的 BPF 映射存储。
eBPF 程序架构强调安全性和稳定性,看上去更像内核模块,但与内核模块不同,eBPF 程序不需要重新编译内核,并且可以确保 eBPF 程序运行完成,而不会造成系统的崩溃。
eBPF 程序并不像常规的线程那样,启动后就一直运行在那里,它需要事件触发后才会执行。这些事件包括系统调用、内核跟踪点、内核函数和用户态函数的调用退出、网络事件,等等。借助于强大的内核态插桩(kprobe)和用户态插桩(uprobe),eBPF 程序几乎可以在内核和应用的任意位置进行插桩。
eBPF架构
eBPF 分为用户空间程序和内核程序两部分:
- 用户空间程序负责加载 BPF 字节码至内核,如需要也会负责读取内核回传的统计信息或者事件详情
- 内核中的 BPF 字节码负责在内核中执行特定事件,如需要也会将执行的结果通过 maps 或者 perf-event 事件发送至用户空间
- 其中用户空间程序与内核 BPF 字节码程序可以使用 map 结构实现双向通信,这为内核中运行的 BPF 字节码程序提供了更加灵活的控制
交互流程如下所示:
通常我们借助 LLVM 把编写的 eBPF 程序转换为 BPF 字节码,然后再通过 bpf 系统调用提交给内核执行。内核在接受 BPF 字节码之前,会首先通过验证器对字节码进行校验(不能包含无限循环、不能导致内核崩溃、必须在有限时间内完成),只有校验通过的 BPF 字节码才会提交到即时编译器执行。
BPF 程序可以利用 BPF 映射(map)进行存储,而用户程序通常也需要通过 BPF 映射同运行在内核中的 BPF 程序进行交互。如下图所示,在性能观测中,BPF 程序收集内核运行状态存储在映射中,用户程序再从映射中读出这些状态。
eBPF优势
- 速度和性能。 eBPF 可以将数据包处理这项工作从内核空间转移到用户空间。同时,eBPF 还支持即时 (JIT) 编译器。在字节码被(JIT)编译完成后,会直接调用 eBPF,而不是对每个方法的字节码进行新的解释。
- 低侵入性。 当作为调试器时,eBPF 不需要停止程序来观察其状态。
- 安全。 程序被有效地沙箱化了,这意味着内核源代码仍然受到保护并保持不变。eBPF程序的验证步骤确保资源不会被运行无限循环的程序阻塞。
- 方便。 创建hook内核函数的代码比构建和维护内核模块的工作要少。
- 统一追踪。 eBPF 为我们提供了一个单一、强大且易于访问的流程跟踪框架,这增加了可见性和安全性。
- 可编程性。 使用 eBPF 有助于在不添加额外层的情况下增加环境的功能丰富性。由于代码直接在内核中运行,因此可以在 eBPF 事件之间存储数据,而不是像其他跟踪器那样转储数据。
- 表现力。 eBPF 具有丰富的表现力,能够执行通常只能在高级语言中才能找到的功能。
eBPF相关工具
- BCC
BCC 是 BPF 的编译工具集合,前端提供 Python/Lua API,本身通过 C/C++ 语言实现,集成 LLVM/Clang 对 BPF 程序进行重写、编译和加载等功能, 提供一些更人性化的函数给用户使用。BCC通常用在开发复杂的 eBPF 程序中,其内置的各种小工具也是目前应用最为广泛的 eBPF 小程序。 - bpftrace
bpftrace 在 eBPF 和 BCC 之上构建了一个简化的跟踪语言,通过简单的几行脚本,就可以实现复杂的跟踪功能。因此,在编写简单的 eBPF 程序,特别是编写的 eBPF 程序用于临时的调试和排错时,你可以考虑直接使用 bpftrace ,而不需要用 C 或 Python 去开发一个复杂的程序。
- libbpf
libbpf是从内核中抽离出来的标准库,用它开发的 eBPF 程序可以直接分发执行,这样就不需要每台机器都安装 LLVM 和内核头文件了。不过,它要求内核开启 BTF 特性,需要非常新的发行版才会默认开启(如 RHEL 8.2+ 和 Ubuntu 20.10+ 等)。 - go libary
使用这些 Go 语言开发库时需要注意,Go 开发库只适用于用户态程序中,可以完成 eBPF 程序编译、加载、事件挂载,以及 BPF 映射交互等用户态的功能,而内核态的 eBPF 程序还是需要使用 C 语言来开发的。
热门推荐
豆汁的五大营养及功效
在科技不发达的古代,银票是如何防伪的呢
商业保险继承的相关问题
陈必彬:矿产开发商模式增强矿企抗风险性
10万以内SUV性价比大比拼,谁才是真正的“家用神车”?
如何用简洁的语言讲解复杂的研究问题?
全球热带农业创新大会在三亚成功举办,中国热科院牵头发起科技创新联盟
尼美舒利分散片能喝酒吗
内部晋升or跳槽升职?100位谷歌华人技术大咖快速升迁的独家秘诀
西昌学院:四川省首批整体转型试点院校
张宇翻唱《趁早》:一首关于放手与释怀的深情之作
关系中出现这10个信号,离分手就不远了
如何选择合适的珠宝材质?这些材质有哪些特点和优劣?
北京协和研究发现:过午不食可改善血糖,但并非人人适用
合理避税是否能有效减少税务负担
雷军,为何能让网友“上头”?
行业市场分析从哪些方面评估市场规模?
技术领先的衡量标准是什么?技术领先在市场竞争中的优势有哪些?
老北京豆汁儿制作过程(豆汁的传统制作秘籍!)
如何通过分析收入负债比来优化企业财务风险管理?
手机短信设置在哪里
拿到的是到手收入,如何反推税前收入和个税
MySQL 窗口函数详解:分析性查询的强大工具
花狸猫养护指南,温馨宠物家打造
梵语中象征自由的词
五分钟了解《第二次世界大战》1939年——1945年大事年表
什么是封邦建国?其历史背景与影响解析
李开复、王小川等四代创业者智源大会共话AGI:从商业价值到边际成本的多元视角
瓷砖拖把哪种好用?清洁瓷砖的最佳选择
汕尾海丰美食全攻略:从金针菜到油占米,探寻岭南特色美食