问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

RocksDB原理与实现：基于LSM-Tree的高性能数据库系统

创作时间:

作者:

@小白创作中心

RocksDB原理与实现：基于LSM-Tree的高性能数据库系统

引用

1

来源

1.

https://www.coonote.com/note/rocksdb-principle.html

RocksDB是什么？

RocksDB是Facebook开源的一个高性能嵌入式数据库系统，采用C++编写。它专注于在服务器压力下充分发挥高速存储硬件的性能，主要作为数据持久化方案，不提供网络服务。RocksDB基于LevelDB开发，从LevelDB 1.5版本fork出来。

RocksDB解决了什么问题？

RocksDB主要解决了写多读少的场景下的性能问题，通过牺牲一定的读性能来大幅提升写性能。这种设计与MySQL InnoDB的B+树结构形成对比，后者更适合读多写少的场景。

如何实现的？

RocksDB的核心是LSM-Tree（Log-Structured Merge-Tree）数据结构，通过利用磁盘顺序IO来提升写性能。以下是RocksDB的关键组件和实现细节：

LSM-Tree

LSM-Tree的核心思想是通过磁盘顺序写入来优化写性能，适用于写多读少的场景，如日志系统、海量数据存储等。在实现过程中需要解决以下问题：

数据冗余问题
读性能优化
缓存数据结构选择
缓存刷盘策略
数据一致性保证

Memtable

Memtable是一个内存数据结构，用于存储尚未落盘的数据。写入数据时首先写入Memtable，读取时也先查询Memtable。当Memtable写满后会变为Immutable Memtable，即只读状态，然后创建新的Memtable继续接收写入。Immutable Memtable会异步落盘为SST文件，之后被删除。

Memtable默认使用SkipList数据结构，原因如下：

SkipList查找下一个节点的时间复杂度为O(1)，适合实现Iterator功能
并发读写时，SkipList的锁粒度比红黑树小

落盘策略

RocksDB采用两种落盘策略：

定时刷新
阈值刷新

WAL（Write-Ahead Log）

WAL用于数据恢复，在出现宕机时可以恢复Memtable的数据。只有当Memtable中的数据落盘到SST文件后，才会删除对应的WAL日志。

SSTable（Sorted String Table）

每个Immutable Memtable都会落盘为一个SSTable文件。L0层可能有重复数据，不利于快速查找；L1~LN层会对重复数据进行合并，类似于时间轮算法，根据数据的冷热程度进行分层。

磁盘数据读性能的提升

BlockCache：RocksDB在内存中缓存数据以提高读性能，支持LRUCache和ClockCache两种实现方式。
布隆过滤器：在SST每一层增加布隆过滤器，提高查找效率。布隆过滤器能确定一定不存在，但有误判率，可通过预期存储元素个数和误判率来控制。

LSM-Tree的三大问题

读放大：LSM-Tree最多可达7层，读性能相比B+树要差。
空间放大：所有写操作都是顺序写，无效数据不会被马上清理掉。
写放大：同一条数据可能多次写入磁盘，不同层级之间可能存在重复数据。

压缩策略

为了平衡读放大、空间放大和写放大，RocksDB提供了不同的合并算法策略，默认使用Leveled Compaction和Tiered Compaction。这些策略在内存和磁盘合并过程中都支持多线程处理。

热门推荐

过年不要在亲戚、朋友面前，说这3句话

过年不要在亲戚、朋友面前，说这3句话

大黄治疗甲沟炎，效果杠杠滴！

大黄治疗甲沟炎，效果杠杠滴！

头孢克肟胶囊+复方聚维酮碘搽剂：甲沟炎治疗的黄金搭档

头孢克肟胶囊+复方聚维酮碘搽剂：甲沟炎治疗的黄金搭档

新生儿出院流程

新生儿出院流程

新生儿的护理健康评估

新生儿的护理健康评估

“奥运效应”如何提振法国经济

“奥运效应”如何提振法国经济

国人使用海参的历史

国人使用海参的历史

走出失恋阴影：户外运动让心灵重获新生

走出失恋阴影：户外运动让心灵重获新生

情感大师教你快速走出失恋阴影

情感大师教你快速走出失恋阴影

失恋后如何通过健康生活方式逆袭？

失恋后如何通过健康生活方式逆袭？

白酒的香味，全靠那2%的秘密成分

白酒的香味，全靠那2%的秘密成分

工程项目供应链管理：五大关键步骤与实用指南

工程项目供应链管理：五大关键步骤与实用指南

古人智商真不是盖的：古人抓建筑质量有多少狠招？

古人智商真不是盖的：古人抓建筑质量有多少狠招？

能源替代转向多元发展

能源替代转向多元发展

地鐵遊香港吃遍米芝蓮：港島綫東段篇

地鐵遊香港吃遍米芝蓮：港島綫東段篇

【香港地铁攻略】路线图、票价＆一日券：八达通／单程票怎么买？

【香港地铁攻略】路线图、票价＆一日券：八达通／单程票怎么买？

回锅肉的精确做法

回锅肉的精确做法

一学就会！家庭版小葱拌豆腐，简单几步，美味即成

一学就会！家庭版小葱拌豆腐，简单几步，美味即成

北海道白巧克力夹心薄饼（白色恋人）的烹饪做法，大厨教你详细做法

北海道白巧克力夹心薄饼（白色恋人）的烹饪做法，大厨教你详细做法

蓝桥杯必备：巴什博弈解题技巧全解析

蓝桥杯必备：巴什博弈解题技巧全解析

巴什博弈：从核心规则到必胜策略

巴什博弈：从核心规则到必胜策略

《鲲鹏击浪》《问苍茫》：青年毛泽东的革命青春

《鲲鹏击浪》《问苍茫》：青年毛泽东的革命青春

宜昌人口新变局：城区吸引力增强，家庭户规模缩小

宜昌人口新变局：城区吸引力增强，家庭户规模缩小

中药里的“布洛芬”——九味羌活汤，散外寒，清内热，止疼痛

中药里的“布洛芬”——九味羌活汤，散外寒，清内热，止疼痛

全球十大镇国之宝，排第一的被称为全球最贵文物

全球十大镇国之宝，排第一的被称为全球最贵文物

普朗克卫星新发现：宇宙竟是个大球？

普朗克卫星新发现：宇宙竟是个大球？

普朗克卫星揭秘：宇宙深层次的秘密

普朗克卫星揭秘：宇宙深层次的秘密

南京最美摄影点：鸡鸣寺、玄武湖、紫峰大厦

南京最美摄影点：鸡鸣寺、玄武湖、紫峰大厦

秋冬打卡南京：大报恩寺&中山陵

秋冬打卡南京：大报恩寺&中山陵

黄龙溪古镇千年火龙灯舞全新升级：传统与现代碰撞的文化盛宴

黄龙溪古镇千年火龙灯舞全新升级：传统与现代碰撞的文化盛宴

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号