问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

RAG 常见分块策略全解析：从原理到代码实践（2025 深度版）

创作时间:

作者:

@小白创作中心

RAG 常见分块策略全解析：从原理到代码实践（2025 深度版）

引用

CSDN

1.

https://blog.csdn.net/zengzizi/article/details/146166925

在检索增强生成（RAG）系统中，分块策略是决定系统性能的关键因素。本文基于2023-2025年最新研究成果，深度剖析12种分块方法的实现原理，并通过Python代码演示其应用场景。

引言

在检索增强生成（RAG）系统中，分块策略是决定系统性能的基石。本文基于 2023 - 2025 年最新研究成果，深度剖析 12 种分块方法的实现原理，并通过 Python 代码演示其应用场景。

一、为什么需要分块？

1.1 上下文窗口限制

RAG 模型中的检索部分会从文档库中检索与用户查询相关的文本块，这些文本块将作为上下文输入到生成模型中。然而，生成模型（如大型语言模型，LLM）的上下文窗口是有限的，这意味着它能够处理的输入文本长度是有限制的。例如，许多 LLM 的上下文窗口最多只能容纳 2048 个令牌（tokens）。如果检索到的文本块过大，超出了这个限制，就无法完整地输入到生成模型中，从而可能导致生成的响应不准确或不完整。通过将文档分块，可以确保每个块的大小都在生成模型的上下文窗口范围内，从而使模型能够有效地处理和生成高质量的响应。

大型语言模型（LLM）存在严格的 Token 限制&

热门推荐

揭秘中国熊猫金币的收藏价值与市场行情

揭秘中国熊猫金币的收藏价值与市场行情

合同诈骗罪共同犯罪需要什么证据

合同诈骗罪共同犯罪需要什么证据

热处理烧结马弗炉适用于哪些材料

热处理烧结马弗炉适用于哪些材料

马弗实验炉：实验室中的高温处理专家

马弗实验炉：实验室中的高温处理专家

动物行为与电生理专题①丨啮齿动物睡眠剥夺中的脑电和肌电记录

动物行为与电生理专题①丨啮齿动物睡眠剥夺中的脑电和肌电记录

从思维出发到实践落地重庆高校培养复合型新闻人才

从思维出发到实践落地重庆高校培养复合型新闻人才

期指交易：策略与风险控制的关键洞察

期指交易：策略与风险控制的关键洞察

光合作用研究中的气孔观测

光合作用研究中的气孔观测

植物的光合作用与气孔调节过程

植物的光合作用与气孔调节过程

秋游首选！这10个地方太合适现在出发

秋游首选！这10个地方太合适现在出发

手腕疼痛动不了，小心得了腱鞘炎

手腕疼痛动不了，小心得了腱鞘炎

尽全切+保功能「双保险」颅咽管瘤手术才能安全下车！巴教授天坛医院手术纪实

尽全切+保功能「双保险」颅咽管瘤手术才能安全下车！巴教授天坛医院手术纪实

打牌违法吗？春节期间打牌娱乐违法吗？专家解读

打牌违法吗？春节期间打牌娱乐违法吗？专家解读

公司未实缴资本的影响及股东退出、房产转让税务问题解析

公司未实缴资本的影响及股东退出、房产转让税务问题解析

美国大学本科专业设置五大类详解

美国大学本科专业设置五大类详解

酒后皮肤过敏该怎么办

酒后皮肤过敏该怎么办

物业费、水电费、赔偿金被拖欠？物业公司这样应对！

物业费、水电费、赔偿金被拖欠？物业公司这样应对！

品牌管理调研分析提升品牌价值与影响力的有效途径

品牌管理调研分析提升品牌价值与影响力的有效途径

怎么判断自己得了焦虑症

怎么判断自己得了焦虑症

磷酸二氢钾：使用频率与效果提升的小秘密！

磷酸二氢钾：使用频率与效果提升的小秘密！

如何有效提升工作效能？

如何有效提升工作效能？

马龙的十项伟大纪录：巅峰生涯的无可比拟

马龙的十项伟大纪录：巅峰生涯的无可比拟

骨水泥手术自费 VS 健保优缺点？术後注意事項解答

骨水泥手术自费 VS 健保优缺点？术後注意事項解答

谷雨养生重"除湿" 中医教你1茶饮治失眠、去胃湿用3穴位养生好简单

谷雨养生重"除湿" 中医教你1茶饮治失眠、去胃湿用3穴位养生好简单

谷雨吃3宝，不往医院跑：这3宝要记得吃，祛湿降火增免疫

谷雨吃3宝，不往医院跑：这3宝要记得吃，祛湿降火增免疫

你喝的水真的够了吗？这个公式让健康看得见

你喝的水真的够了吗？这个公式让健康看得见

格律诗的基础——平仄、押韵简略讲解，规则及注意事项

格律诗的基础——平仄、押韵简略讲解，规则及注意事项

陈叔宝在位期间有哪些为政举措？后世如何评价他？

陈叔宝在位期间有哪些为政举措？后世如何评价他？

李煜与陈叔宝：两位亡国“后主”的不同命运

李煜与陈叔宝：两位亡国“后主”的不同命运

普法课堂丨起诉时，如何确定案件的当事人法院告诉你答案！

普法课堂丨起诉时，如何确定案件的当事人法院告诉你答案！

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号