资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

DeepSeek+Ragflow搭建个人知识库实践指南

创作时间:

作者:

@小白创作中心

DeepSeek+Ragflow搭建个人知识库实践指南

引用

来源

https://www.bmabk.com/index.php/post/315777.html

Ragflow是一个开源的知识库框架，可以帮助用户快速搭建基于大语言模型的个人知识库。DeepSeek则是一个轻量级的大语言模型，特别适合个人部署和使用。本文将详细介绍如何使用DeepSeek和Ragflow搭建个人知识库的全过程。

一、安装Docker Desktop

由于Docker依赖Linux环境，Windows 10及以上的电脑可以使用WSL（Windows Subsystem for Linux）来安装Linux环境。WSL是微软开发的一项技术，允许用户在Windows系统中直接运行完整的Linux环境，无需虚拟机。通过操作系统级虚拟化，WSL将Linux子系统无缝嵌入Windows，提供原生Linux命令行工具、软件包管理器及应用程序支持。它具有轻量化、文件系统集成、良好的交互性及开发效率提升等优点，消除了Windows与Linux之间的隔阂，尤其适合开发者和需在Windows平台上使用Linux工具的用户。

1.启用window子系统及虚拟化

2.Docker Desktop配置

下载地址：https://www.docker.com/

下载完成后，打开安装包一直下一步等待安装结束即可。

提示：因为安装完成后镜像很大，默认会安装在C盘，建议更改到其他空闲盘。

打开docker desktop，会自动弹出cmd窗口，启动wsl下载linux，否则无法运行docker。这一步耐心等待即可。安装完成后，可以在我的电脑查看->linux。

3.Docker Desktop配置

最新可用的国内镜像源可以百度找找。这里提供几个当前还能用的镜像源。

“registry-mirrors”: [
“https://docker-0.unsee.tech”,
“https://docker.1panel.live”,
“https://docker.tbedu.top”,
“https://cr.laoyou.ip-ddns.com”,
“https://dockerpull.cn”,
“https://hub.fast360.xyz”
]

二、部署Ragflow

https://kkgithub.com/infiniflow/ragflow/blob/main/README_zh.md

软硬件条件：

CPU >= 4 核
RAM >= 16 GB
Disk >= 50 GB
Docker >= 24.0.0 & Docker Compose >= v2.26.1

1.拉取ragflow

$ git clone https://github.com/infiniflow/ragflow.git

这个过程会比较慢，可以用码云转一下github仓库，拉取速度会快很多。

2.进入docker文件夹，利用提前编译好的Docker镜像启动服务器

由于我们需要用到embedding模型，默认的ragflow镜像不自带embedding，这里需要特别注意要手动修改配置。

在拉取的ragflow仓库路径下的docker/.env 文件内的RAGFLOW_IMAGE变量，通过设置RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0来下载 RAGFlow镜像的 v0.16.0 完整发行版。在ragflow文件夹下打开cmd窗口运行以下命令：

docker compose -f docker/docker-compose.yml up -d

安装ragflow需要的docker镜像，拉取失败说明docker镜像源有问题，需要自行百度查询可用镜像源重新拉取。

如果你遇到 Docker 镜像拉不下来的问题，可以在 docker/.env 文件内根据变量 RAGFLOW_IMAGE 的注释提示选择华为云或者阿里云的相应镜像。

华为云镜像名：swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow
阿里云镜像名：registry.cn-hangzhou.aliyuncs.com/infiniflow/ragflow

拉取成功后，在docker desktop里面就能看到镜像源。

3.在你的浏览器中输入你的服务器对应的IP地址并登录RAGFlow

默认打开ragflow地址http://localhost:80

三、Ragflow使用

登录ragflow，根据图片内容进行配置。需要注意基础Url需要改为ip:端口号，ollama默认端口11434

1.知识库配置

创建知识库，这里使用一份一千条中医问答数据作为测试。如图进行创建知识库。

嵌入模型选择默认的即可，解析方法比较重要，因为使用的数据是问答形式，所以选择Q&A类型。解析方法有很多种，网页中都有解释，选择合适的解析方法能够让知识库的回答更加准确。

点击新增文件，将中医问诊数据集进行进行上传，等待系统解析完成。这个过程会比较慢，错误的解析方法也会导致解析失败。

2.创建中医问诊聊天助手

聊天模块选择新建助理，知识库选择上一步新建的中医问诊。

模型设置中选择ollama已下载模型，选择deepseek-r1:32b模型进行测试。每个参数在网站里都有解释，这里自由度设置为精确，尽可能让大模型从知识库里回答问题，减少自由发挥。

点击确定，新建聊天。测试一下看看效果吧。

效果粗略看还可以，聊天助手还可以标注出知识库的来源。

如果能够将知识库数据整合处理好，体验效果还是不错的，这只是32b的模型，如果人人都能部署的671b呢？真是对未来充满期待。

3.多测试几个知识库，一起看看效果吧

天龙八部小说：
问题1：
问题2：
儿科问诊数据一千条：
心理学数据一万条：

四、最后

利用DeepSeek+Ragflow搭建的知识库过程还是比较简单，正常跟着流程走不容易出错。如果投喂的数据经过整合处理，那么反馈的结果还是有一定的实际意义。
当前个人能部署的模型参数太少，尚处于体验阶段。相信不久的将来，大模型不断发展，个人能部署性能更强大的模型。

热门推荐

2024年博士就业现状：竞争激烈，六大维度解析就业形势

种下紫云英，“冬闲田”变身春耕“肥力田”

冬天进补正当时，建议常吃这4道补气菜，营养暖身，舒服过冬

Stable Diffusion模型训练教程——最简流程模式

Unity游戏开发入门：从安装到创建你的第一个3D场景

实验引领学习风尚-动手实践提升生物学习能力

全身游走性疼痛说明什么

凡人修仙传中各种境界划分和寿命上限

演完《士兵突击》，18年后演《我是刑警》，明明同一人差点没认出

健身房里的女教练

吸铁石为什么吸铁科普（磁铁是怎么产生磁场的？）

看了国外的天才培养计划，才发现「早培」原来是个笑话

留学生必备：多邻国备考全攻略——听写句子题技巧大揭秘，考官居然帮你报听写？

都是日本车！丰田卡罗拉与本田思域斗了几十年哪款更值得？

用 DataEase 分析北京近年房价变化

冬季骑行完全指南：准备与维护技巧

守护微笑，从“齿”开始！孩子牙齿出现这9种情况，请尽早干预！

睡眠质量不好的解决方法是什么

《星际争霸》异虫篇 - 刺蛇(Hydralisk)

多家银行提升支付宝快捷支付限额至20万元

电动车新国标修订完成，时速仍限25km/h，车主：买车后还是要改装

2024租车要经过哪些手续

微生物农药初学者指南：类型和使用方法

做好和宝宝的第一次“贴贴”，让宝贝健康起步

如何通过八字分析个人的运势走向

需要警惕那些高容积率城市

清高其佩指画《怒容钟馗图》

江西发布物业服务调查报告：物业费高的小区，业主满意度更低

作家聂华苓去世，曾为沈从文作传丨逝者

叶黄素究竟能否有效治疗眼睛问题？深入探讨其对视力健康的影响与作用。