解锁DeepSeek潜能:Docker+Ollama打造本地大模型部署新范式
创作时间:
作者:
@小白创作中心
解锁DeepSeek潜能:Docker+Ollama打造本地大模型部署新范式
引用
CSDN
1.
https://blog.csdn.net/weixin_53269650/article/details/146457200
一、引言
1、什么是Docker
Docker:就像一个“打包好的App”
想象一下,你写了一个很棒的程序,在自己的电脑上运行得很好。但当你把它发给别人,可能会遇到各种问题:
- “这个软件需要 Python 3.8,但我只有 Python 3.6!”
- “我没有你用的那个库,安装失败了!”
- “你的程序要跑在 Linux,我的电脑是 Windows!”
💡Docker 的作用:它就像一个“打包好的 App”,把你的软件、依赖、环境、系统配置等全部封装到一个“容器”里,别人拿到这个容器,就能直接运行,而不用关心它内部的细节。
🚀 把 Docker 想象成“集装箱”
传统运输 vs. 集装箱运输
以前(传统部署):
- 货物(程序)需要不同的包装方式(运行环境)
- 货物可能损坏(环境不兼容)
- 装卸麻烦(程序迁移难)
有了 Docker(容器部署):
- 货物装进标准化集装箱(Docker 容器)
- 不管运到哪里,集装箱里东西不变(程序环境一致)
- 码头和船只可以直接装卸(轻松部署到不同系统)
Docker让软件像“集装箱”一样标准化、可移植、易部署!🚢
2、什么是Ollama
Ollama 是一个本地运行大语言模型(LLM)的工具,它可以让你在自己的电脑上直接运行 AI 模型,而不需要连接云端服务器。
💡简单来说:Ollama 让你像运行普通软件一样,轻松在本地使用 ChatGPT、Llama、Mistral、Gemma 等大语言模型。
🚀 Ollama 的核心特点
- 本地运行🏠
- 你不需要联网,也不用担心隐私问题,所有计算都在你的电脑上完成。
- 支持多种开源模型📚
- 可以运行Llama 3、Mistral、Gemma、Code Llama等不同的大模型。
- 易于安装和使用🔧
- 只需要几条命令,就能下载并运行 AI 模型。
- 轻量化优化⚡
- 适配 Mac(Apple Silicon)、Linux 和 Windows,支持 GPU 加速,让模型运行更快。
- 离线推理🔒
- 适合不想依赖 OpenAI API 或其他云端 AI 服务的用户。
二、准备工作
1、操作系统
这里我们使用的操作系统为Centos 7.9,配置为4核8G,大家也可以使用其他的Linux发行版本,或者使用Windows。
2、镜像准备
如果已经安装了Docker,可以提前准备好镜像,ollama/ollama,镜像比较大,拉取会耗一些时间
三、安装
1、安装Docker
1.关闭防火墙
systemctl stop firewalld && systemctl disabled firewalld
2.关闭SELinux
setenforce 0
3.更换yum源
rm -f /etc/yum.repos.d/*
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
yum clean all && yum makecache
4.安装依赖项
yum install -y yum-utils device-mapper-persistent-data lvm2
- 添加Docker源
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo
6.安装Docker
yum install docker-ce -y
7.添加Docker镜像加速器
vim /etc/docker/daemon.json
# 添加如下内容
{
"registry-mirrors": [
"https://docker.m.daocloud.io",
"https://noohub.ru",
"https://huecker.io",
"https://dockerhub.timeweb.cloud",
"https://0c105db5188026850f80c001def654a0.mirror.swr.myhuaweicloud.com",
"https://5tqw56kt.mirror.aliyuncs.com",
"https://docker.1panel.live",
"http://mirrors.ustc.edu.cn/",
"http://mirror.azure.cn/",
"https://hub.rat.dev/",
"https://docker.ckyl.me/",
"https://docker.chenby.cn",
"https://docker.hpcloud.cloud",
"https://docker.m.daocloud.io"
]
}
8.启动Docker
systemctl start docker
2、启动Ollama
1.启动Ollama容器
docker run -itd -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
- docker run 运行一个新的 Docker 容器
- -itd 组合多个选项:
- ✅-i(保持标准输入)
- ✅-t(分配终端)
- ✅-d(后台运行容器)
- -v ollama:/root/.ollama 挂载数据卷,把 ollama 这个 Docker 数据卷 绑定到容器的 /root/.ollama 目录,确保数据持久化(如下载的模型不会丢失)。
- -p 11434:11434 端口映射,把 宿主机(本机)的 11434 端口 映射到 容器 内部的 11434 端口,这样宿主机可以通过 http://localhost:11434 访问 Ollama 服务。
- --name ollama 指定 容器名称 为 ollama,方便管理和启动。
- ollama/ollama 使用的 Docker 镜像,这里是 官方的 Ollama 镜像。
如果是使用GPU运行,则用下面的命令启动
docker run -itd --name ollama --gpus=all -v ollama:/root/.ollama -p 11434:11434 ollama/ollama
2.查看Ollama容器
docker ps
3、拉取Deepseek大模型
1.进入到容器中
docker exec -it ollama /bin/bash
2.拉取模型
ollama pull deepseek-r1:7b
在官网中,有许多Deepseek的模型,这里主要是演示,所以拉取了一个较小的模型
官网地址:deepseek-r1
3.查看模型
ollama list
4、启动Deepseek
ollama run deepseek-r1:7b
热门推荐
合同履行中的法律风险及其防范措施有哪些
民间偏方“放血”疗法有什么生物力学依据吗?
气象站十大气象传感器
使用X-ray进行PCB缺陷检测深度指南
Omega-3或鱼油有益于心脏健康吗?权衡其获益和风险
等风:让全日本恐惧的“南海海槽大地震”,破坏性有多大?
日本专家:下次南海海沟地震将在2038年左右发生
海外品牌营销攻略:如何用高效策略快速打开国际市场?
Unity 协程详解:定义、使用方法及应用场景
梅氏烙画:火与木的艺术
烧伤伤残等级评定标准是什么?
实用分享!美国不同排名体系对比
乳糖不耐症不能喝牛奶?原因、症状、诊断、治疗一次看懂
大便前端干燥怎么办?十个实用解决方案帮你改善排便问题
大便干燥时该喝什么?专业医生给出5个实用建议
生态板和多层板哪一种板材更好?一文详解两者区别
破解主人迷思「用对错教狗狗」 训练师解密养狗基础观念
【科普】花生油、玉米油、橄榄油…哪种更适合你?
什么是侵权行为
世纪大道地铁站内,连接世纪汇、世纪百联的这条地下通道为何消失了
40分钟连通上海两大机场,市域机场线乘坐体验如何?换乘方便吗?
《星际战甲》内融核心获取攻略:多种途径助你提升MOD效果
我国环氧丙烷行业:市场面临供应过剩局面 HPPO法有望成为未来主流工艺
人民日报评论:遵从社会时钟与寻找人生旷野,是两难问题么?
2025正规医院点阵激光多少钱?次数/面积大小/程度价格对照表+各城市收费标准!
如何计算服务器视频带宽?详解计算公式与步骤
电竞鼠标参数全面解读:助你精准选择
去哪些地方可以检测黄金真假?
低频驻波:低频陷阱摆位方法
辱骂他人造成精神伤害的法律分析