部署你的专属私有AI大模型
创作时间:
作者:
@小白创作中心
部署你的专属私有AI大模型
引用
CSDN
1.
https://blog.csdn.net/qq_33906471/article/details/138955021
本文将指导您在CentOS 7.9系统上部署一个专属的私有AI大模型。通过使用Docker和Docker-Compose,整个部署过程将大大简化。请确保您的系统已经满足以下条件:CentOS 7.9操作系统、网络连接正常。
准备Docker环境
安装Docker
yum install -y yum-utils device-mapper-persistent-data lvm2
yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
yum -y install docker-ce docker-ce-cli containerd.io
启动Docker
systemctl start docker
systemctl enable docker
准备Docker-Compose
安装Docker Compose时可能会遇到网络问题,可以尝试开启VPN或联系作者获取帮助。
curl -L "https://github.com/docker/compose/releases/download/1.24.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose
ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose
docker-compose --version
准备源代码
git clone https://github.com/open-webui/open-webui.git
[root@bogon ~]# git clone https://github.com/open-webui/open-webui.git
Cloning into 'open-webui'...
remote: Enumerating objects: 22440, done.
remote: Counting objects: 100% (517/517), done.
remote: Compressing objects: 100% (183/183), done.
remote: Total 22440 (delta 301), reused 460 (delta 272), pack-reused 21923
Receiving objects: 100% (22440/22440), 48.51 MiB | 1.70 MiB/s, done.
Resolving deltas: 100% (14679/14679), done.
启动服务
修改docker-compose.yaml文件
version: '3'
services:
ollama:
volumes:
- ollama:/root/.ollama
container_name: ollama
tty: true
restart: unless-stopped
image: ollama/ollama:${OLLAMA_DOCKER_TAG-latest}
open-webui:
image: ghcr.io/open-webui/open-webui:${WEBUI_DOCKER_TAG-main}
container_name: open-webui
volumes:
- open-webui:/app/backend/data
depends_on:
- ollama
ports:
- ${OPEN_WEBUI_PORT-3000}:8080
environment:
- 'OLLAMA_BASE_URL=http://ollama:11434'
- 'WEBUI_SECRET_KEY='
extra_hosts:
- host.docker.internal:host-gateway
restart: unless-stopped
volumes:
ollama: {}
open-webui: {}
启动
[root@bogon ~]# cd open-webui/
[root@bogon open-webui]# docker-compose up -d --build
# 启动完成以后查询容器状态
[root@bogon open-webui]# docker-compose ps
Name Command State Ports
---------------------------------------------------------------------------------
ollama /bin/ollama serve Up 11434/tcp
open-webui bash start.sh Up 0.0.0.0:3000->8080/tcp,:::3000->8080/tcp
测试使用
访问
打开浏览器访问服务器的IP加上3000端口:
http://192.168.207.131:3000
注册账号
选择模型
ollama里面有很多模型可以使用,但是需要我们下载,经过测试觉得比较好用的一个是openchat(当然也有其他的,大家可以多测试测试,选择一个好用的,这里面我们就用openchat为例)。
下载模型
下载完成以后会有>>>
提示符输入/bye
按回车即可
[root@bogon open-webui]# docker exec -it ollama ollama run openchat
pulling manifest
pulling 1cecc26325a1... 100% ▕█████████████████████▏ 4.1 GB
pulling 43070e2d4e53... 100% ▕█████████████████████▏ 11 KB
pulling d68706c17530... 100% ▕█████████████████████▏ 98 B
pulling 415f0f6b43dd... 100% ▕█████████████████████▏ 65 B
pulling 278996753456... 100% ▕█████████████████████▏ 483 B
verifying sha256 digest
writing manifest
removing any unused layers
success
>>> /bye
刷新浏览器,选择模型
接下来你就可以尽情体验了
热门推荐
无证人员修扶梯的法律问题及责任追究
颈动脉斑块知多少,多模态超声来帮忙
乌军撤出库尔斯克地区苏贾,为何不再挣扎?对战局带来哪些影响?
帮助所有儿童学会阅读的工具
枢纽成都 成都高质量发展
SPC石塑地板应该如何选择
木工自己打柜子好还是全屋定制好?内行人告诉你差别在哪里!
太极拳八个基本动作详解
工伤认定后的医疗费用谁承担的
新中式酒店设计:传统与现代的和谐共生
投资组合优化:如何构建一个稳健的投资组合?
家具翻新的小技巧 家具翻新方法介绍
开关电源为什么要进行负载测试,负载测试都包含哪些项目?
正当防卫指导案例解析
正当防卫认定标准
企业知识产权战略规划怎么制定?
一文搞懂计算机存储单位Byte、KB、MB、GB和TB的关系及换算方法
品牌logo设计中的色彩心理学:不同颜色如何影响用户心理
近亲繁殖为什么会畸形
讲雷锋故事,学雷锋精神,走雷锋之路
胃疼的位置通常在哪里
为什么阿莫西林克拉维酸大剂量使用时只推荐用14:1?
如何和团队成员协作
七部万圣节必看日本恐怖经典
蓝光祛痘要用光敏剂吗
蜂膠能緩解咳嗽嗎?蜂膠的4個功效與禁忌一次看懂!
成果满满!西安交大科研新进展
利物浦夺冠倒计时?阿森纳:NO!英超史上最大分差逆转枪手造!
如何在项目中通过沟通提高工作满意度
如何确保研发项目满足法规要求