资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

使用Ollama配置本地微调的gguf模型文件

创作时间:

作者:

@小白创作中心

使用Ollama配置本地微调的gguf模型文件

引用

CSDN

https://blog.csdn.net/weixin_43217276/article/details/140790668

本文将详细介绍如何使用Ollama配置本地微调的gguf模型文件。通过在Ubuntu系统上安装Ollama、准备模型文件以及加载模型，用户可以快速部署和使用大语言模型。

一、安装Ollama

在Linux系统上，可以使用以下命令安装Ollama：

curl -fsSL https://ollama.com/install.sh | sh

如果上述命令无法正常运行，可以访问Ollama的官方安装页面：https://ollama.com/install.sh，手动下载并运行安装脚本。

安装完成后，可以尝试运行一个开源模型测试是否成功：

ollama run llama3.1

在对话框中输入/help查看可用指令，输入/bye退出对话模式。

二、准备工作

首先需要创建一个文件夹，并在其中创建.modelfile文件和模型文件，建议将两者命名为相同名称以避免混淆：

├── MyModel/
    ├── testmodel.gguf
    └── testmodel.modelfile

接下来编辑.modelfile文件，以下是一个示例配置：

FROM testmodel.gguf
# 设置temperature为1，更高的数值回答更加发散，更低的数值回答更加保守
PARAMETER temperature 0.7
TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>
{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>
{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>
{{ .Response }}<|eot_id|>"""
PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"
PARAMETER stop "<|reserved_special_token"
# 设置tokens限制
PARAMETER num_ctx 4096
PARAMETER repeat_penalty 1.5
PARAMETER repeat_last_n 1024
# 设置系统级别的提示词
SYSTEM 现在你是xxxx有限公司矿建领域的个人助理，我是一个矿山建设领域的工程师，你要帮我解决我的专业性问题。
MESSAGE user 你好
MESSAGE assistant 我在，我是xxxx有限公司的矿建电子个人助理，请问有什么我可以帮助您的嘛？
MESSAGE user 人工地层冻结主要采用机械式压缩机制冷技术吗？
MESSAGE assistant 是的，人工地层冻结主要采用机械式压缩机制冷技术。
MESSAGE user 解释人工地层冻结的主要制冷方法。

以下是几个关键参数的说明：

1. 导入模型

FROM testmodel.gguf

这是必须的且必须放在第一行。

2. 回答发散度

PARAMETER temperature 0.7

数值越大，回答越有创造性，默认值为0.8。

3. 回答方式

TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>
{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>
{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>
{{ .Response }}<|eot_id|>"""

这个参数会让模型像ChatGPT一样以"引入-分点-总结"的方式回答。

4. 停止回答条件

PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"
PARAMETER stop "<|reserved_special_token"

遇到这些特殊标记时停止回答。

5. 防止重复

PARAMETER num_ctx 4096
PARAMETER repeat_penalty 1.5
PARAMETER repeat_last_n 1024

num_ctx参数限制回答的token数量。
repeat_penalty设置重复惩罚强度，默认值为1.1。
repeat_last_n设置模型回溯距离以防止重复，默认值为64。

6. 系统级别提示词

SYSTEM 现在你是xxxx有限公司矿建领域的个人助理，我是一个矿山建设领域的工程师，你要帮我解决我的专业性问题。
MESSAGE user 你好
MESSAGE assistant 我在，我是xxxx有限公司的矿建电子个人助理，请问有什么我可以帮助您的嘛？
MESSAGE user 人工地层冻结主要采用机械式压缩机制冷技术吗？
MESSAGE assistant 是的，人工地层冻结主要采用机械式压缩机制冷技术。
MESSAGE user 解释人工地层冻结的主要制冷方法。

可以根据需要设置系统级别的提示词，模型会按照类似的方式回答问题。

三、加载模型

在之前创建的MyModel文件夹下，使用以下命令加载模型：

ollama create mymodelname -f ./testmodel.modelfile

其中mymodelname是自定义的模型名称。

运行模型：

ollama run mymodelname

这样就完成了模型的部署和运行。对于更多详细信息，可以参考Ollama的官方文档。

热门推荐

公共场所如何做好防护？一图看明白！

HTML滚动字幕的多种实现方法与项目管理工具推荐

海南黄灯笼辣椒酱：从“辣椒之王”到餐桌新宠

海南黄灯笼辣椒酱：辣到耳鸣的秘密武器！

海南黄灯笼辣椒酱：从“辣王”到餐桌常客的味觉传奇

2025年，该“拥抱新能源车”还是“抄底油车”？答案很明确！！

为什么新能源汽车会亏损？有哪些原因导致车企面临挑战

定调2025：促消费与“破内卷”双管齐下汽车产业破解“增量”困局思路浮现

石崇教你如何用成语“渊渟岳峙”

合作应对全球挑战，携手迈向共同未来—博鳌亚洲论坛在首尔举办地区会议

薄海纸鱼挑战《恶魔轮盘》多人模式：用幽默化解生死危机

冬季刹车异响？这几个小妙招轻松搞定！

雪天刹车异响？换优质刹车片！

雪天行车安全指南：从准备到应急，这些要点请收好

雪地行车，ABS到底该不该关？

股票投资入门：基本特征、价值分析与风险控制

虎跳峡高路：徒步者的天堂

佛山50公里徒步：掌握这些技巧不累脚！

武功山徒步：云海星空下的浪漫之旅

《薄海纸鱼House》：解谜高手的成长之路

中国摄影家协会理事李群教你捕捉神农架最美瞬间！

中年夫妻关系中的沟通技巧：三种话语让老公更心疼你！

丝瓜络加蒲公英煮水：功效与注意事项

蔬菜沙拉可以放多久？保存方法全解析

隔夜菜会致癌？揭秘隔夜菜的实际危害与健康风险

微信名背后的心理密码：从A到Z解析你的性格

打造专业形象：如何设计一个得体的职场微信名

鲤鱼ACE：用东北幽默征服1482万粉丝的游戏主播

鲤鱼ACE：从东北游戏主播到1482万粉丝的抖音顶流

店桥加油站新手加油全攻略！