使用Ollama配置本地微调的gguf模型文件
创作时间:
作者:
@小白创作中心
使用Ollama配置本地微调的gguf模型文件
引用
CSDN
1.
https://blog.csdn.net/weixin_43217276/article/details/140790668
本文将详细介绍如何使用Ollama配置本地微调的gguf模型文件。通过在Ubuntu系统上安装Ollama、准备模型文件以及加载模型,用户可以快速部署和使用大语言模型。
一、安装Ollama
在Linux系统上,可以使用以下命令安装Ollama:
curl -fsSL https://ollama.com/install.sh | sh
如果上述命令无法正常运行,可以访问Ollama的官方安装页面:https://ollama.com/install.sh,手动下载并运行安装脚本。
安装完成后,可以尝试运行一个开源模型测试是否成功:
ollama run llama3.1
在对话框中输入/help
查看可用指令,输入/bye
退出对话模式。
二、准备工作
首先需要创建一个文件夹,并在其中创建.modelfile
文件和模型文件,建议将两者命名为相同名称以避免混淆:
├── MyModel/
├── testmodel.gguf
└── testmodel.modelfile
接下来编辑.modelfile
文件,以下是一个示例配置:
FROM testmodel.gguf
# 设置temperature为1,更高的数值回答更加发散,更低的数值回答更加保守
PARAMETER temperature 0.7
TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>
{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>
{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>
{{ .Response }}<|eot_id|>"""
PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"
PARAMETER stop "<|reserved_special_token"
# 设置tokens限制
PARAMETER num_ctx 4096
PARAMETER repeat_penalty 1.5
PARAMETER repeat_last_n 1024
# 设置系统级别的提示词
SYSTEM 现在你是xxxx有限公司矿建领域的个人助理,我是一个矿山建设领域的工程师,你要帮我解决我的专业性问题。
MESSAGE user 你好
MESSAGE assistant 我在,我是xxxx有限公司的矿建电子个人助理,请问有什么我可以帮助您的嘛?
MESSAGE user 人工地层冻结主要采用机械式压缩机制冷技术吗?
MESSAGE assistant 是的,人工地层冻结主要采用机械式压缩机制冷技术。
MESSAGE user 解释人工地层冻结的主要制冷方法。
以下是几个关键参数的说明:
1. 导入模型
FROM testmodel.gguf
这是必须的且必须放在第一行。
2. 回答发散度
PARAMETER temperature 0.7
数值越大,回答越有创造性,默认值为0.8。
3. 回答方式
TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>
{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>
{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>
{{ .Response }}<|eot_id|>"""
这个参数会让模型像ChatGPT一样以"引入-分点-总结"的方式回答。
4. 停止回答条件
PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"
PARAMETER stop "<|reserved_special_token"
遇到这些特殊标记时停止回答。
5. 防止重复
PARAMETER num_ctx 4096
PARAMETER repeat_penalty 1.5
PARAMETER repeat_last_n 1024
num_ctx
参数限制回答的token数量。repeat_penalty
设置重复惩罚强度,默认值为1.1。repeat_last_n
设置模型回溯距离以防止重复,默认值为64。
6. 系统级别提示词
SYSTEM 现在你是xxxx有限公司矿建领域的个人助理,我是一个矿山建设领域的工程师,你要帮我解决我的专业性问题。
MESSAGE user 你好
MESSAGE assistant 我在,我是xxxx有限公司的矿建电子个人助理,请问有什么我可以帮助您的嘛?
MESSAGE user 人工地层冻结主要采用机械式压缩机制冷技术吗?
MESSAGE assistant 是的,人工地层冻结主要采用机械式压缩机制冷技术。
MESSAGE user 解释人工地层冻结的主要制冷方法。
可以根据需要设置系统级别的提示词,模型会按照类似的方式回答问题。
三、加载模型
在之前创建的MyModel
文件夹下,使用以下命令加载模型:
ollama create mymodelname -f ./testmodel.modelfile
其中mymodelname
是自定义的模型名称。
运行模型:
ollama run mymodelname
这样就完成了模型的部署和运行。对于更多详细信息,可以参考Ollama的官方文档。
热门推荐
职场男生素来健康堪忧,一杯黄芪水或成“救命稻草”
山西浑源黄芪:1500年传承,4倍皂苷含量,成就“中国黄芪之乡”
企业复工复产进行时:政策支持、行业实践与挑战应对
企业复工后的职场新趋势:从职业倦怠到副业兴起
光大永明人寿巨亏30亿的困局
海南旅游:携带花生油的规定与注意事项全解析
花生油可以带上高铁吗?官方回应来了
西班牙知识大全
数据驱动革命:人工智能如何变革足球竞技——从战术分析到伤病预防
国产AI大模型在医疗领域的十大应用场景
初为霓裳后六幺:传统服饰与现代时尚之融合
摆脱手机成瘾,守护你的心理健康!
手机专注模式:高效工作的神器
中高考倒计时:如何让孩子合理使用手机?
倒车时如何精准控制油门?在倒车时控制油门需要注意哪些事项?
台钓高手教你快速掌握浮漂目数!
秋日钓鱼,心态调整让你乐在其中!
揭秘带饵调漂背后的物理奥秘!
情绪管理不善,小心胃病找上门!
曼谷医院专家推荐:日常生活防胃恶心小妙招
吃香蕉真的能缓解胃恶心吗?
中医养胃新趋势:告别胃恶心
秋冬养生:红参与西洋参大比拼!
《封神第二部》特效剧情引争议,8天票房仅破10亿
娱乐圈五对闺蜜温馨故事:真挚友情让人感动不已!
儿童营养筛查评估量表详解(附中文评估量表)
得了脂肪肝,如何逆转肝脏健康?权威综述:关注1个关键指标和3大风险因素
宫野明美的“乌鸦”之谜被删,真相大揭秘!
银行卡账户类型是什么
秋冬养生新宠:白参到底有多神奇?