问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

【选择指南】揭秘：如何挑选适合Flux的完美GGUF？

创作时间:

作者:

@小白创作中心

【选择指南】揭秘：如何挑选适合Flux的完美GGUF？

引用

1

来源

1.

https://www.fluxai.cn/detail/selection-guide-disclosure-how-to-choose-20241226

Flux.1 Dev/Schnell是一款拥有120亿参数的强大AI模型，其FP16版本需要高达23GB的存储空间。通常需要高端GPU（如NVIDIA RTX 4090）才能高效运行。然而，大多数用户使用的都是RTX 4060、4070、4080或更早的30系列GPU。那么，如何在硬件资源有限的情况下运行这个模型呢？

量化技术简介

量化是一种让模型变得更小、更高效的技术。通过降低模型的精度，量化可以显著减少显存需求，而不会对输出质量造成太大影响。这就像压缩图片，虽然文件变小了，但人眼几乎看不出质量下降。

GGUF格式介绍

GGUF是一种专门用于存储量化模型的文件格式。它在存储效率和运行性能上都进行了优化，使得量化模型更容易加载和运行，即使在显存较少的硬件上也能流畅使用。

如何选择合适的GGUF模型

要选择合适的Flux.1 GGUF模型，你需要考虑以下几点：

显存容量：你的GPU有多少显存？
量化级别（Q4、Q5、Q8等）：这决定了模型性能和输出质量之间的权衡。
你的具体需求：根据你的硬件和期望的质量，可能需要做出一些妥协。

GGUF量化级别说明

量化级别指的是模型精度被降低的程度。例如，将模型从FP16压缩到Q8、Q6甚至Q4，可以显著减少其大小和运行所需的显存。不同的量化级别（如Q2到Q8）代表了不同程度的压缩，会影响模型的质量和显存占用。

*如果你在Hugging Face下载页面上看到Q2-Q8量化选项和一个flux1-dev-F16.gguf文件，可以将其理解为FP16模型封装在GGUF格式中。这保留了FP16的效率，同时使模型更容易分享并与不同工具兼容。由于它需要与FP16相同的24GB显存，因此未包含在表格中。

如何估算显存需求

你可以根据模型的文件大小粗略估算所需的最小显存。例如，如果你的GPU有12GB显存，理论上可以运行Q5或Q6模型。但请记住，系统本身也需要占用一些显存，因此你可能需要选择更低的量化级别，比如Q4，以确保稳定运行。建议测试不同版本，找到最适合你设备的配置。

Flux.1 Dev GGUF Q2-Q8版本列表

此表格基于City69的Flux.1 Dev GGUF的版本列表。

NVIDIA显卡上的显存芯片

使用City96的Flux.1 Dev GGUF

开源的Flux社区有多个贡献者创建了不同的量化模型。本文重点介绍City69的Flux.1 Dev/Schnell GGUF，它支持ControlNet和LoRA。需要注意的是，它不包含CLIP或VAE，因此你需要单独下载这些组件。如果你使用ComfyUI，还需要相应的GGUF工作流。

注意：Flux需要两个CLIP模型——clip_l和t5xxl。如果你的显存有限，可以考虑使用t5xxl_fp8_e4m3fn。高显存用户则可以使用t5xxl_fp16。

GGUF模型

City69的Flux.1 Dev
City69的Flux.1 Schnell

CLIP模型

clip_l.safetensors
t5xxl_fp8_e4m3fn.safetensors（低显存适用）
t5xxl_fp16.safetensors（高显存适用）

VAE模型

ae.safetensors

ComfyUI工作流

City96-ComfyUI GGUF
OpenArt — GGUF ComfyUI工作流

结论

选择合适的Flux.1 GGUF模型主要取决于你的显存容量。量化提供了一种有效的方式来优化硬件使用，让你无需购买最昂贵的GPU也能运行强大的模型。确保仔细评估你的GPU规格和需求，找到最适合的量化版本。

参考链接

热门推荐

健康飞行：乘机出行必备小贴士

健康飞行：乘机出行必备小贴士

五种科学方法治疗耳鸣，专家建议这样预防

五种科学方法治疗耳鸣，专家建议这样预防

尾盘30分钟选股法：提高投资效率的实用策略

尾盘30分钟选股法：提高投资效率的实用策略

爆改小户型，打造理想居住空间

爆改小户型，打造理想居住空间

20年老毛坯房：投资陷阱还是价值洼地？

20年老毛坯房：投资陷阱还是价值洼地？

正确踩油门+预见性驾驶：降低油耗的实用技巧

正确踩油门+预见性驾驶：降低油耗的实用技巧

陈晓陈乔恩演绎隋朝开国传奇，《独孤皇后》获观众好评

陈晓陈乔恩演绎隋朝开国传奇，《独孤皇后》获观众好评

陈乔恩版独孤皇后走红：美貌与智慧并重

陈乔恩版独孤皇后走红：美貌与智慧并重

煤气灯效应下的心理健康自救指南

煤气灯效应下的心理健康自救指南

如何查询手机号入网时间？一文详解查询方法与应用场景

如何查询手机号入网时间？一文详解查询方法与应用场景

手机号码入网时长：金融风控的新利器

手机号码入网时长：金融风控的新利器

999感冒灵颗粒使用攻略：剂量、方法与禁忌

999感冒灵颗粒使用攻略：剂量、方法与禁忌

北理工附中英语角：外教引领创新互动，科技助力语言提升

北理工附中英语角：外教引领创新互动，科技助力语言提升

一次成功在家也能做广式点心｜白糖伦教糕

一次成功在家也能做广式点心｜白糖伦教糕

年夜饭上吃哪种鱼，寓意最好？大厨：就吃这5种，寓意吉祥又好吃

年夜饭上吃哪种鱼，寓意最好？大厨：就吃这5种，寓意吉祥又好吃

武威凉州春节非遗：七大民俗项目展现传统年味

武威凉州春节非遗：七大民俗项目展现传统年味

中国春节申遗成功，44项非遗彰显文化自信

中国春节申遗成功，44项非遗彰显文化自信

特大游戏外挂案告破：涉案600万，9名嫌疑人落网

特大游戏外挂案告破：涉案600万，9名嫌疑人落网

广东推进沿海交通大通道建设，打造世界级湾区重要支撑

广东推进沿海交通大通道建设，打造世界级湾区重要支撑

王者荣耀黄忠全解析：炮台射手的超远射程与高爆发伤害，技能与出装推荐一网打尽

王者荣耀黄忠全解析：炮台射手的超远射程与高爆发伤害，技能与出装推荐一网打尽

新课标推动小学科学教学改革，分类、激励、想象三法并举

新课标推动小学科学教学改革，分类、激励、想象三法并举

从动机到实践：教育心理学助力小学科学教学

从动机到实践：教育心理学助力小学科学教学

汪峰：用情感与技巧打造动人歌声

汪峰：用情感与技巧打造动人歌声

冬季感冒高发季，防风通圣丸这样用才安全

冬季感冒高发季，防风通圣丸这样用才安全

防风通圣丸：表里双解中药，治疗流感皮肤病有良效

防风通圣丸：表里双解中药，治疗流感皮肤病有良效

霉变的甘蔗为啥不能吃？

霉变的甘蔗为啥不能吃？

华夏食养甄选：秋季吃甘蔗的好处有哪些？秋季吃甘蔗的好处解析！

华夏食养甄选：秋季吃甘蔗的好处有哪些？秋季吃甘蔗的好处解析！

电饭锅酱牛肉，懒人也能做出餐厅级美味！

电饭锅酱牛肉，懒人也能做出餐厅级美味！

酱牛肉的正确打开方式：从选材到烹饪的全方位指南

酱牛肉的正确打开方式：从选材到烹饪的全方位指南

广州市番禺区市桥世标小吃店教你安全制作酱牛肉

广州市番禺区市桥世标小吃店教你安全制作酱牛肉

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号