InvSR:开源图像超分辨率生成模型,提升分辨率,修复老旧照片为超清图像
创作时间:
作者:
@小白创作中心
InvSR:开源图像超分辨率生成模型,提升分辨率,修复老旧照片为超清图像
引用
CSDN
1.
https://blog.csdn.net/qq_19841021/article/details/144704888
InvSR是一个基于扩散模型的逆过程恢复高分辨率图像的创新模型。它通过深度噪声预测器来估计正向扩散过程中所需的最优噪声图,不仅能够充分利用扩散模型的先验知识,还提供了灵活高效的采样机制。
InvSR是什么
InvSR是一个创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。它利用大型预训练扩散模型中的丰富图像先验知识,通过深度噪声预测器来估计正向扩散过程中所需的最优噪声图。这种方法不仅能够充分利用扩散模型的先验知识,还提供了灵活高效的采样机制,用户可以根据图像退化的类型或特定需求自由调整采样步骤。
InvSR的核心在于其深度噪声预测器,该预测器能够估计出在正向扩散过程中所需的最优噪声图。通过这种方式,InvSR能够在减少采样步骤的情况下,依然保持或超越现有方法的性能,实现计算效率的提升。
InvSR的主要功能
- 图像超分辨率提升:主要功能是提高图像的分辨率,从低分辨率图像恢复出高分辨率图像。
- 灵活的采样机制:支持从一到五个任意数量的采样步骤,用户可以根据图像退化类型或特定需求调整采样步骤。
- 噪声预测:深度噪声预测器估计最优噪声图,用于初始化扩散模型的采样过程。
- 扩散模型利用:充分利用预训练的扩散模型中的图像先验知识,提高超分辨率的性能。
- 高效计算:即使在减少采样步骤的情况下,也能保持或超越现有方法的性能,实现计算效率的提升。
InvSR的技术原理
- 扩散模型框架:基于扩散模型(如DDPM),逐步添加噪声将高分辨率图像转化为低分辨率图像的随机噪声图。
- 部分噪声预测策略:构建扩散模型的中间状态作为起始采样点,简化从低分辨率到高分辨率的反转过程。
- 深度噪声预测器:核心组件之一,用于估计正向扩散过程中的最优噪声图,从而在扩散轨迹上部分初始化采样过程。
- 逆向扩散过程:从噪声图开始,通过逆向扩散过程逐步去除噪声,恢复出高分辨率图像。
- 灵活的采样步骤:选择不同的起始采样点,并结合现有的采样算法,实现不同数量的采样步骤,适应不同的图像退化情况。
- 训练与优化:通过最小化预测高分辨率图像与真实高分辨率图像之间的差异来训练噪声预测器,使用L2损失、LPIPS损失和GAN损失进行训练,优化性能。
如何运行InvSR
快速测试
python inference_invsr.py -i [image folder/image path] -o [result folder] --num_steps 1
- 处理大图像:例如从1k分辨率提升到4k,建议添加选项
--chopping_size 256。 - 其他选项:
- 指定预下载的SD Turbo模型:
--sd_path。 - 指定预下载的噪声预测器:
--started_ckpt_path。 - 采样步骤数量:
--num_steps。 - 如果GPU内存有限,请添加选项
--chopping_bs 1。
在线Demo
你可以通过以下命令尝试在线Demo:
python app.py
资源
- GitHub仓库:https://github.com/zsyOAOA/InvSR
- arXiv技术论文:https://arxiv.org/pdf/2412.09013
- 在线体验Demo:https://huggingface.co/spaces/OAOA/InvSR
热门推荐
减脂补剂选购指南:共轭亚油酸、左旋肉碱、奥利司他和酵素哪个更适合?
营业执照被冒用怎么办?三种方式快速查询,两种途径及时报案
科学发声是什么
肝不好的人养肝尽量做到3个坚持
买车时一般哪个月份优惠最大?
生什么病,忌什么口,一张生病饮食禁忌清单分享给大家
女生平躺腰酸侧躺不酸怎么回事
玉屏田坪:贵州东北部的侗族文化瑰宝
海淘古巴雪茄被海关收50%是什么税?
PDF公式转LaTeX:三个开源项目和一个数据集
论文查重率高怎么办?教你用同义词替换降重的正确姿势!
酸马奶的功效与作用
提高免疫力,优质蛋白质不可少
饮酒后慎用头孢类抗生素,警惕双硫仑样反应
C2驾照适用车型解析(驾照类型与车辆匹配)
如何选择最适合自己手串材质及款式的全面指南
旅行时如何选择适合各种场合佩戴的手串指南
我们为什么会衰老?科学家已经知道或仍在寻找答案
项目经理脱岗如何整改
最新历史前十球员排名:梅西登顶,C罗引发争议
揭秘汽车内饰材质:如何选择环保、舒适又耐用的内饰材料
如何进行APP开发的测试与质量控制
内容营销中最受欢迎的五个内容类型
《战锤40K:星际战士2》试玩:“蓝皮罐头”大战泰伦虫族
中国“宝都”水贝:昔日低端工业区,何以变成全球黄金珠宝交易高地?
DIY电子音乐贺卡:C51单片机项目设计与实现
测力台数据分析:从原理到应用的全面解析
散光眼睛怎么矫正
股票补仓的策略是什么?这种操作如何影响投资组合的风险和收益?
一文读懂正确评估身体的基础数据(BMI、体脂率、腰臀比、基础代谢率)