InvSR:开源图像超分辨率生成模型,提升分辨率,修复老旧照片为超清图像
创作时间:
作者:
@小白创作中心
InvSR:开源图像超分辨率生成模型,提升分辨率,修复老旧照片为超清图像
引用
1
来源
1.
https://developer.aliyun.com/article/1646702
InvSR是一个基于扩散模型的图像超分辨率生成模型,通过逆过程恢复高分辨率图像。它利用深度噪声预测器和灵活的采样机制,支持任意数量的采样步骤,适用于老旧照片修复、视频监控、医疗成像等多个领域。
InvSR是什么
InvSR是一个创新的图像超分辨率模型,基于扩散模型的逆过程恢复高分辨率图像。它利用大型预训练扩散模型中的丰富图像先验知识,通过深度噪声预测器来估计正向扩散过程中所需的最优噪声图。这种方法不仅能够充分利用扩散模型的先验知识,还提供了灵活高效的采样机制,用户可以根据图像退化的类型或特定需求自由调整采样步骤。
InvSR的核心在于其深度噪声预测器,该预测器能够估计出在正向扩散过程中所需的最优噪声图。通过这种方式,InvSR能够在减少采样步骤的情况下,依然保持或超越现有方法的性能,实现计算效率的提升。
InvSR的主要功能
- 图像超分辨率提升:主要功能是提高图像的分辨率,从低分辨率图像恢复出高分辨率图像。
- 灵活的采样机制:支持从一到五个任意数量的采样步骤,用户可以根据图像退化类型或特定需求调整采样步骤。
- 噪声预测:深度噪声预测器估计最优噪声图,用于初始化扩散模型的采样过程。
- 扩散模型利用:充分利用预训练的扩散模型中的图像先验知识,提高超分辨率的性能。
- 高效计算:即使在减少采样步骤的情况下,也能保持或超越现有方法的性能,实现计算效率的提升。
InvSR的技术原理
- 扩散模型框架:基于扩散模型(如DDPM),逐步添加噪声将高分辨率图像转化为低个低分辨率图像的随机噪声图。
- 部分噪声预测策略:构建扩散模型的中间状态作为起始采样点,简化从低分辨率到高分辨率的反转过程。
- 深度噪声预测器:核心组件之一,用于估计正向扩散过程中的最优噪声图,从而在扩散轨迹上部分初始化采样过程。
- 逆向扩散过程:从噪声图开始,通过逆向扩散过程逐步去除噪声,恢复出高分辨率图像。
- 灵活的采样步骤:选择不同的起始采样点,并结合现有的采样算法,实现不同数量的采样步骤,适应不同的图像退化情况。
- 训练与优化:通过最小化预测高分辨率图像与真实高分辨率图像之间的差异来训练噪声预测器,使用L2损失、LPIPS损失和GAN损失进行训练,优化性能。
如何运行InvSR
快速测试
python inference_invsr.py -i [image folder/image path] -o [result folder] --num_steps 1
- 处理大图像:例如从1k分辨率提升到4k,建议添加选项
--chopping_size 256
。 - 其他选项:
- 指定预下载的SD Turbo模型:
--sd_path
。 - 指定预下载的噪声预测器:
--started_ckpt_path
。 - 采样步骤数量:
--num_steps
。 - 如果GPU内存有限,请添加选项
--chopping_bs 1
。
在线Demo
你可以通过以下命令尝试在线Demo:
python app.py
热门推荐
探索神奇碳水:揭示缓解脂肪肝与助减肥的秘密
国债收益率持续下跌意味着什么?
莲子的功效与食用方法
台空军一架“勇鹰”高教机失事坠海
银行贷款手续费怎么算
社保死亡赔偿标准
唐诗中读唐史
安置房小区怎样转为商品房?买安置房还是公寓好?
常用的硅胶产品一般寿命多久
干枣和鲜枣哪种更有营养?答案来了!
数字赋能 黔山贵水人气旺——贵州持续推动文旅产业高质量发展
人均消费:北上每月超4千,湖北赚四块花三块全国第一
天津哪吒小镇:网红打卡圣地邀您体验穿越时空的文化盛宴
国际物流中的电子产品属性大解析:带电、带磁、纯电,怎么区分?
如何将EHS管理体系与企业的具体业务流程相结合?
留美幼童的守望者路康乐:跨越百年的文化追寻
孩子打架时,家长如何进行有效沟通与协调?
万古霉素治疗什么细菌感染
患麻风病不能当国王,为什么此人当了国王,还战胜了强大的敌国
如何让腰围快速减少 5 厘米?探讨多种有效方法,轻松做到!
OTDR-光时域反射计
张雪峰推荐十大专业!附2025十大紧缺专业
让文物“活”起来 —— 陕西历史博物馆文物拟人化创新设计研究
肥胖患者如何调理
豆制品厂生产废水处理方法详解:工艺流程与案例分享
美联储“鹰鸽”交锋:利率政策稳如泰山,美元命运暗藏玄机!
写信地址怎么写?详解各种信件地址书写规范!
基于SSM+Vue的错题管理系统:从开题报告到源码实现
山东:实施"引客入鲁"工程 持续放大"好客山东"吸引力
江苏如东:追新逐绿动能足 向绿求质好“风光”