图像超分辨新突破!南洋理工提出InvSR,利用预训练扩散模型提升SR性能
创作时间:
作者:
@小白创作中心
图像超分辨新突破!南洋理工提出InvSR,利用预训练扩散模型提升SR性能
引用
CSDN
1.
https://blog.csdn.net/xs1997/article/details/144951020
南洋理工大学的研究者们提出了一种基于扩散反演的新型图像超分辨率(SR)技术InvSR,该技术能够利用大型预训练扩散模型中蕴含的丰富图像先验来显著提高SR性能。
核心技术原理
该方法的核心是一个深度噪声预测器,用于估计前向扩散过程的最佳噪声图。一旦训练完成,这个噪声预测器就可以用来初始化沿扩散轨迹的部分采样过程,从而生成理想的高分辨率结果。
效果展示
真实世界图像超分辨率
AIGC 图像增强
不同方法对RealSet80数据集中两个典型真实示例的视觉结果。为了清晰比较,对于基于扩散的方法,采样步骤数以“方法名称-步骤”格式注释。
方法优势
论文提出的方法提供了一种高效灵活的采样机制,允许用户根据降级类型或其特定要求自由调整采样步骤数。在第一个示例中,主要因模糊而降级,多步采样优于单步采样,因为它可以逐步恢复更精细的细节。相反,在第二个具有严重噪声的示例中,单个采样步骤足以获得令人满意的结果,而额外的步骤可能会放大噪声并引入不必要的伪影。
限制
InvSR需要进行平铺操作来生成高分辨率图像,这将大大增加推理时间。由于InvSR的生成特性,有时无法保持100%的保真度。InvSR有时无法在复杂的现实场景下生成完美的细节。
结论
论文提出了一种基于扩散反演的新型SR方法InvSR。该方法引入了一个噪声预测网络,旨在估计最佳噪声图,从而能够构建预训练扩散模型的中间状态作为起始采样点。这种设计在两个方面很有吸引力:首先,InvSR可以充分利用预训练扩散模型中封装的先验知识,从而促进SR性能。其次,InvSR提供了一种灵活的采样策略,能够通过结合噪声预测器的时间相关架构从扩散模型的各种中间状态开始。这种灵活性允许用户根据退化类型或其特定要求自由调整采样步骤。即使将采样步骤减少到只有一个,InvSR仍然表现出比最近的一步基于扩散的方法显著的优势,表明其有效性和效率。
相关链接
热门推荐
八字命理:深入解析与预测未来
番茄需要多久浇一次水(西红柿浇水的正确方法)
小米IPD流程如何提升市场竞争力
不同厌氧发酵工艺类型的特性分析与应用选择
钢琴和弦表图(全)
亲测有效!五张图自测近视、散光、老花等眼部问题
腰椎间盘突出症急性发作怎么处理
音频前置放大器怎么用
探讨模仿文风与抄袭的界限:如何准确判断创作相似度
精卫填海:一个关于坚韧与执着的神话故事
银行的绿色信贷业务是什么?
白灼猪肚怎么做才好吃?
点进来,包你瘦!不信试试?
芒果有什么营养价值呢
得了癌症,不能吃鸽子肉?提醒:5种“发物”确实要少吃
低脂鱼类有哪些鱼的名字
什么是B股票:B股市场的基本概念
3种框架助你绘制完美技术路线图,导师一眼就认可
人造肉的监管政策与标准
企业财务造假案件近期频发:法律实务分析与应对策略
原神钓鱼攻略:鱼饵制作方法与配方大全
BPD是胎儿的什么?从定义到临床应用全解析
淮阳区十大旅游景点
一文看懂《红楼梦》的所有版本
如何理解市场跳空现象的成因?这种跳空如何影响投资者的交易策略?
刘邦为何会被后世称为汉高祖?称呼是怎么来的?
近视手术后遗症——炫光,无法避免?
舌头变黑变紫怎么办?可能因这些原因引起
十大最出名的汕头特产排名 广东汕头必买的十大特产推荐
转速与速度的对应关系是怎样的?