哈工大&北大联手揭秘:多模态信息伪造背后的科学原理
创作时间:
作者:
@小白创作中心
哈工大&北大联手揭秘:多模态信息伪造背后的科学原理
引用
CSDN
等
12
来源
1.
https://blog.csdn.net/qq_43687860/article/details/130708767
2.
https://36kr.com/p/3007682234689028
3.
https://zhuanlan.zhihu.com/p/620803388
4.
https://blog.csdn.net/moxibingdao/article/details/142871860
5.
https://www.sohu.com/a/816072179_121123740
6.
https://new.qq.com/rain/a/20230410A0583V00
7.
https://www.pconline.com.cn/focus/1829/18294850.html
8.
https://hub.baai.ac.cn/view/25365
9.
https://cloud.tencent.com/developer/article/2261430
10.
https://www.ccf.org.cn/YOCSEF/Branches/Shenzhen/News/lt/2024-11-09/834094.shtml
11.
https://ai-bot.cn/fakeshield/
12.
https://www.bilibili.com/video/BV1rh4y1p7ak/
随着人工智能技术的飞速发展,深度伪造(DeepFake)和虚假信息的生成变得越来越容易,对社会安全和信息真实性构成了严重威胁。为了应对这一挑战,哈尔滨工业大学和北京大学分别提出了创新性的多模态信息伪造检测技术,为打击虚假信息传播提供了新的解决方案。
01
哈工大:全球首个「多模态DeepFake检测定位」模型
哈尔滨工业大学(深圳)与南洋理工大学合作,提出了全球首个「多模态DeepFake检测定位」模型(DGM4)。这一研究针对当前多模态假新闻检测的局限性,创新性地提出了检测并定位多模态媒体篡改的新任务。
创新点:
- 新任务定义:不仅判断多模态媒体的真实性,还需定位图像篡改框(BBox)和文本篡改词(Token)。
- 大规模数据集:构建了包含23万张图像-文本对的DGM4数据集,涵盖4种篡改类型(人脸替换FS/属性篡改FA、文本替换TS/属性篡改TA)。
- 分层推理模型:提出了多模态层次化篡改推理模型(HAMMER),通过浅层对比学习和深层交叉注意力机制,实现细粒度的跨模态语义融合。
技术细节:
- 浅层篡改推理:通过篡改感知的对比学习对齐图像和文本特征,利用局部块注意力聚合机制定位图像篡改区域。
- 深层篡改推理:通过模态感知交叉注意力机制进行深度语义推理,实现更精准的篡改检测和定位。
这一研究已发表在计算机视觉顶级会议CVPR 2023上,展示了其在学术界的影响力。
02
北大:基于多模态大语言模型的可解释图像篡改检测定位框架
北京大学与华南理工大学的研究团队则从另一个角度突破,提出了基于多模态大语言模型的可解释图像篡改检测定位框架(FakeShield)。
创新点:
- 可解释性:不仅能检测图像真实性,还能提供基于像素和图像语义错误的合理解释。
- 多模态数据集:构建了多模态篡改描述数据集(MMTD-Set),通过GPT-4o生成「图像-掩膜-描述」三元组。
- 模块化设计:包括域标签引导的可解释伪造检测模块(DTE-FDM)和多模态伪造定位模块(MFLM)两个关键部分。
技术细节:
- DTE-FDM模块:利用数据域标签(domain tag)弥合不同伪造类型数据之间的数据域冲突,引导多模态大语言模型生成检测结果及判定依据。
- MFLM模块:使用DTE-FDM输出的篡改区域描述作为视觉分割模型的Prompt,实现精准定位。
这一研究发表在arxiv预印本上,展示了其在图像篡改检测领域的最新进展。
03
对比分析与未来展望
哈工大和北京大学的研究各有侧重:
- 哈工大的DGM4更侧重于多模态信息的联合检测与定位,通过大规模数据集和分层推理模型实现细粒度的篡改分析。
- 北大的FakeShield则更注重检测结果的可解释性,通过多模态大语言模型提供详细的篡改分析和定位。
两种方法都为多模态信息伪造检测提供了新的思路和解决方案。未来,随着AIGC技术的不断发展,多模态信息伪造检测将面临更多挑战,但同时也将迎来更多创新机遇。这些研究为构建更安全、更可信的信息环境提供了重要技术支持。
热门推荐
功率半导体器件:类型与应用解析
各种耳机驱动单元,它们到底有啥不同?一文带你了解清楚
降噪耳机怎么选?“平均降噪深度”比“最大降噪深度”更重要
春季如何提高绿化工程新栽植物的成活率?
比尔·鲁安:投资四原则
多项纪录刷新!第十批集采上海开标:涉62个品种,多款注射液拟中选价低于1元
古希腊文明与中国春秋战国时期的对比分析
AI看病,智慧医疗,内蒙古已经开始了……
包钢白云鄂博矿区绿电直供项目奠基
格华止与二甲双胍区别
如何通过合理的股票补仓来降低风险?这种补仓操作如何考虑市场行情?
转户口后身份证要换吗
探索中国石刻艺术巅峰——洛阳龙门石窟
贷款房产加名字:手续流程全攻略
胡辣汤:中原暖阳下的味蕾记忆与文化传承
电热水器选购全攻略:从类型到安装,一文详解选购要点
常见锅炉除尘器有哪些 锅炉除尘器怎么进行选型计算
火力发电厂烟气主要污染物科普
【药师说药】走进非奈利酮的世界:揭开新型盐皮质激素受体拮抗剂的神秘面纱
舌头上的溃疡半年不见好,一查已是癌,还有人全舌被切除!这种口腔溃疡很危险
春节出行遇上流感季,这份儿童常备药清单请收好
定期清理iPhone软件缓存,提升设备性能与存储空间
老年人吃什么提高免疫力
流感疫苗增加老年人的超级免疫力
手机如何正确清洁?别再用酒精擦了
劳动法关于员工旷工的法律规定
2024年结婚的新人,这50条备婚经验一定要知道!
焦虑症和抑郁症同时存在吗
水肥一体化技术,你了解多少?
抑郁症与焦虑症的区别:症状、成因、诊断与治疗全解析