哈工大&北大联手揭秘:多模态信息伪造背后的科学原理
创作时间:
作者:
@小白创作中心
哈工大&北大联手揭秘:多模态信息伪造背后的科学原理
引用
CSDN
等
12
来源
1.
https://blog.csdn.net/qq_43687860/article/details/130708767
2.
https://36kr.com/p/3007682234689028
3.
https://zhuanlan.zhihu.com/p/620803388
4.
https://blog.csdn.net/moxibingdao/article/details/142871860
5.
https://www.sohu.com/a/816072179_121123740
6.
https://new.qq.com/rain/a/20230410A0583V00
7.
https://www.pconline.com.cn/focus/1829/18294850.html
8.
https://hub.baai.ac.cn/view/25365
9.
https://cloud.tencent.com/developer/article/2261430
10.
https://www.ccf.org.cn/YOCSEF/Branches/Shenzhen/News/lt/2024-11-09/834094.shtml
11.
https://ai-bot.cn/fakeshield/
12.
https://www.bilibili.com/video/BV1rh4y1p7ak/
随着人工智能技术的飞速发展,深度伪造(DeepFake)和虚假信息的生成变得越来越容易,对社会安全和信息真实性构成了严重威胁。为了应对这一挑战,哈尔滨工业大学和北京大学分别提出了创新性的多模态信息伪造检测技术,为打击虚假信息传播提供了新的解决方案。
01
哈工大:全球首个「多模态DeepFake检测定位」模型
哈尔滨工业大学(深圳)与南洋理工大学合作,提出了全球首个「多模态DeepFake检测定位」模型(DGM4)。这一研究针对当前多模态假新闻检测的局限性,创新性地提出了检测并定位多模态媒体篡改的新任务。
创新点:
- 新任务定义:不仅判断多模态媒体的真实性,还需定位图像篡改框(BBox)和文本篡改词(Token)。
- 大规模数据集:构建了包含23万张图像-文本对的DGM4数据集,涵盖4种篡改类型(人脸替换FS/属性篡改FA、文本替换TS/属性篡改TA)。
- 分层推理模型:提出了多模态层次化篡改推理模型(HAMMER),通过浅层对比学习和深层交叉注意力机制,实现细粒度的跨模态语义融合。
技术细节:
- 浅层篡改推理:通过篡改感知的对比学习对齐图像和文本特征,利用局部块注意力聚合机制定位图像篡改区域。
- 深层篡改推理:通过模态感知交叉注意力机制进行深度语义推理,实现更精准的篡改检测和定位。
这一研究已发表在计算机视觉顶级会议CVPR 2023上,展示了其在学术界的影响力。
02
北大:基于多模态大语言模型的可解释图像篡改检测定位框架
北京大学与华南理工大学的研究团队则从另一个角度突破,提出了基于多模态大语言模型的可解释图像篡改检测定位框架(FakeShield)。
创新点:
- 可解释性:不仅能检测图像真实性,还能提供基于像素和图像语义错误的合理解释。
- 多模态数据集:构建了多模态篡改描述数据集(MMTD-Set),通过GPT-4o生成「图像-掩膜-描述」三元组。
- 模块化设计:包括域标签引导的可解释伪造检测模块(DTE-FDM)和多模态伪造定位模块(MFLM)两个关键部分。
技术细节:
- DTE-FDM模块:利用数据域标签(domain tag)弥合不同伪造类型数据之间的数据域冲突,引导多模态大语言模型生成检测结果及判定依据。
- MFLM模块:使用DTE-FDM输出的篡改区域描述作为视觉分割模型的Prompt,实现精准定位。
这一研究发表在arxiv预印本上,展示了其在图像篡改检测领域的最新进展。
03
对比分析与未来展望
哈工大和北京大学的研究各有侧重:
- 哈工大的DGM4更侧重于多模态信息的联合检测与定位,通过大规模数据集和分层推理模型实现细粒度的篡改分析。
- 北大的FakeShield则更注重检测结果的可解释性,通过多模态大语言模型提供详细的篡改分析和定位。
两种方法都为多模态信息伪造检测提供了新的思路和解决方案。未来,随着AIGC技术的不断发展,多模态信息伪造检测将面临更多挑战,但同时也将迎来更多创新机遇。这些研究为构建更安全、更可信的信息环境提供了重要技术支持。
热门推荐
橘子洲头新动态:文化与生态交融发展
取熊胆是否违法?了解一下相关法律法规
我国药品定价政策及所需考虑的市场因素
告别春节肥:2:1:1、16:8、生酮饮食哪个更适合你?
不饿肚子也能瘦!一周七天减脂蒸菜食谱全攻略
高蛋白低脂,搭配运动效果翻倍:专业减重食谱详解
春节看《将进酒》,李白陪你过年啦!
祝允明VS李白:《将进酒》的艺术对话
养老诈骗新套路:从“以房养老”到“代办保险”,这些陷阱要当心
乙型肝炎导致肝衰竭的五大病因及治疗对策
浙大改良MELD评分,ACLF患者预后预测提升10%
肝衰竭患者死亡主因:医生详解病情发展差异
香港升级防诈骗约章,覆盖230多家机构和商户
中国发布新版肝衰竭指南,多项创新技术助力ACLF治疗
银行预警系统识破“公检法”骗局,为老人保住20万积蓄
柳州严查涉老食品保健品诈骗:立案64件,涉案超3100万
银行的大额存单质押贷款后提前支取的规定有哪些?
高达6.9%!大额存单转让又香了?
鹅肉怎么做更好吃?如何挑选口感好的鹅肉?
冬季防火指南:掌握救火基本功
国家消防救援局揭秘:救火与灭火的幕后英雄
五行配色与家居风水:打造旺运居住空间
从故宫红墙到家居配色:五行颜色理论的古今应用
五行五色:从古建服饰到现代生活的色彩智慧
一座故宫五种颜色:解读中国古代建筑色彩美学
扎鲁特旗举办“新时代·新年画”首届年画展
2025央视春晚:白鹿、沈腾、马丽、李宇春、毛不易齐登场!
《山海情》原型地:闽宁镇的现实版脱贫故事
《山海情》热播:艺术再现中国扶贫攻坚伟大实践
阅文两大IP入选全球十大,中国数字文化加速出海