哈工大&北大联手揭秘:多模态信息伪造背后的科学原理
创作时间:
作者:
@小白创作中心
哈工大&北大联手揭秘:多模态信息伪造背后的科学原理
引用
CSDN
等
12
来源
1.
https://blog.csdn.net/qq_43687860/article/details/130708767
2.
https://36kr.com/p/3007682234689028
3.
https://zhuanlan.zhihu.com/p/620803388
4.
https://blog.csdn.net/moxibingdao/article/details/142871860
5.
https://www.sohu.com/a/816072179_121123740
6.
https://new.qq.com/rain/a/20230410A0583V00
7.
https://www.pconline.com.cn/focus/1829/18294850.html
8.
https://hub.baai.ac.cn/view/25365
9.
https://cloud.tencent.com/developer/article/2261430
10.
https://www.ccf.org.cn/YOCSEF/Branches/Shenzhen/News/lt/2024-11-09/834094.shtml
11.
https://ai-bot.cn/fakeshield/
12.
https://www.bilibili.com/video/BV1rh4y1p7ak/
随着人工智能技术的飞速发展,深度伪造(DeepFake)和虚假信息的生成变得越来越容易,对社会安全和信息真实性构成了严重威胁。为了应对这一挑战,哈尔滨工业大学和北京大学分别提出了创新性的多模态信息伪造检测技术,为打击虚假信息传播提供了新的解决方案。
01
哈工大:全球首个「多模态DeepFake检测定位」模型
哈尔滨工业大学(深圳)与南洋理工大学合作,提出了全球首个「多模态DeepFake检测定位」模型(DGM4)。这一研究针对当前多模态假新闻检测的局限性,创新性地提出了检测并定位多模态媒体篡改的新任务。
创新点:
- 新任务定义:不仅判断多模态媒体的真实性,还需定位图像篡改框(BBox)和文本篡改词(Token)。
- 大规模数据集:构建了包含23万张图像-文本对的DGM4数据集,涵盖4种篡改类型(人脸替换FS/属性篡改FA、文本替换TS/属性篡改TA)。
- 分层推理模型:提出了多模态层次化篡改推理模型(HAMMER),通过浅层对比学习和深层交叉注意力机制,实现细粒度的跨模态语义融合。
技术细节:
- 浅层篡改推理:通过篡改感知的对比学习对齐图像和文本特征,利用局部块注意力聚合机制定位图像篡改区域。
- 深层篡改推理:通过模态感知交叉注意力机制进行深度语义推理,实现更精准的篡改检测和定位。
这一研究已发表在计算机视觉顶级会议CVPR 2023上,展示了其在学术界的影响力。
02
北大:基于多模态大语言模型的可解释图像篡改检测定位框架
北京大学与华南理工大学的研究团队则从另一个角度突破,提出了基于多模态大语言模型的可解释图像篡改检测定位框架(FakeShield)。
创新点:
- 可解释性:不仅能检测图像真实性,还能提供基于像素和图像语义错误的合理解释。
- 多模态数据集:构建了多模态篡改描述数据集(MMTD-Set),通过GPT-4o生成「图像-掩膜-描述」三元组。
- 模块化设计:包括域标签引导的可解释伪造检测模块(DTE-FDM)和多模态伪造定位模块(MFLM)两个关键部分。
技术细节:
- DTE-FDM模块:利用数据域标签(domain tag)弥合不同伪造类型数据之间的数据域冲突,引导多模态大语言模型生成检测结果及判定依据。
- MFLM模块:使用DTE-FDM输出的篡改区域描述作为视觉分割模型的Prompt,实现精准定位。
这一研究发表在arxiv预印本上,展示了其在图像篡改检测领域的最新进展。
03
对比分析与未来展望
哈工大和北京大学的研究各有侧重:
- 哈工大的DGM4更侧重于多模态信息的联合检测与定位,通过大规模数据集和分层推理模型实现细粒度的篡改分析。
- 北大的FakeShield则更注重检测结果的可解释性,通过多模态大语言模型提供详细的篡改分析和定位。
两种方法都为多模态信息伪造检测提供了新的思路和解决方案。未来,随着AIGC技术的不断发展,多模态信息伪造检测将面临更多挑战,但同时也将迎来更多创新机遇。这些研究为构建更安全、更可信的信息环境提供了重要技术支持。
热门推荐
如果妈妈是乙肝感染者,那孩子打完最后一针乙肝疫苗后记得做这件事!
孩子骑电动三轮车载人发生事故,责任如何划分?
如何保障虚拟机安全
美国历史上最富戏剧性的一次大选:杜鲁门击败杜威
为何西方国家不炒菜吃?其实并不是因为懒,而是这3个原因
发展前沿新材料新技术 推动石化产业迈向更高端
数据中心AR智慧运维系统
罐车运输乱象调查:食用油与煤制油混用运输,安全隐患令人担忧
车辆过户后原车保险还有效吗?如何处理?
海拔1400米的翠华山为何如此知名?因为它是中国最大山崩地质景观
“出圈”又“出海”!舞剧《红楼梦》为何如此火爆?
文班亚马右肩深静脉血栓:严重但可康复,未来依旧光明
锦鲤鱼的养殖方法和注意事项
孩子多久洗一次头发比较合适?完整指南
葡萄皮的营养价值:肠道、心脏都受益!
倒车入库超详细攻略,小白必看!
2024年化妆品控油祛痘成分榜单TOP20
探访国产夏威夷果采收:百元澳洲果降至十几元,撬动亿元产业
夏威夷果是什么植物的果实?怎么长出来的?我国能种吗?
怎么写人事专员的简历才能吸引HR
苏州园林的空间构成探析
这种小儿肺炎,不咳嗽不发热!发现就进ICU!2招在家识别
怎样正确操作示廓灯?示廓灯的使用场景有哪些?
示廓灯的作用是什么?如何正确使用示廓灯?
上将军衔的由来
狗尾巴草是花还是草?如何区分植物的类别?
如何有效调教体育生提升运动能力
走进泰山:五岳之首的自然与文化之美
在春季多吃玉米的三大好处
离职后如何要求公司补缴社保