多模态中的交叉注意力Cross Attention
创作时间:
作者:
@小白创作中心
多模态中的交叉注意力Cross Attention
引用
CSDN
1.
https://blog.csdn.net/qq_34348690/article/details/138368697
交叉注意力(Cross Attention)是多模态模型中一个重要的技术组件,它通过在不同模态之间建立联系,促进了信息的交流和整合,从而提升了模型处理复杂任务的能力。本文将详细介绍交叉注意力的工作原理及其在多模态融合中的应用。
CA作为多模态融合的一个重要组成部分,它通过注意力机制在不同模块之间建立联系,促进信息的交流和整合,从而提升了模型处理复杂任务的能力。
使用它需要明白以下几点要求:
- 两个序列必须具有相同的维度。(因为Query和Key要做点积累,)
- 两个序列可以是不同的模态(如文本、图像)。
- 一个序列作为输入的Query,定义了输出的序列长度,另一个序列作为输入的Key和Value。
具体地说,对于一个文本序列和一个图像序列:
- 文本通过一个Transformer编码器处理,输出作为查询向量Query。
- 图像通过CNN处理,输出经过线性变换生成键Key和值向量Value。
- 计算文本查询向量Query与图像键向量Key的点积,得到注意力分数Attention Score。
- 使用这些分数对图像的值向量Value进行加权,生成最终输出。
如上图所示。
热门推荐
国产与合资真正的较量!星越L对比途观L,究竟该如何选?
日本国立阿伊努民族博物馆:一座体现民族共生精神的建筑杰作
自家也可以栽蓬蘽,不用上山采
王者荣耀急速鞋属性大更新!新版本带来哪些变化?
国家一级保密处方——安宫牛黄丸,到底是个什么药?
洛阳气温玩起“过山车”,牡丹能否稳住阵脚?牡丹专家有话说
导热材料应用案例解决方案探讨
ALT、AST、ALP、GGT,这些指标究竟该怎么看?一文教你读懂肝功能报告
从“一粒种子”结缘 湘非探索农业产业链合作新篇
从靠天吃饭到育出好种子 中国的粮食"耕"基是这样筑成的
房产中介新手如何合法合规运营:法律实务操作指南
怎么确认一辆车是否在某人名下?说4个核查车主方法,手机就能查
15年贷款,提前还5万,利息能少多少?
檐高是指什么高度?
胰腺癌病人出现黄疸怎么治疗
连云港抗战是国军最辉煌的一页:血战289天,打出中国血性
充电桩如何中途停止充电?
康复训练之改善翼状肩小妙招
更年期保养指南:中医解答症状、前兆与治疗方案
《DOTA2》新英雄凯英雄特点公式化玩法
从甘甜到健康:如何合理摄入糖分保持身体平衡
“链”出一年精彩,天津汽车产业澎湃更强“动力”
爬楼梯出汗是在燃脂吗?爬楼梯消耗的热量有多少?
“癌症杀手”质子重离子治疗到底好在哪里?真的有这么神奇吗?
从 TCP/IP 层面解析路由器限速原理
钢的分类和命名方法
一代名将的陨落与明朝军权的血腥洗牌——洪武四大案之蓝玉案
中国创新药十年资本局:狂热、阵痛与新生
新生儿照护指南:科学带娃的7个关键点
港澳台侨联考强化班:港澳台侨生高中阶段的文理科该怎么选?