向量的基本运算及其在Attention模型中的应用
创作时间:
作者:
@小白创作中心
向量的基本运算及其在Attention模型中的应用
引用
腾讯
1.
https://m.mbook.qq.com/read/1047793778/10
向量可以看作一个矢量,即既有大小、又有方向的量。例如,
在2维坐标系中,如图1-6所示。
图1-6
向量之间可以进行数学运算,例如对于2维向量
和
,加法运算为
上式的几何意义,如图1-7所示。
图1-7
向量也可以和一个常数相乘,例如
上式的几何意义相当于对向量进行k倍缩放。如果k<0,就相当于将向量的方向取反,如图1-8所示。
图1-8
如果一个向量可以由其他向量加权求和表示,如
则称α1可以由α2~αm线性表示。
在Attention模型中,模型输出其实是对输入的特征向量组α1,…,αm线性加权求和,即
只不过权重k是通过模型计算产生的。
当使用多层Attention模型时,第二层的输出qi为h1,…,hm的线性组合,即
可以发现,从效果看,qi可以直接用α1,…,αm的线性组合来表示,因此,中间层h1,…,hm就显得有些多余。这说明Attention模型一定要对输出进行非线性变换,否则“深度”就丧失了意义。这也是Transformer模块必须有前馈层FFN的原因之一。
热门推荐
拉饵和搓饵的区别,制作方法、重量、雾化程度等方面均不同
肺部血氧饱和度低代表了什么? 提高血氧饱和度的方法有哪些
幼儿遗尿的预防和纠正
为何我们能在现生看见逝者?
全球经济复苏——新兴市场是否值得投资?
全球经济的复苏动力:关键因素分析
48V24Ah的锂电池,续航里程能超过100公里?车主真实测试数据来了
手麻别以为甩甩就好,关键时刻会要命
结婚后转北京户口的手续指南
北京夫妻投靠入户条件详解
托卢卡再创辉煌,客场力克内卡萨:墨超焦点战回顾
【健康科普】最近胃口突然变好、食欲大增?要当心这5种疾病!
1岁多的孩子积食应该吃什么
张大千与荷花:出淤泥而不染的艺术人生
国人公认的十大垃圾零食,让人又爱又恨
胃酸反流的综合治疗方案
NGO、NPO是什么?有什么区别?
什么是领导力模型
网约车车型要求和条件
绿意盎然:掌握种韭菜丰产栽培技术,迈向韭菜种植的成功之路
韭菜栽培时间
专家提醒:孕期使用香水需谨慎,这些化学物质或影响胎儿健康
如何调节小儿积食
波特率单位是b还是bps?一文带你彻底搞懂数据传输速率单位
喉咙痒能不能吃氯雷他定片
影响房价的因素及选房注意事项
解密片仔癀:古老智慧的现代奇迹
多种静脉疾病及其治疗方法
适合宠物的配音音乐
用户裂变团队如何裂变:从理解用户到优化策略的全方位指南