向量的基本运算及其在Attention模型中的应用
创作时间:
作者:
@小白创作中心
向量的基本运算及其在Attention模型中的应用
引用
腾讯
1.
https://m.mbook.qq.com/read/1047793778/10
向量可以看作一个矢量,即既有大小、又有方向的量。例如,
在2维坐标系中,如图1-6所示。
图1-6
向量之间可以进行数学运算,例如对于2维向量
和
,加法运算为
上式的几何意义,如图1-7所示。
图1-7
向量也可以和一个常数相乘,例如
上式的几何意义相当于对向量进行k倍缩放。如果k<0,就相当于将向量的方向取反,如图1-8所示。
图1-8
如果一个向量可以由其他向量加权求和表示,如
则称α1可以由α2~αm线性表示。
在Attention模型中,模型输出其实是对输入的特征向量组α1,…,αm线性加权求和,即
只不过权重k是通过模型计算产生的。
当使用多层Attention模型时,第二层的输出qi为h1,…,hm的线性组合,即
可以发现,从效果看,qi可以直接用α1,…,αm的线性组合来表示,因此,中间层h1,…,hm就显得有些多余。这说明Attention模型一定要对输出进行非线性变换,否则“深度”就丧失了意义。这也是Transformer模块必须有前馈层FFN的原因之一。
热门推荐
职场应酬如何优雅拒酒?新规出台+健康风险,教你轻松应对酒局考验
高情商拒绝酒局,职场达人教你三招
为什么地球每26秒要脉动一次?科学家苦寻60年,原因至今无解
20部典藏纪录片,带你看遍世界的各个神秘角落
20部典藏纪录片,带你看遍世界的各个神秘角落
燕窝一周吃几次最好,怎么吃?一文说清
学生党也能赚钱,五个适合学生的在线兼职推荐
科目四考试通常需要准备几天才能记住内容?
移民潮下的全球社会结构变迁
麻省预算与政策中心:移民对经济的贡献不容忽视
紫苏高效栽培管理技术要点
紫苏种植全攻略:从播种到收获的详细指南
漫画版权保护与同人创作的边界在哪里?
漫画平台VIP会员制,真的香吗?
利用社交媒体找回丢失的黑狗,你试过吗?
小鸡炖蘑菇,这道菜不仅味道醇厚,而且具有提高免疫力的功效
有机肥料与无机化肥的比较及其在现代农业中的平衡使用
0-3岁宝宝体检项目“全攻略”+注意事项来了!
如何监测和评价宝宝的生长状况?
漫画推广授权平台:高效推广的秘密武器
快看漫画教你如何靠热门作品变现
技能型人才如何进行职业规划?有哪些发展路径?
如何在简历中体现职业稳定性
社交媒体寻狗攻略:让你的毛孩子秒回笼
黑鱼泡派出所助力邻里找回走失狗狗
专业寻狗团队:用科技和专业找回走失的毛孩子
云警说道 | 第一百三十六期——关于摩托车驾驶证考试的那些事
健身达人教你正确热身,告别腿抽筋烦恼
补钙新潮流:告别腿抽筋烦恼
丁香医生详解:腿抽筋的科学应对法