深度学习之视觉特征提取器——AlexNet
创作时间:
作者:
@小白创作中心
深度学习之视觉特征提取器——AlexNet
引用
CSDN
1.
https://blog.csdn.net/m0_61787307/article/details/138488706
AlexNet
参考资料:
(1)ImageNet十年历任霸主之AlexNet - 知乎 (zhihu.com)
(2)AlexNet - Wikipedia
引入
AlexNet在2012年以第一名在Top-1分类精度霸榜ImageNet,并超过第二名近10个百分点。值得注意的是,霸榜2013年的ZFNet实际上是对AlexNet进行调参后得到的更好结果。相比于早期的LeNet实现的十分类,AlexNet能够成功进行一千分类并且达到了一个新的高度。此外,AlexNet证明了神经网络的深度对模型效果至关重要,并且可以利用GPU大大加速这一过程。
尽管AlexNet的知名度和热度可能不如VGG,但其里程碑意义不容忽视。AlexNet不仅在效果上有所突破,更重要的是,它引入了归一化思想、Dropout和ReLU的应用,以及深层网络利用GPU加速等关键技术创新,为后续的研究提供了坚实的基础。
模型结构
AlexNet 包含八层:前五层是卷积层,其中一些是最大池化层,后三层是全连接层。除最后一层外,网络被拆分为两个部分,每个部分在一个 GPU 上运行。整个结构可以写成:
( C N N → L R N → M P ) 2 → ( C N N 3 → M P ) → ( F C → D O ) 2 → L i n e a r → S o f t m a x
其中各个字母分别代表着:
- CNN = 卷积层(后面紧接着激活函数 ReLU)
- LRN = 局部响应归一化(Local Response Normalization)
- MP = 最大池化(Maxpooling)
- FC = 全连接层(后面紧接着激活函数 ReLU)
- 线性 = 全连接层(未激活)
- DO = 随机丢失(Dropout)
更为详细的结构图如下所示:
局部响应归一化(Local Response Normalization)是一种归一化方式,主要针对的是卷积核不同通道上相同位置的参数。用数学公式表示就是:
热门推荐
保底收益保障机制:投资中的稳定基石
生肖猴的性格与特点
铁路调图!广州南站东站增直达站点,过港列车再“解锁”新城市
容易饿是什么原因
茅台酒有木盒装的吗
白粥喝腻了?5种粗粮“黄金CP”吃出早餐仪式感,营养控糖两手抓
上有收益、下有保底,关于“可转债”,你了解多少?
韩国台湾人均GDP陆续首次超过日本 东亚经济格局变化显著
文献管理工具Zotero7的安装与配置
电动汽车充电桩安装流程详解
不知如何跟孩子谈“生死”?这些电影可以帮到你
反复烧开的水不能喝?医生:这3类水,喝了心脏负担直线加重
用万用表怎样辨别零线火线地线
中元节几时祭祖?不早不晚,有讲究,老祖宗定下的规矩
瓜迪奥拉谈曼城伤病、对手及未来规划
新疆天山天池旅游攻略:详细路线及实用建议
高压电机的维护技巧与常见问题(高压电机维护和保养标准)
李白写自由的诗句赏析
这些重大基础设施,让“一带一路”更加联通
天下为公——什么是孙中山真正的遗产?
头痛很常见!但这4种情况千万别硬抗
核桃的正确吃法:健康养生从细节开始
探索甘蔗渣:甘蔗纤维的可持续解决方案
胆囊切除后有什么危害
银行的网上银行登录密码忘记怎么办?
慢性咳嗽是什么毛病?得了慢性咳嗽该怎么办?
红糖真的可以解酒吗?从科学角度解析糖与酒精代谢的关系
中药材葛根:从产地到功效的全面解析
茅台酒包装盒特点及啤酒相关知识
公司倒闭后车辆过户给个人的详细流程及注意事项