深度学习之视觉特征提取器——AlexNet
创作时间:
作者:
@小白创作中心
深度学习之视觉特征提取器——AlexNet
引用
CSDN
1.
https://blog.csdn.net/m0_61787307/article/details/138488706
AlexNet
参考资料:
(1)ImageNet十年历任霸主之AlexNet - 知乎 (zhihu.com)
(2)AlexNet - Wikipedia
引入
AlexNet在2012年以第一名在Top-1分类精度霸榜ImageNet,并超过第二名近10个百分点。值得注意的是,霸榜2013年的ZFNet实际上是对AlexNet进行调参后得到的更好结果。相比于早期的LeNet实现的十分类,AlexNet能够成功进行一千分类并且达到了一个新的高度。此外,AlexNet证明了神经网络的深度对模型效果至关重要,并且可以利用GPU大大加速这一过程。
尽管AlexNet的知名度和热度可能不如VGG,但其里程碑意义不容忽视。AlexNet不仅在效果上有所突破,更重要的是,它引入了归一化思想、Dropout和ReLU的应用,以及深层网络利用GPU加速等关键技术创新,为后续的研究提供了坚实的基础。
模型结构
AlexNet 包含八层:前五层是卷积层,其中一些是最大池化层,后三层是全连接层。除最后一层外,网络被拆分为两个部分,每个部分在一个 GPU 上运行。整个结构可以写成:
( C N N → L R N → M P ) 2 → ( C N N 3 → M P ) → ( F C → D O ) 2 → L i n e a r → S o f t m a x
其中各个字母分别代表着:
- CNN = 卷积层(后面紧接着激活函数 ReLU)
- LRN = 局部响应归一化(Local Response Normalization)
- MP = 最大池化(Maxpooling)
- FC = 全连接层(后面紧接着激活函数 ReLU)
- 线性 = 全连接层(未激活)
- DO = 随机丢失(Dropout)
更为详细的结构图如下所示:
局部响应归一化(Local Response Normalization)是一种归一化方式,主要针对的是卷积核不同通道上相同位置的参数。用数学公式表示就是:
热门推荐
什么是 AI?了解人工智能
为什么陶瓷那么贵什么原因(瓷器制作过程及价格昂贵的原因)
工艺品一般多少钱
一个万亿城区、两个6千亿城区 深圳今年在望│数读深圳①
因明学是开启佛学文化宝藏的金钥匙
科学减肥法全攻略:膳食、运动与心理,你达标了吗?
被咬后手部麻木是什么原因
狂犬病疫苗接种的最晚时间是什么
胃胀时的饮食指南:这些食物能吃,这些食物要忌口
大樱桃的营养价值与食用指南
离婚半年内不能再婚?律师:法律规定的真相!
如何制定高效的可靠性测试计划?
为什么手机屏幕会闪烁不停(手机一直闪屏是怎么回事)
2025年是“双春年”,又遇上“春打五九尾”,两者相逢好不好?
蛇年得“躲春”?双春年来了!这些事早知道!
王懿荣:甲骨文发现第一人
如何任命团队长干部讲话
项目管理流程图怎么制作
“开门修标”回应民众呼声 电动车新国标持续征求意见
4S店交钱签完合同车有问题?法律视角下的权益保护与应对策略
颈椎病的辨证治疗
英国大学排名参考什么
天津医科大学肿瘤医院完成全球首例通用型CAR-T细胞治疗晚期胰腺癌的临床试验
环评工程师去哪个城市比较好?
高血压必看!血压高怎么调理?8大高血压误区一次讲清
人工智能(AI)解析新冠病毒变异株的流行潜力和宿主嗜性迁移过程
土地市场成交情况如何影响土地价格?
充满悬疑反转,折射社会矛盾,印度“神片”《因果报应》登陆中国
揭秘蜜蜂嗡嗡声:体型越大声音越大?
静宁果农王恩科:蜜蜂对生态环境的重要影响