YOLO算法中的CBR、CBL、CBM和CBS模块详解
创作时间:
作者:
@小白创作中心
YOLO算法中的CBR、CBL、CBM和CBS模块详解
引用
CSDN
1.
https://blog.csdn.net/m0_49699378/article/details/145928032
YOLO(You Only Look Once)算法是目前最流行的实时目标检测算法之一,其核心模块包括CBR、CBL、CBM和CBS等。这些模块通过卷积层、批归一化层以及不同的激活函数组合,实现了高效的特征提取和目标检测。本文将详细介绍这些模块的组成和特点,并提供Mish激活函数和CBM模块的PyTorch实现代码示例。
CBR模块
CBR模块由卷积层(Conv)、批归一化层(BN)和ReLU激活函数组成。其结构如下:
- 卷积层(Conv):用于提取输入特征图的局部特征。
- 批归一化层(BN):对卷积层的输出进行归一化处理,加速网络训练并提高模型稳定性。
- ReLU激活函数:引入非线性因素,使得模型能够学习到复杂的映射关系。
CBL模块
CBL模块与CBR模块类似,但使用Leaky ReLU作为激活函数。其结构如下:
- 卷积层(Conv):用于提取输入特征图的局部特征。
- 批归一化层(BN):对卷积层的输出进行归一化处理。
- Leaky ReLU激活函数:允许小梯度值的通过,避免了ReLU激活函数在输入小于0时梯度为0的问题,从而提高了网络的训练效果。
CBM模块
CBM模块使用Mish激活函数,其结构如下:
- 卷积层(Conv):用于提取输入特征图的局部特征。
- 批归一化层(BN):对卷积层的输出进行归一化处理。
- Mish激活函数:一种非线性激活函数,用于引入非线性因素,增强网络的表达能力。Mish激活函数的公式为f(x)=x⋅tanh(log(1+ex)),它相比其他激活函数(如ReLU、Leaky ReLU等)在保持梯度稳定性的同时,能够更好地捕捉输入数据的微小变化。
CBS模块
CBS模块使用SiLU激活函数,其结构如下:
- 卷积层(Conv):用于提取输入特征图的局部特征。
- 批归一化层(BN):对卷积层的输出进行归一化处理。
- SiLU激活函数:SiLU激活函数的公式为silu(x)=x⋅sigmoid(x),它是swish激活函数的一个变体,具有平滑、非单调的特性,有助于缓解梯度消失问题。
激活函数对比
下图展示了不同激活函数的图像,从左到右依次为ReLU、Leaky ReLU、Mish和SiLU。
PyTorch实现CBM模块和Mish激活函数
以下是Mish激活函数和CBM模块的PyTorch实现代码示例:
import torch
import torch.nn as nn
import torch.nn.functional as F
# 定义Mish激活函数
class Mish(nn.Module):
def __init__(self):
super(Mish, self).__init__()
def forward(self, x):
return x * torch.tanh(F.softplus(x))
# 定义CBM模块
class CBM(nn.Module):
def __init__(self, in_channels, out_channels, kernel_size, stride=1, padding=0):
super(CBM, self).__init__()
self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding, bias=False)
self.bn = nn.BatchNorm2d(out_channels)
self.mish = Mish()
def forward(self, x):
x = self.conv(x)
x = self.bn(x)
x = self.mish(x)
return x
# 示例使用
if __name__ == "__main__":
# 假设输入张量的形状为 [batch_size, in_channels, height, width]
# 这里我们使用随机数据来模拟输入
batch_size, in_channels, height, width = 1, 3, 224, 224
x = torch.randn(batch_size, in_channels, height, width)
# 创建一个CBM模块实例,参数根据实际情况调整
cbm = CBM(in_channels=in_channels, out_channels=64, kernel_size=3, stride=1, padding=1)
# 通过CBM模块
output = cbm(x)
# 打印输出张量的形状
print(output.shape) # 输出应为 [batch_size, 64, height, width],其中height和width可能因padding和stride而改变
通过以上代码,读者可以快速实现CBM模块并在自己的项目中使用。
热门推荐
离异后卖房税务攻略:五种税费计算及优惠政策
遗像处理的文化习俗,你怎么看?
传统文化与心理健康:逝者照片该何去何从?
饭局点菜有门道:成双成对是基本,细节决定成败
麻黄汤PK西药,谁才是感冒终结者?
从平台选择到隐私保护:打造安全网络社交圈
垫江牡丹樱花世界:60万株郁金香与百种牡丹竞相绽放,打造春日赏花胜地
垫江牡丹樱花世界:重庆最大赏花胜地,40种樱花等你来
垫江牡丹樱花世界自驾游打卡攻略
垫江牡丹樱花世界绝美拍照点推荐
美国研究生跨学科申请升温,这些准备助你成功
全球第八、亚洲第一,NUS硕士申请条件详解
专家解析湿疹治疗四大误区,提供科学防治方案
头癣治疗必知:4种有效药膏和护理要点
50岁男子三支血管严重阻塞,专家提醒:这些习惯可预防冠心病
哈家牛肉罩火烧:从1927年延续至今的石家庄味道
拉萨周边游打卡:纳木错、羊卓雍错、甘丹寺
金凤扒鸡领衔,石家庄四大百年美食全解析
砀山梨树王景区全攻略:门票、花期、交通一文掌握
安吉竹子博览园:396种竹子与3只大熊猫的奇妙邂逅
《阳光灿烂的日子》:王朔电影的青春印记
《阳光灿烂的日子》:王朔小说改编电影的成功典范
郴州新晋工业旅游示范点全攻略:从“功勋铀矿”到丹崖碧水
东江湖风景区:郴州最美自然景观
一文读懂柏子仁:养心安神的常用中药材
便秘患者心理调适指南:专家教你摆脱烦恼
Intel i5-2450M:老处理器还能畅玩游戏吗?
38岁变外公!这部喜剧在上海电影节笑翻观众
牛奶鸡蛋瘦肉,维生素B2的最佳拍档
冬季养生:牛奶、鸡蛋、绿叶蔬菜补维B2