手机建站最好的网站,网站建设运营,网站开发都有什么端,百度官网首页入口【深度学习|DenseNet-121】Densely Connected Convolutional Networks内部结构和参数设置
【深度学习|DenseNet-121】Densely Connected Convolutional Networks内部结构和参数设置 文章目录 【深度学习|DenseNet-121】Densely Connected Convolutional Networks内部结构和参数…【深度学习|DenseNet-121】Densely Connected Convolutional Networks内部结构和参数设置
【深度学习|DenseNet-121】Densely Connected Convolutional Networks内部结构和参数设置 文章目录 【深度学习|DenseNet-121】Densely Connected Convolutional Networks内部结构和参数设置前言1. 网络总体结构2. 具体层次结构(1) 输入层Input Layer(2) 第一卷积层Conv1(3) Dense Block 1 (DB1)(4) Transition Layer 1 (TL1)(5) Dense Block 2 (DB2)(6) Transition Layer 2 (TL2)(7) Dense Block 3 (DB3)(8) Transition Layer 3 (TL3)(9) Dense Block 4 (DB4)(10) 全局平均池化层Global Average Pooling(11) 全连接层Fully Connected Layer 3. 参数设置4. 总结2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025) 欢迎宝子们点赞、关注、收藏欢迎宝子们批评指正 祝所有的硕博生都能遇到好的导师好的审稿人好的同门顺利毕业 大多数高校硕博生毕业要求需要参加学术会议发表EI或者SCI检索的学术论文会议论文 可访问艾思科蓝官网浏览即将召开的学术会议列表。会议详细信息可参考https://ais.cn/u/mmmiUz 前言
DenseNet121 是 DenseNetDensely Connected Convolutional Networks架构中的一个重要版本它采用了密集连接dense connection策略其中每一层都与前面所有的层相连接。DenseNet121的“121”表示它包含121个卷积层。接下来我将逐层详细说明 DenseNet121 的内部结构和参数设置。
1. 网络总体结构
DenseNet121 的总体架构分为以下几个主要部分
卷积层Convolutional Layer最开始的卷积层Conv1用于对输入图像进行初步处理。密集块Dense BlocksDenseNet121 包含4个密集块每个密集块由若干个密集单元Dense Units组成。每个密集单元的输出连接到后续所有单元并且每个密集单元的输入是所有前面单元的输出。过渡层Transition Layers每个密集块之间会有一个过渡层它包括一个1×1卷积层和一个2×2的平均池化层Average Pooling。全局平均池化层Global Average Pooling在最后一个密集块后使用全局平均池化。全连接层Fully Connected Layer全连接层用于输出预测结果。
2. 具体层次结构
(1) 输入层Input Layer
输入尺寸通常为 224×224×3即输入的图像大小为224x224具有3个颜色通道RGB。
(2) 第一卷积层Conv1
卷积层1个卷积层过滤器大小为7×7步长为2输出通道数为64。BatchNorm进行批归一化减少内部协方差偏移。ReLU 激活应用ReLU激活函数。池化层3×3最大池化步长为2减小空间维度。
输入的大小为 224×224×3经过这个层之后输出 112×112×64。
(3) Dense Block 1 (DB1)
层数包含6个Dense Units。每个Dense Unit每个Dense Unit由3层组成1×1卷积层瓶颈层减少通道数3×3卷积层标准卷积层增加特征数量。每个Dense Unit的输出特征图将与前面所有的输出特征图连接。
在Dense Block 1 之后输出的特征图维度为 56×56×256。
(4) Transition Layer 1 (TL1)
1×1卷积层用于降低通道数通常减少至128个通道。平均池化层进行2×2平均池化步长为2减小空间维度。
输出的特征图维度为 28×28×128。
(5) Dense Block 2 (DB2)
层数包含12个Dense Units。每个Dense Unit和第一个密集块相同由1×1卷积层和3×3卷积层组成每个单元的输出连接到所有前面的单元。
在Dense Block 2 之后输出的特征图维度为 28×28×512。
(6) Transition Layer 2 (TL2)
1×1卷积层减少通道数通常减少至256个通道。平均池化层2×2平均池化步长为2。
输出的特征图维度为 14×14×256。
(7) Dense Block 3 (DB3)
层数包含24个Dense Units。每个Dense Unit同样是由1×1卷积和3×3卷积组成每个单元的输出连接到前面的所有单元。
在Dense Block 3 之后输出的特征图维度为 14×14×1024。
(8) Transition Layer 3 (TL3)
1×1卷积层将通道数减少到512。平均池化层进行2×2的平均池化。
输出的特征图维度为 7×7×512。
(9) Dense Block 4 (DB4)
层数包含16个Dense Units。每个Dense Unit继续由1×1卷积层和3×3卷积层构成所有单元的输出继续连接。
在Dense Block 4之后输出的特征图维度为 7×7×1024。
(10) 全局平均池化层Global Average Pooling
池化层将特征图的每个通道进行平均池化从 7×7×1024 压缩成 1×1×1024。
输出的维度为 1×1×1024。
(11) 全连接层Fully Connected Layer
FC层最后通过一个全连接层映射到目标类别数的维度。例如在分类任务中如果有1000个类别则输出维度为1000。
3. 参数设置
Growth Rate每个Dense Unit的增长率growth rate通常设定为32这表示每经过一个Dense Unit输出的特征图的通道数将增加32个。DropoutDenseNet121的实现中通常会加入dropout层防止过拟合。它的使用通常是0.2到0.5之间。初始化方法通常使用He初始化He Initialization来初始化卷积层以避免梯度消失问题。激活函数在所有卷积层后应用ReLU激活函数。批归一化所有卷积层和全连接层后面都应用了批归一化Batch Normalization操作。
4. 总结
DenseNet121 是一个非常高效且深度的神经网络通过密集连接每个层的输出使得模型能够有效地重用特征并减少参数量。尽管具有较多的层数但由于密集连接它的参数量相比于传统的深度神经网络例如VGG要少得多且能够取得更好的性能。
2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)
2025 International Conference on Advances in Computer Vision Research and Applications2025年2月28-3月2日 广州会议官网www.acvra.orgEI检索稳定接受/拒稿通知投稿后1周左右