南京做网站南京乐识专注,婚庆策划公司名称,莱州教研室网站,网站制作工具 织梦卷积层[Conv]#xff1a;
卷积CNN是我们最常使用的#xff0c;但是有时候需要观察他的输出前后的差异#xff0c;这里描述下计算方式#xff0c;具体如下#xff1a;
图片大小#xff1a;WxHxD W:宽 H:高 D:通道#xff08;RGB#xff09; 例:320x320x3
卷积核
卷积CNN是我们最常使用的但是有时候需要观察他的输出前后的差异这里描述下计算方式具体如下
图片大小WxHxD W:宽 H:高 D:通道RGB 例:320x320x3
卷积核NxNx3 卷积核大小 后面的3是和图片的通道对应如果图片是灰度的那么就是1
卷积核个数C
步长S 每次一卷积的时候跨越的步长
填充P 外网填充多少行和列一般是图片保留特征或者是维持图片大小
公式计算
输出数据的高度OH (H - N 2P) / S 1 输出数据的宽度OW (W - N 2P) / S 1 输出数据的深度OD 卷积核的个数C
*如果输出数据的尺寸不是整数会对输出数据进行四舍五入或者向下取整等操作。
例子
输入数据为3x320x320
我们这里是BGR的图片一般cv默认处理就是BGR图片通道是3宽和高都是320也可以理解为三张320x320的图片方便神经网络的处理
卷积参数卷积个数16卷积核3x4x4 由于通道是3卷积核宽和高都是4当然卷积核默认都是奇数这里测试写了个偶数4选择偶数会导致特征偏移不建议、步长3 填充2
根据公式计算
输出图片宽(320 - 4 2x2/ 3 ) 1 107.6666 ≈ 107选择向下取整也可以四舍五入看算法
输出图片高(320 - 4 2x2/ 3 ) 1 107.6666 ≈ 107选择向下取整也可以四舍五入看算法
通道数16直接为卷积核个数
输出的数据为16x107x107 池化层[Pool]
池化也是提取特征可以达到快速缩小特征比如最大池化、平均池化
里面包含的也是 滤波器 步长
图片大小WxHxD W:宽 H:高 D:通道RGB 例:320x320x3
滤波器NxN 滤波器的宽高
公式和卷积差不多没有填充
输出数据的高度OH (H - N ) / S 1 输出数据的宽度OW (W - N ) / S 1
例子
图片输入3x320x320
池化层3x3 步长 2
根据公式计算:
输出图片宽(320 - 3/ 2 ) 1 159.5≈ 159选择向下取整也可以四舍五入看算法
输出图片高(320 - 3/ 2 ) 1 159.5≈ 159选择向下取整也可以四舍五入看算法
通道数3
输出数据为3x159x159 膨胀卷积【Conv】
卷积的一种在卷积核中插入空洞dilation来扩大感受野从而捕捉更广泛的上下文信息。膨胀卷积通常用于处理具有较大空间范围的输入数据(个人理解其实就是特征图太紧凑了比如鼻子嘴巴都黏到一起了通过添加一些空白值把鼻子和嘴巴隔开些更好的观察分析如果离得太近可能在某次池化或者卷积就把特征卷没了)用途如图像分割、语义分割包含膨胀卷积、扩张卷积、空洞卷积。
根常规的卷积比增加了一个膨胀因子R,具体如下
图片大小WxHxD W:宽 H:高 D:通道RGB 例:320x320x3
卷积核NxNx3 卷积核大小 后面的3是和图片的通道对应如果图片是灰度的那么就是1
卷积核个数C
膨胀因子R (增加视野的参数
步长S 每次一卷积的时候跨越的步长
填充P 外网填充多少行和列一般是图片保留特征或者是维持图片大小
首先需要根据膨胀卷积计算出感受野其实就是相当正常卷积的卷积核宽高N
感受野假设为D,感受野大小 (卷积核大小 - 1) * 膨胀率 1
感受野D的计算公式D (N-1)*R-1 N
输出数据的高度OH (H - D 2P) / S 1 输出数据的宽度OW (W - D 2P) / S 1 输出数据的深度OD 卷积核的个数C 例子
输入数据为3x320x320
我们这里是BGR的图片一般cv默认处理就是BGR图片通道是3宽和高都是320也可以理解为三张320x320的图片方便神经网络的处理
卷积参数卷积个数16卷积核3x4x4 由于通道是3卷积核宽和高都是4当然卷积核默认都是奇数这里测试写了个偶数4选择偶数会导致特征偏移不建议、膨胀因子为21为默认卷积、步长3 填充2
根据公式计算
感受野计算D (4-1)*(2-1)4 7
输出图片宽(320 - 7 2x2/ 3 ) 1 106.6666 ≈ 106选择向下取整也可以四舍五入看算法
输出图片高(320 - 7 2x2/ 3 ) 1 106.6666 ≈ 106选择向下取整也可以四舍五入看算法
通道数16直接为卷积核个数
输出的数据为16x106x106