广州建设监理协会网站,企业网站的推广建议,怎么查询域名备案信息,展厅设计展览设计公司文章目录 前言一、YOLO v3的网络结构和流程二、YOLO v3的创新点总结 前言
根据前文目标检测-One Stage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升#xff0c;但是精度仍较低#xff0c;YOLO v3基于一些先进的结构和思想对YOLO v2做了一些改进。 提示#xff1a;… 文章目录 前言一、YOLO v3的网络结构和流程二、YOLO v3的创新点总结 前言
根据前文目标检测-One Stage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升但是精度仍较低YOLO v3基于一些先进的结构和思想对YOLO v2做了一些改进。 提示以下是本篇文章正文内容下面内容和可供参考
一、YOLO v3的网络结构和流程
将影像输入卷积网络DarkNet53FPN得到多尺度特征图 psDarknet53由Darknet19结合Resnet而成 利用anchor机制获取预选框将上一步得到的anchor输入不同的分类和边框回归器使用非极大值抑制NMS去除冗余窗口 二、YOLO v3的创新点
具体来说没有什么大的创新点但是结合先进的思想改进了YOLOv2
将backbone的网络结构进行了改进将Darknet19结合Resnet残差块轻量化变成了Darknet53Darknet53的性能与ResNet152相似速度快2倍引入多尺度特征图feature maps每个尺寸的feature map各司其职13 × 13负责大目标物体26 × 26负责中目标物体和52 × 52负责小目标物体。原因很简单越深层的信息越抽象越浅层的越粗糙浅层还保留着小物体的信息深层就不一定还在了。 ps和SSD一样感受野小的feature map检测小目标较小的scale使用感受野大的feature map检测更大目标较大的scale但加入了特征融合机制。 类别预测方面使用多个逻辑回归分类器logistic代替softmax分类器以此来确定预测框属于多类的可能 softmax全部类别的概率之和为1假定全部类别是互斥的即如果预测框属于类别A那么就不可能属于类别B但面对非互斥类别集时softmax不能判别多类别归属比如预测框可能既属于“动物”又属于“狗”尤其对于Open Images这种数据集目标可能有重叠的类别标签因此yolov3使用不同的logistic回归分类器数量和类别数对应检验bbox为每个类别的置信度objectness score如果超过一定阈值就可认为bbox属于某个类别即可实现多类别分类 总结
YOLOv3-320(28.2mAP)与SSD321一样准确28.0mAP[.5, .95]但速度快三倍61ms - 22ms
在mAP50上57.9YOLOv3-608和当时的SOTARetinaNet-101-800精度一样57.5但要快3.8倍198ms - 51ms