网站建设客户,seo网站推广策略,做废品推广哪个网站好,中国旅游网站建设1.概念介绍 目标检测不仅可以检测数字#xff0c;而且可以检测动物的种类、汽车的种类等。例如#xff0c;自动驾驶车辆需要自动识别前方物体是车辆还是行人#xff0c;需要自动识别道路两 旁的指示牌和前方的红绿灯颜色。对于自动检测的算法#xff0c;有两个要求#xf…1.概念介绍 目标检测不仅可以检测数字而且可以检测动物的种类、汽车的种类等。例如自动驾驶车辆需要自动识别前方物体是车辆还是行人需要自动识别道路两 旁的指示牌和前方的红绿灯颜色。对于自动检测的算法有两个要求一个是快 一个是准。VOC是一个挑战赛主要目的是识别真实场 景中的一系列物体。交并比是交集与并集的比例。假设需要检测到其中“0”的位置。白色方框是人工标注的标准答案也是想要预测的理想位置。 灰色方框是预测的实际位置。通过IoU 计算利用两个框的交集面积与并集面积的比值就可以衡量模型预测的灰框是否准确。 平均精度均值mAP衡量一个目标检测模型整体效果的指标。对于图像分类模型整个流程就是根据损失函数来反向传播更新深度卷积网络中各个卷积核的参数而所需要的数据集就是图片数据和图片标签。其实对于YOLOv1这样的 一步走模型整个流程大体差不多所以需要研究的有4个方面输入、网络、输 出、损失函数。
输出YOLO v1模型速度之所以快是因为它的候选框的数量并不多。首先把一个输入图片分成S×S 的格子然后以每个格子为中心预测出来B 个候选框(Bounding Boxes),每个候选框包含5个预测值其中4个表示位置信息1个表示置信度。
注意如果两个物体的中心点在同一个cell内则会失去一个物体的预测。因为同一个cell最终只能给出一个有效候选框而一个有效候选框无法预测两个不同的物体。 对图像的一些处理包括随机剪裁、随机调整尺寸、随机调整光亮、随机调整饱和度、随机平移等都是图像增强的方法。 TP、TN、FP、 FN。TP是真实的正样本即预测是正样本而且预测对了真的是正样 本 TN 是预测是负样本预测对了真的是负样本FP 是错误的正样本预测是正样本但 是错了其实不是正样本FN 是预测是负样本预测错了其实是正样本。先计算每个预测框与真实框的IoU, 如果IoU 大于0.5,这个预测框就是真的正样本 则认为该预测框成功地检测出了目标如果小于0.5,那么这个预测框就没有找到目标。 接下来考虑置信度。要给置信度增加一个阈值然后只考虑置信度在阈值之上的预测 框。继续看上面的例子。假设阈值是0.9,那就忽视所有阈值小于0.9的预测框。AP 是对某一个类检测的好坏mAP 是所有类的AP 的平均值。 归一化(Batch Normalization)。Batch Normalization可以提升 模型的收敛速度也可以起到轻微的正则化的效果降低模型过拟合。改进是高精度的分类器(High Resolution Classifier)
改进是先验框(Prior Anchor)改进是聚类(Dimension Cluster) 改进是细粒度特征改进是多尺度训练。