计算机视觉目标检测研究札记

计算机视觉目标检测研究札记

摘要: 写一篇小结,记录目标检测算法近期的学习笔记。

一、背景知识

层次特征提取

二、目标检测问题

目标检测 = 目标定位 + 目标识别

PASCAL VOC object detection

R-CNN

Region with CNN features

一句话: 使用CNN从2000个候选区域的图像中进行特征提取,然后交给分类和回归网络执行

R-CNN

  1. 候选区域选择 使用了Selective Search算法,一个通过贪婪搜索来寻找Region的算法:
    1. 自底向上,基于如下特征从一张图像中搜寻相似的像素:
      1. 颜色
      2. 纹理
      3. 大小
      4. 形状兼容性
    2. 将相似的像素进行组合,并通过加权算法形成相似表征结果;
    3. 重复1和2,直到结果稳定

Selective Search

  1. 特征提取部分,生成一个2000x4096的特征矩阵(feature map)
  2. 论文中分类使用SVM(每个类别一个SVM线性分类器),回归定义了一个最小二乘损失函数,同时对坐标值的映射关系做了重新定义。

Fast R-CNN

1*ATyBsAsDQNqT4GYKLrO81w

ROI Pooling

使用了修改过的SPP中空间金字塔pooling的概念;

1*0BJEv0i2OCptYL0PWZve7g

Faster R-CNN

更多内容详见以前的博文

1*NXWE7BHug0i-FQlHo5xa7w

提出了新的RPN算法。

RPN

1*Z4FFgjKMCNkPbkR0mccbyg

NMS: 非极大抑制

​ 搜索局部极大值,抑制非极大值元素;

  1. Select the box that has the highest score.
  2. Compute its overlap with all other boxes, and remove boxes that overlap it more than the IOU threshold
  3. Go back to step 1 and iterate until there’s no more boxes with a lower score than the current selected box.

Soft NMS

​ 不要盲目删框,万一两个物体接近,检测两个物体的框有可能重贴区域大;和最大得分框IoU大于阈值的,不直接删除,而是降低得分;

FPN的研究

参考

  1. Deep Learning For Object Detection Part II)
  2. Faster R-CNN)

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×