物体检测


物体检测

在图像中对多个物体进行分类和定位的任务称为物体检测。一种通用的方法是采用经过训练的CNN来对单个物体进行分类和定位,然后将其在图像上滑动。

这项技术非常简单直观,但是它将多次检测同一物体,但位置略有不同。然后需要进行一些后期处理,以消除所有不必要的边界框。一种常见的方法称为非极大抑制。以下是操作方式:

  1. 首先需要在CNN中添加一个额外的客观分数(置信度)输出,以估计图像中确实存在花朵的可能性(或者可以添加“无花朵”类,但这通常不起好的作用)。它必须使用sigmoid激活函数,而且可以使用二元交叉熵损失对其进行训练。然后删除所有置信度得分低于某个阈值的边界框:这将删除所有实际上不包含花的边界框。
  2. 找到具有最大客观分数的边界框,并删除与其重叠很多的所有其他边界框(例如IoU大于60%)
  3. 重复第二步,直到没有更多的边界框可以删除

这种简单的物体检测方法效果很好,但是它需要多次运行CNN,因此速度很慢。幸运的是,有一种更快的方法可以在图像上滑动CNN:使用全卷积网络(FCN)

相关