物体检测

物体检测

在图像中对多个物体进行分类和定位的任务称为物体检测。一种通用的方法是采用经过训练的CNN来对单个物体进行分类和定位，然后将其在图像上滑动。

这项技术非常简单直观，但是它将多次检测同一物体，但位置略有不同。然后需要进行一些后期处理，以消除所有不必要的边界框。一种常见的方法称为非极大抑制。以下是操作方式：

首先需要在CNN中添加一个额外的客观分数（置信度）输出，以估计图像中确实存在花朵的可能性（或者可以添加“无花朵”类，但这通常不起好的作用）。它必须使用sigmoid激活函数，而且可以使用二元交叉熵损失对其进行训练。然后删除所有置信度得分低于某个阈值的边界框：这将删除所有实际上不包含花的边界框。
找到具有最大客观分数的边界框，并删除与其重叠很多的所有其他边界框（例如IoU大于60%）
重复第二步，直到没有更多的边界框可以删除

这种简单的物体检测方法效果很好，但是它需要多次运行CNN，因此速度很慢。幸运的是，有一种更快的方法可以在图像上滑动CNN：使用全卷积网络（FCN）

机器学习实战(深度学习部分)

相关

标签