目标检测之常用数据集


目标检测之常用数据集

我们在利用模型检测实际应用问题的时候,通常需要使用自己标注和收集数据集来进行训练。
但对于不同算法性能的比较,我们常常需要一些基本的数据集来进行横向对比。

下列是一些常用的目标检测数据集:

  • PASCAL VOC
  • ImageNet
  • COCO

1.PASCAL VOC challange

PASCAL VOC挑战在2005年至2012年间展开。

PASCAL VOC 2007:9963张图像,24640个标注。
PASCAL VOC 2012: 11530张图像,27450个标注。

该数据集中有20个分类,同时包含11530张用于训练和验证的图像,其中感兴趣区域有27450个标定目标,每个图像平均有2.4个目标。
以下是数据集中的20个分类:

  • Person(人):person(人)

  • Animal(动物):bird(鸟)、cat(猫)、cow(牛)、dog(狗)、horse(马)、sheep(羊)

  • Vehicle(车辆):aeroplane(飞机)、bicycle(自行车)、boat(船)、bus(巴士)、car(汽车)、motorbike(摩托车)、train(火车)

  • indoor(室内):bottle(瓶)、chair(椅子)、dining table(餐桌)、potted plant(盆栽植物)、sofa(沙发)、tv(电视)/monitor(监视器)

链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

2 ImageNet数据集

ILSVRC 2010-2017为斯坦福大学的李飞飞教授主导并组建的数据集。

  • ImageNet拥有用于分类、定位和检测任务评估的数据
  • 与分类数据类似,定位任务有1000个类别。准确率是根据Top 5检测结果计算出来的。
  • 对200个目标的检测问题有470000个图像,平均每个图像有1.1个目标。

3 MS COCO数据集

  • MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为计算机视觉领域最受关注和最权威的比赛之一。

  • 在ImageNet竞赛停办后,COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目标该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业公共参与的大赛。

  • COCO(Common Objects in Context)数据集包含20万个图像:11.5万多训练集验证集图像,2万多张测试集图像。

  • 80个类别中有超过50万个目标标注。他是最广泛公开的目标检测数据集。

  • 平均每个图像的目标数为7.2个。

链接:http://cocodataset.org