COCO 格式

4.2 版本新增: 支持导入 COCO 格式。

4.3 版本新增: 支持导出 COCO 格式。

提示

COCO 格式目前仅支持图片类型的标注数据集的导入导出,不支持分类标注与语义分割多边形标注。

COCO 的标注文件为单个 json 文件 ,格式为 Label

导出 COCO 格式后,标注数据集的内有如下文件:

/
├── 1.png
└── annotation
    └── v1
        ├── label.json
        └── COCO
            └── train2017.json (COCO2017 JSON 格式的标注文件)

JSON Schema

Label

type

object

properties

  • annotations

标注实例的信息

type

array

items

Annotation

  • categories

标注实例类别的信息

type

array

items

Category

  • images

标注数据集中所有图像的信息

type

array

items

Image

Annotation

type

object

properties

  • id

实例的唯一编号

type

integer

  • image_id

对应的图像编号

type

integer

  • num_keypoints

关键点数量

type

integer

  • keypoints

实例关键点坐标。

格式为 [x1, y1, 可视性v1, x2, y2, 可视性v2]

type

array

items

type

integer

  • bbox

实例正框

格式为 [左上角x, 左上角y, 宽, 高]

X 轴方向为从左至右,Y 轴方向为从上至下。

type

array

items

type

integer

  • segmentation

实例多边形坐标

格式为 [[x1, y1, x2, y2]]

type

array

items

type

array

items

type

integer

  • category_id

对应的类别编号

type

integer

Category

type

object

properties

  • id

类别的唯一编号

type

integer

  • name

类别名称

type

string

  • supercategory

父类别名称

type

string

Image

type

object

properties

  • id

图像的唯一编号

type

integer

  • file_name

图像路径

type

string

  • width

图像宽度

type

integer

  • height

图像高度

type

integer

例子

  • 图片数据集

    {
      "images": [
        {
          "height": 999,
          "id": 0,
          "file_name": "test1.png",
          "width": 898
        },
        {
          "height": 1296,
          "id": 1,
          "file_name": "test2.jpg",
          "width": 592
        }
      ],
      "annotations": [
        {
          "bbox": [297, 359, 200, 110],
          "image_id": 0,
          "id": 0,
          "num_keypoints": 0,
          "keypoints": [],
          "segmentation": [],
          "category_id": 3
        },
        {
          "bbox": [642, 256, 79, 256],
          "image_id": 0,
          "id": 1,
          "num_keypoints": 0,
          "keypoints": [],
          "segmentation": [],
          "category_id": 3
        },
        {
          "bbox": [],
          "image_id": 1,
          "id": 2,
          "num_keypoints": 0,
          "keypoints": [],
          "segmentation": [[305, 302, 173, 360, 265, 405, 445, 368]],
          "category_id": 1
        },
        {
          "bbox": [],
          "image_id": 1,
          "id": 3,
          "num_keypoints": 5,
          "keypoints": [
            185, 135, 1, 320, 195, 1, 393, 150, 1, 376, 91, 1, 343, 101, 1
          ],
          "segmentation": [],
          "category_id": 4
        }
      ],
      "categories": [
        {
          "name": "cat1",
          "id": 1
        },
        {
          "name": "cat2",
          "id": 2
        },
        {
          "name": "cat3",
          "id": 3
        },
        {
          "name": "cat4",
          "id": 4
        }
      ]
    }