标注数据集使用案例
本案例以公开的图像单标签分类数据集Flower5为例,介绍标注数据集的整体使用流程。
准备数据集
下载数据集 https://www.kaggle.com/datasets/alxmamaev/flowers-recognition#flowers.zip 并解压。
创建标注规则集
左侧功能栏选择“标注数据->标注规则集”;
单击右上角“添加标注规则集”;
配置如下:
添加规则
点击创建好的规则集,选择添加规则,配置如下:
使用相同的步骤为每个类别都添加规则集,添加好的效果如下:
更多关于规则集的介绍可以参考 标注规则集 。
创建标注数据集
左侧功能栏选择“标注数据->标注数据集”;
单击右上角“添加标注数据集”;
配置如下:
更多关于标注数据集的介绍可以参考 标注数据集 。
上传数据
点击创建好的标注数据集,进入文件列表;
点击“上传->上传文件夹”,将解压得到5个文件夹依次上传;
点击“同步新数据”将上传好的数据同步到标注系统;
点击“标注”按钮进入标注页面。
使用界面上传可以在右上角查看上传进度:
如果待标注数据很多,建议使用Webdav进行上传,更详细的介绍可以参考 管理存储卷文件。
标注
选择要标注的图片;
在界面顶部选择规则类型:“分类单标签”;
在右侧选择标签类别,单击“确认”;
单击下方的“保存标注”和“完成标注”。
更多标注工具的使用方法参考 标注工作区 。
发布版本
在标注数据集页面点击发布新版本就会生成对应的标注文件,此时文件列表里就会出现一个名为annotation的文件夹,里面存放了标注文件 label.json。
关于标注文件的格式可以参考 标注格式 。
数据分析
上方标签页中选择“数据分析”;
点击右侧“数据分析”按钮,打开标注数据集版本列表;
选择需要需分析的版本,单击右侧“执行”按钮。
分析完成后会得到如下结果:
更多数据分析的功能参考 数据分析 。