快速创建预置模型训练任务
目前平台预置模型训练支持不同任务类型以及应用场景如下:
图像:图像分类单标签、物体检测矩形框、实例分割、语义分割、OCR 标注、关键点标注。
视频:视频分类单标签、视频检测、目标追踪。
音频:音频分类单标签、音频转写。
表格:表格预测、时序预测。
本文以“图像分类单标签”任务为例,体验预置模型训练任务的创建过程:
数据集准备:用户上传任务相关数据集,或者使用平台内置数据集;
创建任务:用户选择对应任务类型和应用场景,选择合适的模型及训练参数进行训练;
训练过程及结果:用户查看运行详情,训练日志等。
数据集准备
平台例程中已内置“图像分类单标签”任务的可用标注数据集:
左侧功能栏选择“标注数据->标注数据集”;
在左上角搜索 “image-classification” :
也可参考 标注数据集 创建数据类型为“图像”,应用场景为“图像分类单标签”的标注数据集。
如果用户想查看训练过程每个 epoch 的训练效果,可以按照相同的方式创建验证数据集,或使用平台例程中内置标注数据集 “image-classification-evaluation” 。
创建任务
左侧功能栏选择“训练管理->预置模型训练”;
单击右上角“创建预置模型训练”,进入参数配置页面;
模型参数:
任务类型选择“图像”;
应用场景选择“图像分类单标签”;
算法选择:用户可根据需求选择模型,这将影响后面的板卡选择;
此时,平台会给出默认训练参数,用户可按需修改;
数据集:训练数据和验证数据的下拉框中会出现所有类型为“图像->图像分类单标签”的“标注数据集”,
“训练数据”可选择 “image-classification” ;
若配置了“验证数据”,则每个 epoch 会进行 validation, 本例中可选择 “image-classification-evaluation” ;
注意:“验证数据”和“训练数据”不能重复选择;
其余参数:
保存模型地址:用户可快速创建模型卷保存此次训练模型:
- 板卡规格和使用时长:
主要依赖所选算法模型,参考其提示“单 batch 占用显存”以及训练参数 batch_size 进行选择;
如果依照默认选项,使用内置数据集,则选择显存高于 5G 板卡,使用时长 1 小时即可;
单击“创建”,等待训练任务完成。
完整介绍参考 预置模型训练 。
训练过程及结果
单击创建的预置模型训练任务,进入详情页;
“监控”页可看到 CPU、GPU 利用率、功耗等信息;
“日志”页可看到训练过程,训练 loss,以及 validation 的结果,用户可以初步判断训练是否正常;
TensorBoard 可视化:用户可参考 TensorBoard 在 Event 目录下选择当前训练任务“保存模型地址”所在模型卷,查看相应 TensorBoard 可视化结果。