快速创建预置模型训练任务

目前平台预置模型训练支持不同任务类型以及应用场景如下:

  1. 图像:图像分类单标签、物体检测矩形框、实例分割、语义分割、OCR 标注、关键点标注。

  2. 视频:视频分类单标签、视频检测、目标追踪。

  3. 音频:音频分类单标签、音频转写。

  4. 表格:表格预测、时序预测。

本文以“图像分类单标签”任务为例,体验预置模型训练任务的创建过程:

  1. 数据集准备:用户上传任务相关数据集,或者使用平台内置数据集;

  2. 创建任务:用户选择对应任务类型和应用场景,选择合适的模型及训练参数进行训练;

  3. 训练过程及结果:用户查看运行详情,训练日志等。

数据集准备

平台例程中已内置“图像分类单标签”任务的可用标注数据集:

  1. 左侧功能栏选择“标注数据->标注数据集”;

  2. 在左上角搜索 “image-classification” :

../_images/quick_start_scenario_dataset.png

图 29 标注数据集准备

也可参考 标注数据集 创建数据类型为“图像”,应用场景为“图像分类单标签”的标注数据集。

如果用户想查看训练过程每个 epoch 的训练效果,可以按照相同的方式创建验证数据集,或使用平台例程中内置标注数据集 “image-classification-evaluation” 。

创建任务

  1. 左侧功能栏选择“训练管理->预置模型训练”;

  2. 单击右上角“创建预置模型训练”,进入参数配置页面;

  3. 模型参数:

    • 任务类型选择“图像”;

    • 应用场景选择“图像分类单标签”;

    • 算法选择:用户可根据需求选择模型,这将影响后面的板卡选择;

    ../_images/quick_start_scenario_model.png

    图 30 模型参数选择

    此时,平台会给出默认训练参数,用户可按需修改;

  4. 数据集:训练数据和验证数据的下拉框中会出现所有类型为“图像->图像分类单标签”的“标注数据集”,

    • “训练数据”可选择 “image-classification” ;

    • 若配置了“验证数据”,则每个 epoch 会进行 validation, 本例中可选择 “image-classification-evaluation” ;

    ../_images/quick_start_scenario_dataset_choose.png

    图 31 数据集选择

    注意:“验证数据”和“训练数据”不能重复选择;

  5. 其余参数:

    • 保存模型地址:用户可快速创建模型卷保存此次训练模型:

    ../_images/quick_start_scenario_model_path.png

    图 32 保存模型地址

    • 板卡规格和使用时长:
      • 主要依赖所选算法模型,参考其提示“单 batch 占用显存”以及训练参数 batch_size 进行选择;

      • 如果依照默认选项,使用内置数据集,则选择显存高于 5G 板卡,使用时长 1 小时即可;

  6. 单击“创建”,等待训练任务完成。

完整介绍参考 预置模型训练

训练过程及结果

  1. 单击创建的预置模型训练任务,进入详情页;

  2. “监控”页可看到 CPU、GPU 利用率、功耗等信息;

  3. “日志”页可看到训练过程,训练 loss,以及 validation 的结果,用户可以初步判断训练是否正常;

../_images/quick_start_scenario_log.png

图 33 训练日志

  1. TensorBoard 可视化:用户可参考 TensorBoard 在 Event 目录下选择当前训练任务“保存模型地址”所在模型卷,查看相应 TensorBoard 可视化结果。