TensorBoard

TensorBoard 提供机器学习实验所需的可视化工具,支持展示 TensorFlow、PyTorch 运行过程中的计算图、指标变化趋势以及训练中使用到的数据信息。

详细介绍,请参考官方文档: https://tensorflow.google.cn/tensorboard/get_started?hl=zh-cn

创建 TensorBoard

在 TensorFlow、PyTorch 训练过程中,需要将 events 文件保存在模型卷中。创建 TensorBoard 时仅支持从模型卷中选择包含 events 文件的目录。

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 单击右上角“创建 TensorBoard”;

  3. 按照页面提示配置参数:

    表 177 创建 TensorBoard 配置参数

    名称

    必填项

    说明

    Event 目录

    保存 Events 文件的模型卷及所在目录

    多个 Events 文件在 TensorBoard 中显示的 runs 名为:

    run{编号}-{模型卷名}-{文件目录}

    镜像

    镜像适用范围需包含 “TensorBoard”

    使用时长

    他人访问权限

    具体参见 他人访问权限

    描述

  4. 单击“确定”。

    ../../_images/create_tensorboard.png

    图 239 创建 TensorBoard

对于批量训练任务,可以单击任务的“操作”按钮,在下拉列表中单击“创建 TensorBoard”,创建该任务对应的 TensorBoard。

打开 TensorBoard 可视化界面

用户可以打开“运行中”状态的 TensorBoard 可视化界面,操作步骤:

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 查找需要可视化的 TensorBoard, 单击 TensorBoard 地址。

启动 TensorBoard

用户可以启动“停止”和“过期”状态的 TensorBoard,操作步骤:

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 查找需要启动的 TensorBoard,单击该 TensorBoard 的“操作”按钮;

  3. 在下拉列表中,单击“启动”;

    启动确认框中会显示“使用时长”配置,选择或输入使用时长。

  4. 单击“确认启动”。

克隆 TensorBoard

用户可以克隆任意状态的 TensorBoard,操作步骤:

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 查找需要克隆的 TensorBoard,单击该 TensorBoard 的“操作”按钮;

  3. 在下拉列表中,单击“克隆”;

  4. 按需调整配置;

  5. 单击“确认”创建。

合并 TensorBoard

用户可以合并多个 TensorBoard 并创建一个新的 TensorBoard,新创建的 TensorBoard 包含选中的多个 TensorBoard 中的模型日志文件,操作步骤:

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 单击表格右上角“编辑”按钮,勾选多个需要合并的 TensorBoard,单击表格右上角“合并TensorBoards”按钮;

  3. 弹出表单中的“Event 目录”显示为合并结果,按需调整配置;

  4. 单击“确认”创建。

停止 TensorBoard

用户可以停止“运行中”状态的 TensorBoard,操作步骤:

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 查找需要启动的 TensorBoard,单击该 TensorBoard 的“操作”按钮;

  3. 在下拉列表中,单击“停止”;

  4. 单击“确认停止”。

搜索 TensorBoard

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 单击左上角搜索框;

  3. 在下拉列表中,可基于“描述”、“状态”和“创建人”搜索 TensorBoard。

删除 TensorBoard

  1. 左侧功能栏选择“训练管理->TensorBoard”;

  2. 单个删除:选择需要删除的 TensorBoard,单击“操作”按钮,在下拉列表中,单击“删除”;

  3. 批量删除:单击表格右上角“编辑”按钮,勾选多个需要删除的 TensorBoard,单击表格右上角“删除”按钮;

  4. 单击“确认删除”。

他人访问权限

5.0 版本新增: 支持为 TensorBoard 配置他人访问权限。

创建时,可以限制同项目内其他用户的访问权限,包括:“可读写”、“只读”和“不可读写”。 应用访问权限不得高于资源访问权限。 若管理员关闭共享权限,则他人访问权限只能为“不可读写”。

不同权限支持的操作如下:

表 178 他人支持的操作

可读写

只读

不可读写

查看详情

X

启动

X

X

停止

X

X

删除

X

X