TensorBoard
TensorBoard 提供机器学习实验所需的可视化工具,支持展示 TensorFlow、PyTorch 运行过程中的计算图、指标变化趋势以及训练中使用到的数据信息。
详细介绍,请参考官方文档: https://tensorflow.google.cn/tensorboard/get_started?hl=zh-cn
创建 TensorBoard
在 TensorFlow、PyTorch 训练过程中,需要将 events 文件保存在模型卷中。创建 TensorBoard 时仅支持从模型卷中选择包含 events 文件的目录。
左侧功能栏选择“训练管理->TensorBoard”;
单击右上角“创建 TensorBoard”;
按照页面提示配置参数:
名称
必填项
说明
Event 目录
是
保存 Events 文件的模型卷及所在目录
多个 Events 文件在 TensorBoard 中显示的 runs 名为:
run{编号}-{模型卷名}-{文件目录}
镜像
是
镜像适用范围需包含 “TensorBoard”
使用时长
是
他人访问权限
是
具体参见 他人访问权限
描述
否
单击“确定”。
对于批量训练任务,可以单击任务的“操作”按钮,在下拉列表中单击“创建 TensorBoard”,创建该任务对应的 TensorBoard。
打开 TensorBoard 可视化界面
用户可以打开“运行中”状态的 TensorBoard 可视化界面,操作步骤:
左侧功能栏选择“训练管理->TensorBoard”;
查找需要可视化的 TensorBoard, 单击 TensorBoard 地址。
启动 TensorBoard
用户可以启动“停止”和“过期”状态的 TensorBoard,操作步骤:
左侧功能栏选择“训练管理->TensorBoard”;
查找需要启动的 TensorBoard,单击该 TensorBoard 的“操作”按钮;
在下拉列表中,单击“启动”;
启动确认框中会显示“使用时长”配置,选择或输入使用时长。
单击“确认启动”。
克隆 TensorBoard
用户可以克隆任意状态的 TensorBoard,操作步骤:
左侧功能栏选择“训练管理->TensorBoard”;
查找需要克隆的 TensorBoard,单击该 TensorBoard 的“操作”按钮;
在下拉列表中,单击“克隆”;
按需调整配置;
单击“确认”创建。
合并 TensorBoard
用户可以合并多个 TensorBoard 并创建一个新的 TensorBoard,新创建的 TensorBoard 包含选中的多个 TensorBoard 中的模型日志文件,操作步骤:
左侧功能栏选择“训练管理->TensorBoard”;
单击表格右上角“编辑”按钮,勾选多个需要合并的 TensorBoard,单击表格右上角“合并TensorBoards”按钮;
弹出表单中的“Event 目录”显示为合并结果,按需调整配置;
单击“确认”创建。
停止 TensorBoard
用户可以停止“运行中”状态的 TensorBoard,操作步骤:
左侧功能栏选择“训练管理->TensorBoard”;
查找需要启动的 TensorBoard,单击该 TensorBoard 的“操作”按钮;
在下拉列表中,单击“停止”;
单击“确认停止”。
搜索 TensorBoard
左侧功能栏选择“训练管理->TensorBoard”;
单击左上角搜索框;
在下拉列表中,可基于“描述”、“状态”和“创建人”搜索 TensorBoard。
删除 TensorBoard
左侧功能栏选择“训练管理->TensorBoard”;
单个删除:选择需要删除的 TensorBoard,单击“操作”按钮,在下拉列表中,单击“删除”;
批量删除:单击表格右上角“编辑”按钮,勾选多个需要删除的 TensorBoard,单击表格右上角“删除”按钮;
单击“确认删除”。
他人访问权限
5.0 版本新增: 支持为 TensorBoard 配置他人访问权限。
创建时,可以限制同项目内其他用户的访问权限,包括:“可读写”、“只读”和“不可读写”。 应用访问权限不得高于资源访问权限。 若管理员关闭共享权限,则他人访问权限只能为“不可读写”。
不同权限支持的操作如下:
可读写 |
只读 |
不可读写 |
|
---|---|---|---|
查看详情 |
√ |
√ |
X |
启动 |
√ |
X |
X |
停止 |
√ |
X |
X |
删除 |
√ |
X |
X |