事件

平台支持查看应用相关的 K8s 事件。

K8s 事件描述了应用在 K8s 集群中对应资源的状态变化, 关于 K8s 事件更多信息,可参考 K8s 官方文档

在应用详情页可以查看应用相关的 K8s 事件,事件列表默认折叠了内容过长的事件,点击事件所在行展示折叠内容。

../../_images/log_event.png

图 319 K8s 事件

描述应用状态

事件描述了应用在集群中的状态变化和产生的原因,事件原因如下表所示:

表 229 事件原因

应用状态

事件原因

说明

创建中或

排队中

节点未就绪

节点未就绪,需要等待节点就绪后才能继续调度

集群资源不足

当前集群剩余资源无法满足应用的资源申请,需要等待集群其他应用释放资源

项目资源不足

项目配额不足,需要等待项目其他应用释放资源

应用未就绪

应用未满足启动条件

调度成功

Pod 被成功调度到节点

调度失败

Pod 未能被调度到节点

应用创建失败

应用创建失败,若由集群原因导致则无法恢复,需要重建应用

镜像拉取中

正在拉取应用所需镜像

镜像已拉取

应用所需镜像拉取成功

镜像拉取失败

应用所需镜像拉取失败,请确认镜像是否存在

环境预检查中

训练任务 开启“断点续训”功能后,会在应用启动前预检查运行环境

环境预检查成功

训练任务 开启“断点续训”功能后,环境预检查成功

环境预检查失败

训练任务 开启“断点续训”功能后,环境预检查失败

正在准备数据

训练任务 开启“数据准备”功能后,会在应用启动前拷贝数据到高速存储

排队中或

运行中

容器已创建

应用容器或初始化容器创建成功

容器创建失败

应用容器或初始化容器创建失败

容器挂卷成功

应用容器或初始化容器挂卷成功

容器挂卷失败

应用容器或初始化容器挂卷失败

容器已启动

应用容器或初始化容器启动成功

容器启动失败

应用容器或初始化容器启动失败

运行中

应用已就绪

应用启动成功

容器根目录存储超限

应用运行时过度使用容器根目录,导致容器被强制停止

容器资源超限

应用运行是过度使用计算资源,导致容器被强制停止

容器停止中

正在停止容器

容器停止失败

容器停止失败

容器重启中

正在重启容器

容器不存在

容器因被意外删除等原因而无法被集群感知

应用已结束

应用正常结束或异常退出

应用调整副本数

在线服务 正在调整副本数量

容器服务异常

云端容器应用 存活探针运行失败

容器服务存在警告

云端容器应用 存活探针异常

容器服务未就绪

云端容器应用 就绪探针运行失败

任务创建成功

容器任务 创建 Pod 成功

任务运行结束

容器任务 运行成功

任务删除成功

容器任务 删除 Pod 成功

任务运行超时

容器任务 运行时长超过限制时长

任务重试超限

容器任务 重试次数超过限制次数

任务失败

容器任务 运行失败

由于 K8s 事件来源不同,各个事件间的顺序无法保证固定。

搜索事件

根据配置项搜索

在配置项中选择“版本”,查看应用指定版本下的 K8s 事件。

根据时间搜索

关于如何根据时间搜索 K8s 事件请参考 根据时间搜索

根据内容搜索

在搜索框内填写要检索的事件内容,事件列表中展示根据检索内容过滤后的事件。