告警列表

支持查看当前项目中的告警列表、告警数量、告警等级、告警状态等信息。

告警项来源

告警项是系统中内置的,使用的是开源社区 kube-prometheus rules,参考 https://github.com/prometheus-operator/kube-prometheus/tree/main/manifests 中的 rules。

管理员和运维人员可以对告警项进行配置。

告警等级

在告警规则中,根据 severity 制定不同的告警等级,有三种等级,分别为 warning(警告)、critical(严重) 和 emergency(紧急) ,严重程度依次递增。

告警状态

告警有三种状态:

  1. 初始触发阈值,生成告警并置告警状态为 Pending(待定);

  2. 当该告警在 Pending 维持一定时间(如 3 分钟),alert 状态为 Firing(告警);

  3. Prometheus 通过 HTTP 将告警发送给 AlertManager;

  4. 当告警不再触发阈值,则告警状态为 Inactive(不活跃)。

    ../../_images/alert_status.png

    图 296 告警状态

更多告警配置参考 https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/