服务监控

2.3 版本新增: HTTP 服务监控。

对于 HTTP 服务,应用的详情页展示了该服务的请求量、成功率、延迟等指标的信息。

以下功能支持服务监控:

备注

当选择的时间范围比较大时,查询监控时会自动降采样,参见 监控降采样

指标说明

请求量

指定采样周期内 HTTP 请求总量。

5XX 数量

指定采样周期内 HTTP 请求返回 5XX(一般为服务器无响应、内部错误)的总量。

成功率

指定采样周期内 HTTP 请求返回成功的总量占请求总量的比例。

4XX 率

指定采样周期内 HTTP 请求返回 4XX(一般为请求内容错误)的总量占请求总量的比例。

平均延迟

指定采样周期内请求延迟时间的平均值。

P50、P90、P99、P999 延迟

也叫 TP50、TP90、TP99、TP999,分别表示指定采样周期内 50%、90%、99%、99.9% 请求的延迟时间。 其中 P50 也表示请求耗时的中位数。

金丝雀版本

如果服务正在进行灰度发布,服务监控会同时展示金丝雀版本的信息,并进行对比。

../../_images/service_monitor_canary.png

图 314 服务监控(含金丝雀版本)