Skywalking告警功能是在6.x版本新增的,其核心由一组规则驱动,这些规则定义在config/alarm-settings.yml 文件中。告警规则定义分为两部分:
1、告警规则:它们定义了应该如何触发度量警报,应该考虑什么条件
2、webhook(网络钩子):定义当告警触发时,哪些服务终端需要被告知
告警规则有两种类型:单独规则、复合规则,复合规则是单独规则的组合。
- rules:
- #规则唯一名称,必须以'_rule'结尾.
- service_resp_time_rule:
- #度量名称,也是OAL脚本中的度量名,目前Service, Service Instance, Endpoint的度量可以用于告警
- metrics-name: service_resp_time
- #[可选]默认,匹配此指标中的所有服务
- include-names:
- - service_a
- - service_b
- exclude-names:
- - service_c
- #阈值,对于多种指标值的如percentile可以配置P50、P75、P90、P95、P99的阈值
- threshold: 75
- #操作符
- op: <
- #评估度量标准的时间长度
- period: 10
- #度量有多少次符合告警条件后,才会触发告警
- count: 3
- #检查多少次,告警触发后保持沉默,默认周期相同
- silence-period: 10
- #该规则触发时,发送的通知消息
- message: Response time of serv