Grafana 告警路由与通知模板实践¶
Grafana Alerting 的价值在于路由与聚合:把正确的告警发给正确的人,并携带足够的上下文。
1. 路由设计¶
- 先按“服务/团队”切分,再按“严重级别”细分
- 使用 group_by 把同类告警聚合,减少通知数量
2. 去重与静默¶
- 同一告警实例短时间重复触发:依赖去重窗口
- 变更窗口、已知故障:用 silence 免打扰
3. 通知模板建议¶
模板里至少包含:
- 告警名、服务名、环境、严重级别
- 触发指标、当前值、阈值
- 快速入口:仪表盘链接、日志/链路追踪链接、Runbook