跳转至

Grafana 告警路由与通知模板实践

Grafana Alerting 的价值在于路由与聚合:把正确的告警发给正确的人,并携带足够的上下文。

1. 路由设计

  • 先按“服务/团队”切分,再按“严重级别”细分
  • 使用 group_by 把同类告警聚合,减少通知数量

2. 去重与静默

  • 同一告警实例短时间重复触发:依赖去重窗口
  • 变更窗口、已知故障:用 silence 免打扰

3. 通知模板建议

模板里至少包含:

  • 告警名、服务名、环境、严重级别
  • 触发指标、当前值、阈值
  • 快速入口:仪表盘链接、日志/链路追踪链接、Runbook