“서버가 죽었어요”에서 시작된 이야기, Grafana OnCall과 Amazon Connect로 완성한 실전형 온콜 시스템

60
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 Grafana OnCall과 Amazon Connect를 결합해 비용 효율적인 온콜 자동화 구축 사례를 공유

핵심 구성

  • LGTM 스택(Loki, Tempo, Mimir)과 Grafana OnCall 통합으로 모니터링→알림→대응 흐름 일원화
  • ELBv2 API로 Target Group의 Unhealthy 상태를 실시간 탐지하고 OnCall RDS의 iCal 스케줄로 담당자 조회 후 Amazon Connect로 즉시 발신
  • Slack 연동으로 전화 제어(중지) 및 DB 기반 상태 관리로 중복 알림 차단, 비용 최적화

연관 게시글