선제적 장애 대응을 위한 Sentry 최적화 적용기
프론트엔드
선제적 장애 대응을 위한 Sentry 최적화 적용기
두줄요약
Sentry의 에러 수집 한도와 노이즈 문제를 줄이기 위해 로그를 고도화하고 필터링했습니다. Alert와 대응 프로세스까지 정비해 선제적 장애 탐지를 목표로 했습니다.
문제 상황
- Sentry 에러 수집량 제한으로 중요한 장애 로그까지 유실되는 상태
- 서비스 성장으로 에러 종류와 양이 늘어 장애 탐지가 어려워진 상황
- 불필요한 에러 로그와 과도한 Alert로 노이즈가 큰 모니터링 환경
원인 분석
- Organization 단위 수집 한도를 프로젝트들이 공유하는 구조
- 단위 시간당 에러 제한 정책으로 트래픽 많은 서비스에서 로그 누락 발생
- 네트워크 오류, 이미 핸들링된 400/404 계열 로그가 사용량을 소모
해결 방법
- Scope의 Level, Context, Tags, Fingerprint로 에러 맥락과 그룹화 정보 강화
- 에러 이름에 상태 코드와 API 경로를 포함해 이슈 식별성 개선
- Inbound Filters, beforeSend, 조건부 호출로 불필요한 로그 수집 차단
- Alert 기준과 담당자 배정, Slack 기반 대응 프로세스로 선제 대응 체계 구축
