
데브옵스
Health Check로 구축하는 장애 대응 자동화
두줄요약
쿠버네티스 Health Check를 통해 장애를 자동 감지하고 재시작·트래픽 차단으로 대응하는 방법을 정리했습니다. Probe 종류와 구현 방식, 운영 시 주의점까지 함께 다뤘습니다.
핵심 내용
- 쿠버네티스 컨테이너 장애 대응을 위해 Health Check를 자동화하는 방법 정리
- Readiness, Liveness, Startup Probe의 역할과 동작 차이, 장애 감지와 재시작·트래픽 차단 방식 설명
- httpGet, exec, tcpSocket, gRPC, GraphQL 등 Probe 구현 방식과 옵션, 운영 시 주의점 및 실무 예제 제시
- Probe는 가볍게 설계하고 전용 엔드포인트와 파일/플래그 기반 검사를 활용하는 것이 권장됨
적용해볼 점
- 서비스 성격에 맞춰 Probe 종류와 체크 방식을 분리해 설계
- DB 쿼리나 무거운 로직은 Probe에서 제외하고 앱 내부 상태만 빠르게 확인
- Startup Probe로 초기 기동 지연을 흡수하고, Readiness로 트래픽 유입을 제어
