EKS에서 EBS 볼륨의 AZ 종속성으로 인해 발생하는 파드 장애 사례
데브옵스
EKS에서 EBS 볼륨의 AZ 종속성으로 인해 발생하는 파드 장애 사례
두줄요약
EKS에서 EBS 볼륨의 AZ 종속성 때문에 파드 어태치 실패가 발생하는 사례를 정리했습니다. 멀티 AZ가 필요하면 Affinity로 고정하거나 EFS로 전환하는 방식이 핵심입니다.
문제 상황
- EKS Stateful 워크로드에서 파드는 정상인데 EBS PVC 어태치가 실패하는 장애
- 멀티 AZ 환경에서 파드가 다른 AZ 노드로 스케줄되며
volume is in a different availability zone오류 발생
원인 분석
- EBS는 생성된 특정 AZ에 종속되는 단일 AZ 리소스
- io1/io2의 Multi-Attach도 동일 AZ 내 동시 연결만 가능
volumeBindingMode: Immediate는 볼륨을 먼저 AZ에 고정해 충돌 가능성 증가
해결 방법
- Pod Node Affinity로 EBS가 있는 AZ에 파드 고정
- 멀티 AZ 분산이 필수면 EFS로 전환
- EFS CSI Driver와 파일 시스템 기반 PVC로 AZ 제약 완화
