데브옵스
[분석] Kubernetes v1.35 Timbernetes: 6년 만의 GA, AI 스케줄링, 기술 부채 개선
두줄요약
Kubernetes v1.35 Timbernetes의 주요 기능과 변경점을 정리했습니다. AI 워크로드 지원과 운영 개선, 업그레이드 시 주의사항을 함께 다뤘습니다.
핵심 내용
- Kubernetes v1.35 Timbernetes 주요 변화 정리
- In-Place Pod Resource Resize GA로 실행 중 Pod 리소스 즉시 조정 가능
- AI/ML용 Gang Scheduling Alpha, OCI Image Volume GA, Structured Authentication Config GA
성능/운영 포인트
- PreferSameNode로 노드 간 트래픽 지연과 egress 비용 절감
- 실행 중 리소스 변경과 읽기 전용 이미지 마운트로 운영 유연성 향상
- cgroup v1, containerd 1.x, 오래된 API 제거에 따른 업그레이드 점검 필요
주의할 점
- 메모리 리소스 변경 시 재시작 정책 확인 필요
- Gang Scheduling은 분산 학습·HPC에 더 적합한 기능
- IPVS, containerd, cgroup 버전 마이그레이션 계획 필요
