
[분석] Kubernetes v1.35 Timbernetes: 6년 만의 GA, AI 스케줄링, 기술 부채 개선
Kubernetes v1.35 Timbernetes의 주요 기능과 변경점을 정리했습니다. AI 워크로드 지원과 운영 개선, 업그레이드 시 주의사항을 함께 다뤘습니다.

Kubernetes v1.35 Timbernetes의 주요 기능과 변경점을 정리했습니다. AI 워크로드 지원과 운영 개선, 업그레이드 시 주의사항을 함께 다뤘습니다.


Grafana k6와 몬테카를로 시뮬레이션으로 EC2 인스턴스 7종의 CPU 성능을 비교했습니다. 성능과 비용을 함께 보며 가격 대비 성능 관점의 선택이 중요하다고 정리했습니다.
LiteLLM 공급망 공격을 계기로 사내 PyPI 프록시에 쿨다운 정책을 도입했습니다.\nPEP 503과 PEP 691을 함께 활용해 최근 업로드 패키지를 필터링하고 전사에 일괄 적용했습니다.


라포랩스가 AWS AI-DLC로 사내 배포 플랫폼 Raploy를 구축한 사례를 공유했습니다. 비개발 직군도 AI와 플랫폼을 통해 배포·운영할 수 있도록 자동화와 관측성을 함께 강화했습니다.


Claude Code Routines로 반복적인 DevOps 작업을 자동화하는 방법을 정리했습니다. PR 리뷰, 의존성 점검, 우선순위 분류에 적합하며 운영 시 한도와 권한 위험도 함께 살펴봤습니다.
![[코드가 환경을 모르는 구조 2/7] 배포 코드가 환경을 모르는 구조](https://flex.team/blog/og/main.jpg)

배포 코드가 환경 이름을 직접 읽지 않도록 Helm values와 GitOps 규율로 분리한 구조를 설명했습니다. Jenkinsfile까지 같은 원칙을 적용해 배포 이력을 Git으로 남기는 방법을 다뤘습니다.
![[코드가 환경을 모르는 구조 2/7] 배포 코드가 환경을 모르는 구조](https://cdn.sanity.io/images/v31psllp/production/58ae2e178769ca25361200fed07c9ecb06c62d2a-1684x1030.png)

배포 코드를 환경별로 갈라 쓰지 않고, 템플릿과 값의 층을 분리해 환경을 외부에서 주입하는 구조를 설명했습니다. GitOps와 Jenkinsfile에도 같은 규율을 적용해 배포 이력을 Git에 남기는 방법을 다뤘습니다.


AWS CDK로 Vision AI 서빙 파이프라인을 구성한 실전 사례를 다뤘습니다. 배포 자동화, 타임아웃 대응, 비용 최적화까지 운영 관점을 함께 정리했습니다.

Kubernetes Pod의 Request와 Limit을 실제 사용 패턴에 맞게 조정하는 Right-Sizing 기준 수립 과정을 다뤘습니다. P95, 버퍼율, 컴포넌트 특성, Throttling 지표를 함께 고려하는 방법을 정리했습니다.

EKS + ALB 환경에서 Blue/Green과 기본 Canary의 Promote 시 503이 발생하는 원인을 분석했습니다. Argo Rollouts Canary PingPong으로 selector 변경 없이 weight만 교대해 문제를 해결했습니다.

모노레포 CMS의 빌드 파이프라인을 개선해 배포 시간을 14분에서 8분으로 줄였습니다. 병렬 빌드, 캐시 최적화, 안정성 보강과 번들 최적화까지 함께 다뤘습니다.

Kubernetes StatefulSet의 Immutable 제약을 우회해 PVC를 먼저 확장하고 Non-cascade로 컨트롤러만 교체하는 절차를 정리했습니다. 서비스 중단 없이 스토리지를 늘리는 실무 트러블슈팅 방법을 설명했습니다.