Istio 3-2편: Partially Enrolled Pod와 Untaint Controller
Ambient mode에서 Pod은 Ready인데 mesh 트래픽이 실패하는 partially enrolled 문제를 다뤘습니다. istio-cni 준비 전에는 일반 Pod이 스케줄되지 않도록 startup taint와 untaint-controller를 활용했습니다.
Kubernetes 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
20개 표시
Ambient mode에서 Pod은 Ready인데 mesh 트래픽이 실패하는 partially enrolled 문제를 다뤘습니다. istio-cni 준비 전에는 일반 Pod이 스케줄되지 않도록 startup taint와 untaint-controller를 활용했습니다.
공유 dev 병목을 없애기 위해 브랜치 하나로 격리 환경을 만드는 Environment Variant 설계를 소개했습니다. ArgoCD ApplicationSet으로 생성과 회수를 자동화해 환경 생명주기를 git과 연결했습니다.
SSL/TLS 인증서 유효기간이 계속 단축되는 흐름과 그에 따른 운영 리스크를 정리했습니다. 자동화와 모니터링을 중심으로 한 대응 전략도 함께 제시했습니다.
Istio Ambient mode에서 워크로드 재시작 시 간헐적 503이 발생한 원인을 추적했습니다. 오래된 HBONE connection 재사용과 ztunnel의 graceful close 부재가 핵심이었고, reset retry로 증상을 완화했습니다.
Istio Ambient mode에서 Pod IP 재사용과 stale connection 재사용이 겹쳐 간헐적 503이 발생했습니다. 로그와 pcap, socket을 교차 검증하고 reset retry로 증상을 완화했습니다.
Terraform plan은 변경점만 보여 주고 실제 동작은 보장하지 못한다고 설명했습니다. IaC를 넘어 테스트 가능성과 재현 가능성을 갖춘 IaS 관점이 필요하다고 강조했습니다.
![[인프라를 소프트웨어처럼 1/5] Infrastructure as Code, 그리고 그다음](https://flex.team/blog/og/main.jpg)
쿠버네티스 네이티브 자율 코딩 에이전트 프레임워크 Kelos를 소개하는 발표 세션입니다. 코딩 에이전트와 환경을 API화해 관리하는 오픈소스 프레임워크를 다룹니다.
AI 시대에는 도입보다 안정적인 운영과 인프라 역량이 더 중요해졌습니다. 이번 호는 시장 흐름과 플랫폼 엔지니어링, 클라우드 아키텍처, 보안·NPU 사례를 함께 다뤘습니다.
Flava DBaaS의 쿠버네티스 기반 아키텍처와 운영 구조를 소개했습니다. 또한 마이그레이션 도구와 서버리스, AI 기반 확장 방향까지 설명했습니다.

kt cloud가 플랫폼 엔지니어링으로 개발 환경의 복잡성을 줄이는 방안을 소개했습니다. 개발자가 더 빠르고 예측 가능하게 시작하도록 Self-Service와 자동화를 강화했습니다.
OpenStack 기반 개인용 샌드박스 이미지를 단일 VM에 GitOps 방식으로 구성했습니다.부팅 후 ArgoCD와 Flux가 Git 변경을 반영해 git push만으로 업데이트되도록 실험했습니다.
Spark Connect를 멀티세션 서비스로 운영하며 생기는 단일 장애점과 리소스 경합 문제를 다뤘습니다. replica, Gateway, 부하 점수 기반 세션 배치로 안정성을 높인 과정을 정리했습니다.

AI 에이전트가 사용자를 대신해 보호된 API에 접근하는 ID-JAG 실습 핸즈온을 소개했습니다. 실패 사례를 통해 토큰 교환, 정책 평가, 위임 경계를 직접 확인하도록 구성했습니다.

Kubernetes 환경에 LLM 서빙 최적화 기술을 도입하며 발생한 충돌과 해결 과정을 공유했습니다. Istio, 스케줄러, Pod 보호 정책과의 실전 문제를 진단한 사례입니다.
규제 환경에서 AI 에이전트를 안전하게 운영하기 위한 거버넌스와 통제 아키텍처를 정리했습니다. 모델 출력과 에이전트 행동을 분리해 제어하고, 운영 중에도 지속 검증하는 방법을 소개했습니다.
Amazon EKS에서 NVIDIA OSMO를 활용한 Physical AI 워크플로 운영 레퍼런스 아키텍처를 소개했습니다. GPU 스케줄링, 아티팩트 보존, 모니터링, 보안을 함께 다루는 방법을 설명했습니다.
Kubernetes Gateway API의 Policy 객체로 트래픽 제어를 세밀하게 나누는 방법을 정리했습니다. Ingress Annotation 대신 표준 CRD와 attach 방식 차이를 이해하는 것이 핵심입니다.
ArgoCD 배포를 정적 YAML 대신 HelmRelease와 FluxCD로 전환하는 방법을 정리했습니다. values 분리, 순서 보장, 에어갭 배포까지 운영 포인트를 함께 다뤘습니다.
Kubernetes 기반 GPU 클러스터를 안정적으로 운영하기 위한 유지 관리 방안을 정리했습니다. 자동화, 관측, 스케줄링 통합, 네트워크·보안 분리를 통해 장애 대응과 성능 안정성을 높이는 방법을 소개했습니다.
Git 평문 시크릿과 K8s Secret 오브젝트를 함께 없애기 위한 Vault 도입 전략을 정리했습니다. 운영 설계와 예외 처리, 감사 로그와 토큰 회수까지 함께 챙겨야 합니다.