모든 태그
태그

Kubernetes 기술 블로그 글

Kubernetes 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 412최신 20개 표시
홈에서 필터

최신 게시글

20개 표시

데브옵스

Istio 3-2편: Partially Enrolled Pod와 Untaint Controller

Ambient mode에서 Pod은 Ready인데 mesh 트래픽이 실패하는 partially enrolled 문제를 다뤘습니다. istio-cni 준비 전에는 일반 Pod이 스케줄되지 않도록 startup taint와 untaint-controller를 활용했습니다.

#Istio#Kubernetes#Ambient mode
1000

데브옵스

[인프라를 소프트웨어처럼 3/5] 환경은 브랜치에서 태어난다: Environment Variant

공유 dev 병목을 없애기 위해 브랜치 하나로 격리 환경을 만드는 Environment Variant 설계를 소개했습니다. ArgoCD ApplicationSet으로 생성과 회수를 자동화해 환경 생명주기를 git과 연결했습니다.

#ArgoCD#Kubernetes#Git
900

데브옵스

SSL/TLS 인증서 유효기간 단축, 우리의 대응 전략

SSL/TLS 인증서 유효기간이 계속 단축되는 흐름과 그에 따른 운영 리스크를 정리했습니다. 자동화와 모니터링을 중심으로 한 대응 전략도 함께 제시했습니다.

#SSL/TLS#cloud#Kubernetes
200

데브옵스

Istio 3-1편: 503과 Half-open Connection

Istio Ambient mode에서 워크로드 재시작 시 간헐적 503이 발생한 원인을 추적했습니다. 오래된 HBONE connection 재사용과 ztunnel의 graceful close 부재가 핵심이었고, reset retry로 증상을 완화했습니다.

#Istio#Envoy#gRPC
400

데브옵스

Istio 3-1편: 503과 Half-open Connection

Istio Ambient mode에서 Pod IP 재사용과 stale connection 재사용이 겹쳐 간헐적 503이 발생했습니다. 로그와 pcap, socket을 교차 검증하고 reset retry로 증상을 완화했습니다.

#Istio#Envoy#Kubernetes
5120

데브옵스

[인프라를 소프트웨어처럼 1/5] Infrastructure as Code, 그리고 그다음

Terraform plan은 변경점만 보여 주고 실제 동작은 보장하지 못한다고 설명했습니다. IaC를 넘어 테스트 가능성과 재현 가능성을 갖춘 IaS 관점이 필요하다고 강조했습니다.

#Terraform#IaC#cloud
1400

AI

Kelos - 쿠버네티스 네이티브 자율 코딩 에이전트 프레임워크

쿠버네티스 네이티브 자율 코딩 에이전트 프레임워크 Kelos를 소개하는 발표 세션입니다. 코딩 에이전트와 환경을 API화해 관리하는 오픈소스 프레임워크를 다룹니다.

#Kubernetes#API#오픈소스
4300

데브옵스

케클s피드 6월호|AI 시대, 인프라 운영 역량이 더 중요해진 이유

AI 시대에는 도입보다 안정적인 운영과 인프라 역량이 더 중요해졌습니다. 이번 호는 시장 흐름과 플랫폼 엔지니어링, 클라우드 아키텍처, 보안·NPU 사례를 함께 다뤘습니다.

#cloud#Kubernetes#CI/CD
1800

데브옵스

Flava DBaaS 딥다이브: 아키텍처부터 마이그레이션, 그리고 미래까지

Flava DBaaS의 쿠버네티스 기반 아키텍처와 운영 구조를 소개했습니다. 또한 마이그레이션 도구와 서버리스, AI 기반 확장 방향까지 설명했습니다.

#Kubernetes#DBaaS#MySQL
1400

데브옵스

[케클러 인터뷰 시리즈] #3 개발자가 본질에 집중하도록: kt cloud 플랫폼 엔지니어링 이야기

kt cloud가 플랫폼 엔지니어링으로 개발 환경의 복잡성을 줄이는 방안을 소개했습니다. 개발자가 더 빠르고 예측 가능하게 시작하도록 Self-Service와 자동화를 강화했습니다.

#플랫폼 엔지니어링#DevSecOps#CI/CD
600

데브옵스

[사례연구] 사내 개인용 개발환경 이미지 실험기 1부: git push로 업데이트되는 OpenStack 샌드박스 만들기

OpenStack 기반 개인용 샌드박스 이미지를 단일 VM에 GitOps 방식으로 구성했습니다.부팅 후 ArgoCD와 Flux가 Git 변경을 반영해 git push만으로 업데이트되도록 실험했습니다.

#OpenStack#GitOps#ArgoCD
3100

데브옵스

Spark Connect on Kubernetes #1: 견고한 Spark Connect 만들기

Spark Connect를 멀티세션 서비스로 운영하며 생기는 단일 장애점과 리소스 경합 문제를 다뤘습니다. replica, Gateway, 부하 점수 기반 세션 배치로 안정성을 높인 과정을 정리했습니다.

#Spark#Kubernetes#gRPC
4600

AI

ID-JAG The Hard Way: 실패로 배우는 AI 에이전트 보안 핸즈온

AI 에이전트가 사용자를 대신해 보호된 API에 접근하는 ID-JAG 실습 핸즈온을 소개했습니다. 실패 사례를 통해 토큰 교환, 정책 평가, 위임 경계를 직접 확인하도록 구성했습니다.

#보안#MCP#OAuth
3300

데브옵스

MLXP : Kubernetes LLM Serving 최적화 기술 도입기

Kubernetes 환경에 LLM 서빙 최적화 기술을 도입하며 발생한 충돌과 해결 과정을 공유했습니다. Istio, 스케줄러, Pod 보호 정책과의 실전 문제를 진단한 사례입니다.

#Kubernetes#LLM#MLOps
6100

AI

[AWS Summit Korea 2026] 규제 환경에서의 통제 가능한 AI 에이전트 아키텍처

규제 환경에서 AI 에이전트를 안전하게 운영하기 위한 거버넌스와 통제 아키텍처를 정리했습니다. 모델 출력과 에이전트 행동을 분리해 제어하고, 운영 중에도 지속 검증하는 방법을 소개했습니다.

#LLM#AWS#Kubernetes
2400

데브옵스

Amazon EKS에서 NVIDIA OSMO 기반 Physical AI 워크플로 운영하기

Amazon EKS에서 NVIDIA OSMO를 활용한 Physical AI 워크플로 운영 레퍼런스 아키텍처를 소개했습니다. GPU 스케줄링, 아티팩트 보존, 모니터링, 보안을 함께 다루는 방법을 설명했습니다.

#Amazon EKS#NVIDIA OSMO#Kubernetes
2500

데브옵스

[기술분석] Kubernetes Gateway API에서 트래픽을 세밀하게 제어하는 Policy 객체 파헤치기

Kubernetes Gateway API의 Policy 객체로 트래픽 제어를 세밀하게 나누는 방법을 정리했습니다. Ingress Annotation 대신 표준 CRD와 attach 방식 차이를 이해하는 것이 핵심입니다.

#Kubernetes#Gateway API#NGINX Gateway Fabric
400

데브옵스

[전환가이드] ArgoCD·FluxCD GitOps 배포를 HelmRelease로 전환하는 방법

ArgoCD 배포를 정적 YAML 대신 HelmRelease와 FluxCD로 전환하는 방법을 정리했습니다. values 분리, 순서 보장, 에어갭 배포까지 운영 포인트를 함께 다뤘습니다.

#ArgoCD#FluxCD#GitOps
900

데브옵스

[운영가이드] Kubernetes 기반 Fault-Tolerant GPU 클러스터 유지 관리

Kubernetes 기반 GPU 클러스터를 안정적으로 운영하기 위한 유지 관리 방안을 정리했습니다. 자동화, 관측, 스케줄링 통합, 네트워크·보안 분리를 통해 장애 대응과 성능 안정성을 높이는 방법을 소개했습니다.

#Kubernetes#GPU#Slurm
700

데브옵스

[도입전략] Git 시크릿 관리와 Vault 도입으로 보안 강화하기

Git 평문 시크릿과 K8s Secret 오브젝트를 함께 없애기 위한 Vault 도입 전략을 정리했습니다. 운영 설계와 예외 처리, 감사 로그와 토큰 회수까지 함께 챙겨야 합니다.

#Vault#Kubernetes#Git
2900