
리눅스의 Control Groups 기능이 Kubernetes에 어떻게 적용되는지 살펴보기
리눅스 cgroups가 Kubernetes의 Pod 자원 제한과 배분에 어떻게 연결되는지 설명했습니다. 메모리와 CPU 설정이 requests, limits로 어떻게 반영되는지도 실험을 통해 정리했습니다.

리눅스 cgroups가 Kubernetes의 Pod 자원 제한과 배분에 어떻게 연결되는지 설명했습니다. 메모리와 CPU 설정이 requests, limits로 어떻게 반영되는지도 실험을 통해 정리했습니다.


Helm은 Kubernetes 애플리케이션 배포와 관리를 단순화하는 패키지 관리자입니다. EKS에서 차트를 사용해 설치, 재사용, 자동화를 쉽게 적용할 수 있습니다.

AWX를 활용해 배포 자동화 툴을 구축한 사례와 구성 요소를 정리했습니다. 또한 Kubernetes 연동, 무중단 배포, 운영 시 고려사항까지 함께 살펴봤습니다.


이벤트 스트리밍 처리를 위해 Flink SQL을 도입한 사례와 선택 이유를 정리했습니다. 또한 Kubernetes 기반 HA 구성, GitOps 배포, 운영 중 트러블슈팅과 모니터링 포인트를 공유했습니다.


GPU 메모리 사용을 줄이기 위한 그레이디언트 누적, 체크포인팅, ZeRO, LoRA, QLoRA를 정리했습니다. 각 기법이 절감하는 메모리 영역과 적용 효과를 예시와 함께 설명했습니다.

LLMOps 구축 사례를 통해 LLM 애플리케이션의 데이터 준비, 프롬프트, 배포, 테스트를 하나의 흐름으로 관리하는 방법을 소개했습니다. 도메인 전문가 참여와 재사용 가능한 공통 컴포넌트로 협업 효율을 높인 내용입니다.


Nginx mirror 모듈과 envsubst로 트래픽 미러링 테스트를 구성하고, dev 환경에서 origin과 candidate를 동시에 검증하는 과정을 공유했습니다. 또한 k6 부하 테스트와 로그 포맷 설정을 통해 응답 비교와 운영 적용 방안까지 살펴보았습니다.

NHN Cloud에서 제공하는 보안 가이드의 종류와 활용 범위를 소개했습니다. 클라우드 환경에서 보안 설계와 운영 점검 기준으로 참고할 수 있습니다.


Kubernetes에서 NFS를 활용해 여러 파드가 동시에 읽고 쓸 수 있는 RWX 스토리지를 구성하는 방법을 정리했습니다. Ganesha 프로비저너 기반 동적 프로비저닝과 주의사항, 활용 사례를 함께 소개했습니다.

LLM 애플리케이션을 직군에 상관없이 쉽게 만들고 배포할 수 있는 환경 구축 사례를 소개했습니다. Prompt Store, Langflow, 자동 배포 구조로 개발과 피드백 주기를 단축했습니다.


2025년 DevOps 트렌드 4가지를 소개하며 AI 에이전트, FinOps, 인프라 자동화, 정책 기반 거버넌스를 정리했습니다. 특히 기술팀의 역할 확대와 자동화·컴플라이언스 중요성을 강조했습니다.


쏘카 데이터 엔지니어링팀 합류 후 온보딩과 프로젝트, 온콜 경험을 회고한 글입니다. 체계적인 문서화와 협업 문화가 실무 적응에 큰 도움이 되었다고 정리했습니다.