Agent 로 최적화 하는 EKS 운영: AWS DevOps Agent + K8s Operator로 MTTR 줄이기
EKS 장애를 자동 감지해 AWS DevOps Agent 조사로 연결하는 Operator 활용법을 소개했습니다.\n로그와 이벤트를 즉시 수집해 MTTR을 줄이고, Runbook과 GitHub 연동으로 원인 분석을 고도화했습니다.

CloudWatch Logs 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
6개 표시
EKS 장애를 자동 감지해 AWS DevOps Agent 조사로 연결하는 Operator 활용법을 소개했습니다.\n로그와 이벤트를 즉시 수집해 MTTR을 줄이고, Runbook과 GitHub 연동으로 원인 분석을 고도화했습니다.

Amazon EKS Add-on으로 Falco를 설치해 Kubernetes 런타임 보안을 강화하는 방법을 소개했습니다. 커스텀 룰 적용과 CloudWatch 연동으로 탐지와 모니터링까지 구성했습니다.

AWS Network Firewall의 로그 수집과 분석 방법을 정리했습니다. Alert/Flow 로그 해석, Athena 쿼리, CloudWatch 필터링과 운영 시 주의점을 함께 설명했습니다.

AWS DataZone에서 MWAA와 OpenLineage를 연결해 Airflow 데이터 계보를 작성하는 방법을 설명했습니다. CloudWatch 로그, SQL 파싱, DataZone API를 조합해 입력·출력 테이블 계보를 업데이트했습니다.

DocumentDB 슬로우쿼리를 수집·시각화하고, COLLSCAN 쿼리에 대해 AI로 인덱스를 추천받는 파이프라인을 구축했습니다. 이를 통해 슬로우쿼리 합계가 약 30% 감소하고 무거운 쿼리가 개선되었습니다.

슬랙 기반 인시던트 전파의 지연 문제를 해결하기 위해 AWS Lambda와 CloudWatch Logs를 활용한 온콜 자동화 과정을 소개했습니다. Jira 티켓 생성과 담당자 알림까지 이어지는 흐름으로 장애 대응 속도를 높였습니다.
