Agentic AIOps — RCA 에이전트 ‘SentryOn’ 도입기 (feat. Strands SDK)
데브옵스
Agentic AIOps — RCA 에이전트 ‘SentryOn’ 도입기 (feat. Strands SDK)
두줄요약
MSA 장애 대응의 복잡성을 줄이기 위해 RCA 에이전트 SentryOn을 도입한 과정을 소개했습니다. 도메인 지식, 데이터 정제, Skill 분리, 프롬프트 캐싱으로 정확도와 효율을 높였습니다.
핵심 내용
- AWS EKS 기반 MSA 운영에서 장애 원인 파악이 경험과 직관에 의존해 비효율적이라는 문제의식
- Strands Agent SDK로 RCA 에이전트 SentryOn을 구현하고, 단일 에이전트 구조로 단순화
- 사내 도메인 지식 주입, Whatap JSON 정제, Elasticsearch 로그 에러 패밀리 압축, Datadog Skill 분리, 프롬프트 캐싱으로 진단 품질과 비용을 개선
