
AI
Claude Code 비용/사용량을 한눈에: AWS에 Observability 플랫폼 구축하기
두줄요약
Claude Code의 세션·비용·사용량을 보기 위해 AWS 관리형 서비스로 Observability 플랫폼을 구축하는 방법을 소개했습니다. 메트릭과 이벤트를 분리해 실시간 모니터링과 심층 분석을 함께 제공했습니다.
핵심 내용
- Claude Code의 세션, 비용, 토큰 사용량, 도구 실행 결과를 관측하기 위한 AWS 기반 Observability 플랫폼 소개
- 메트릭은 AMP로, 이벤트는 S3·Athena로 분리하는 이중 파이프라인 구조 채택
- ADOT Collector, Firehose, Lambda, EventBridge, Grafana를 조합해 실시간 모니터링과 심층 분석을 동시에 제공
- 팀별 비용 추적, 모델 효율 비교, 도구 성공률, 레이턴시 분석 등 운영 인사이트 확보 방법 정리
구조와 흐름
- 단일 수집 지점에서 OTLP 메트릭과 로그를 분기하는 ADOT Collector 구성
- Prometheus Remote Write 기반 메트릭 파이프라인과 Parquet 변환 기반 이벤트 파이프라인 분리
- CloudWatch Logs, Firehose, S3, Athena로 이어지는 이벤트 분석 경로와 Grafana 대시보드 연동
주의할 점
- Prometheus Remote Write는 cumulative temporality만 지원해 delta 설정 시 메트릭 손실 가능성 존재
- S3 파티션은 EventBridge와 Glue API로 자동 등록해 지연과 비용을 줄이는 설계 필요
- 팀별, 사용자별 분석을 위해 OTel 리소스 속성의 라벨 변환 활용 필요
