그 많던 토큰은 누가 다 먹었을까
AI
그 많던 토큰은 누가 다 먹었을까
두줄요약
에이전트형 도구에서는 프롬프트보다 도구 출력과 대화 기록이 토큰을 더 많이 소모했습니다. 필요한 정보만 사전 필터링하고 작업 범위를 좁히는 방식으로 컨텍스트를 관리해야 했습니다.
핵심 내용
- 에이전트형 개발 도구에서 토큰 소모의 주요 원인이 사용자 프롬프트보다 도구 출력과 대화 기록에 있음
- Figma MCP 응답처럼 불필요한 메타데이터와 내부 속성이 컨텍스트를 빠르게 채우는 문제 제기
- 해결 방향은 사후 요약보다 사전 필터링, 현재 작업 상태 중심 관리, 탐색 범위 제한
- Figma, API, DB, 로그, 코드 리뷰 등에서 필요한 정보만 전달하는 원칙 제안
적용해볼 점
- 도구 출력은 모델에 들어가기 전에 필요한 필드만 추출
- 컨텍스트는 누적 기록이 아니라 현재 작업 상태로 정리
- 작업 목표, 허용 범위, 금지 사항, 검증 방법을 먼저 정의
