
AI
SLM 기반 Agentic AI: Planner–Caller–Generator 구조 설계와 성능 분석
두줄요약
SLM 기반 P–C–G 구조로 Agentic AI의 역할을 분리해 효율성과 안정성을 높였습니다. 한국어 도구 활용 환경에서 GPT-4o-mini 수준의 성능과 토큰 절감 효과를 확인했습니다.
핵심 내용
- SLM 기반 Agentic AI 구조 P–C–G(Planner–Caller–Generator) 제안
- 계획, 도구 호출, 응답 생성을 분리해 반복 추론과 토큰 사용량 감소
- 한국어 도구 활용 환경에서 GPT-4o-mini 수준의 성능과 효율성 확인
구조와 흐름
- Planner의 초기 계획 수립 후 Caller가 도구 실행과 인자 검증 담당
- Generator가 중간 결과를 종합해 최종 자연어 응답 생성
- 필요 시에만 제한적 재계획 수행으로 ReAct 방식의 반복 호출 완화
성능/운영 포인트
- Single-chain, Multi-chain, Missing Parameters, Missing Functions 조건으로 평가
- Call Accuracy, Generate Accuracy, TSR, 토큰 수, 지연 시간으로 비교
- 경량 모델임에도 평균 토큰 수 12~22% 절감과 실용 수준의 응답 속도 확인
적용해볼 점
- 역할 분리 기반 Agentic AI로 비용, 지연, 자원 소모 최적화 가능성 검토
- 한국어 중심 서비스에서 도구 활용형 에이전트 설계에 참고 가능
- Planner 경량화, 캐싱, 보안 대응 강화 같은 후속 개선 여지 존재
