SLM 기반 Agentic AI: Planner–Caller–Generator 구조 설계와 성능 분석

AI

SLM 기반 Agentic AI: Planner–Caller–Generator 구조 설계와 성능 분석

한글과컴퓨터

한글과컴퓨터2025년 11월 7일

두줄요약

SLM 기반 P–C–G 구조로 Agentic AI의 역할을 분리해 효율성과 안정성을 높였습니다. 한국어 도구 활용 환경에서 GPT-4o-mini 수준의 성능과 토큰 절감 효과를 확인했습니다.

핵심 내용

SLM 기반 Agentic AI 구조 P–C–G(Planner–Caller–Generator) 제안
계획, 도구 호출, 응답 생성을 분리해 반복 추론과 토큰 사용량 감소
한국어 도구 활용 환경에서 GPT-4o-mini 수준의 성능과 효율성 확인

구조와 흐름

Planner의 초기 계획 수립 후 Caller가 도구 실행과 인자 검증 담당
Generator가 중간 결과를 종합해 최종 자연어 응답 생성
필요 시에만 제한적 재계획 수행으로 ReAct 방식의 반복 호출 완화

성능/운영 포인트

Single-chain, Multi-chain, Missing Parameters, Missing Functions 조건으로 평가
Call Accuracy, Generate Accuracy, TSR, 토큰 수, 지연 시간으로 비교
경량 모델임에도 평균 토큰 수 12~22% 절감과 실용 수준의 응답 속도 확인

적용해볼 점

역할 분리 기반 Agentic AI로 비용, 지연, 자원 소모 최적화 가능성 검토
한국어 중심 서비스에서 도구 활용형 에이전트 설계에 참고 가능
Planner 경량화, 캐싱, 보안 대응 강화 같은 후속 개선 여지 존재

댓글 0개

댓글을 작성하려면 로그인이 필요합니다.

댓글을 불러오는 중...