
AI
부트텐트의 생성형 AI 기반 교육과정 등록 자동화 시스템 구성하기
두줄요약
부트텐트는 모집 페이지를 분석해 교육과정 등록 초안을 자동 생성하는 파이프라인을 구축했습니다. 하이브리드 OCR과 검증 에이전트를 적용해 정확도와 비용, 처리 시간을 함께 개선했습니다.
문제 상황
- 부트텐트 교육과정 등록은 교육기관 담당자가 모집 페이지 정보를 내부 폼에 다시 옮겨 적는 수작업 중심 구조
- 입력 항목이 많고 표현 방식과 분류 체계가 달라, 이미지형 공고의 정보 추출과 필드 매핑에 큰 부담 발생
- 등록 지연과 입력 품질 편차가 반복되며 운영 목표에 영향
원인 분석
- 모집 정보의 상당 부분이 포스터·스크롤 이미지에 포함되어 수기 확인 필요
- 일정, 비용, 자격요건처럼 중요한 정보의 오입력이 신뢰와 운영 리스크로 연결
- OCR 품질, 필드 매핑, 검증을 함께 다뤄야 하는 복합 문제
해결 방법
- Amazon Bedrock과 AWS Step Functions 기반 7단계 자동화 파이프라인 구성
- Playwright 기반 페이지 수집, 하이브리드 Vision OCR, 55개 필드 구조화 추출, Validator Agent 검증 적용
- vLLM의 Qwen3-VL-8B를 Primary로 두고 Claude를 Fallback으로 연결해 한국어 OCR 품질과 비용을 균형화
성능/운영 포인트
- 교육과정 등록 시간 약 69.0% 절감
- 필드 정확도 88.7%, Validator 오류 검출률 98.0%
- Haiku 대비 Vision OCR 비용 약 40% 절감, Fallback 구조로 운영 안정성 확보
적용해볼 점
- OCR 정확도와 추출 정확도를 분리해 설계하는 접근
- 구조화 출력 전용 프롬프트와 검증 에이전트 결합
- 사람 검수(HITL)를 남겨 둔 점진적 자동화
