
AI
특정 YouTube 영상의 댓글에 대한 자연어 분석 RAG 시스템 개발 with LangGraph + Qdrant
두줄요약
YouTube 댓글의 정보 과부하를 RAG로 해결하는 분석 시스템을 LangGraph와 Qdrant로 구현했습니다.댓글 수집, 의미 검색, 응답 생성을 분리하고 MVP 한계와 개선점까지 정리했습니다.
문제 상황
- YouTube 댓글이 많아 전체 반응과 특정 포인트를 직접 읽어 파악하기 어려운 정보 과부하
- 기본 댓글 정렬과 검색 기능만으로는 주제별 반응, 감정 분포, 맥락 파악에 한계
해결 방법
- RAG로 댓글을 수집·임베딩·검색·생성까지 연결해 자연어 질문에 답변하는 분석 시스템 구성
- LangGraph로 수집, 쿼리 분류, 적응형 검색, 응답 생성을 상태 기반 워크플로우로 분리
- Qdrant와 벡터 임베딩으로 의미적으로 유사한 댓글을 찾아 종합 인사이트 생성
성능/운영 포인트
- YouTube Data API의 relevance 정렬로 관련성 높은 댓글 우선 수집
- 댓글 메타데이터와 답글 일부를 함께 저장해 대화 맥락 보존
- 이미 수집된 댓글이 있으면 재수집 없이 검색 단계로 진입하는 흐름
주의할 점
- 키워드 기반 쿼리 분류의 한계로 포괄적 질문 인식이 제한적
- 검색 개수와 전략이 고정되어 있어 질문 복잡도에 따른 유연한 조정이 어려움
- 언어 혼재 댓글 처리와 재수집 비효율 개선 필요
