목록 보기
특정 YouTube 영상의 댓글에 대한 자연어 분석 RAG 시스템 개발 with LangGraph + Qdrant
AI

특정 YouTube 영상의 댓글에 대한 자연어 분석 RAG 시스템 개발 with LangGraph + Qdrant

데보션
데보션
2025년 8월 31일

두줄요약

YouTube 댓글의 정보 과부하를 RAG로 해결하는 분석 시스템을 LangGraph와 Qdrant로 구현했습니다.댓글 수집, 의미 검색, 응답 생성을 분리하고 MVP 한계와 개선점까지 정리했습니다.

문제 상황

  • YouTube 댓글이 많아 전체 반응과 특정 포인트를 직접 읽어 파악하기 어려운 정보 과부하
  • 기본 댓글 정렬과 검색 기능만으로는 주제별 반응, 감정 분포, 맥락 파악에 한계

해결 방법

  • RAG로 댓글을 수집·임베딩·검색·생성까지 연결해 자연어 질문에 답변하는 분석 시스템 구성
  • LangGraph로 수집, 쿼리 분류, 적응형 검색, 응답 생성을 상태 기반 워크플로우로 분리
  • Qdrant와 벡터 임베딩으로 의미적으로 유사한 댓글을 찾아 종합 인사이트 생성

성능/운영 포인트

  • YouTube Data API의 relevance 정렬로 관련성 높은 댓글 우선 수집
  • 댓글 메타데이터와 답글 일부를 함께 저장해 대화 맥락 보존
  • 이미 수집된 댓글이 있으면 재수집 없이 검색 단계로 진입하는 흐름

주의할 점

  • 키워드 기반 쿼리 분류의 한계로 포괄적 질문 인식이 제한적
  • 검색 개수와 전략이 고정되어 있어 질문 복잡도에 따른 유연한 조정이 어려움
  • 언어 혼재 댓글 처리와 재수집 비효율 개선 필요

댓글 0

댓글을 작성하려면 로그인이 필요합니다.

댓글을 불러오는 중...