

RAG 없이 20만 대 자동차와 실시간으로 대화하기 (1)
20만 대 차량의 실시간 데이터를 다루기 위해 RAG의 한계를 검토했습니다. 검색 기반보다 API로 직접 정보를 조합하는 아키텍처가 더 적합하다고 판단했습니다.
#RAG#LLM
25005분


20만 대 차량의 실시간 데이터를 다루기 위해 RAG의 한계를 검토했습니다. 검색 기반보다 API로 직접 정보를 조합하는 아키텍처가 더 적합하다고 판단했습니다.

RAG 2.0 보안은 모델 응답보다 검색과 삽입 단계의 실행 흐름 통제가 핵심이라고 정리했습니다. Microsoft, Meta, QueryPie 사례를 통해 세션·메타데이터 기반 정책 평가의 필요성을 설명했습니다.


AKS에 Qdrant를 배포해 RAG 개발 환경을 빠르게 구성하는 방법을 소개했습니다. Kubernetes 설정과 Ingress 튜닝으로 저장성과 외부 접근성을 확보했습니다.