생성과 검색의 하모니: RAG로 더 똑똑한 AI 만들기

생성과 검색의 하모니: RAG로 더 똑똑한 AI 만들기
RAG는 외부 문서를 검색해 LLM 답변에 반영하는 방식으로, 최신성 부족과 환각 문제를 보완했습니다. 실전 적용 시에는 데이터 품질, 검색 성능, 지연 시간, 보안까지 함께 고려해야 했습니다.
#RAG#LLM
132005분

RAG는 외부 문서를 검색해 LLM 답변에 반영하는 방식으로, 최신성 부족과 환각 문제를 보완했습니다. 실전 적용 시에는 데이터 품질, 검색 성능, 지연 시간, 보안까지 함께 고려해야 했습니다.


Poetry와 UV를 실제로 비교하며 속도와 사용성을 점검했습니다.\nUV는 더 간결했지만 극적인 차이는 아니어서 신규 프로젝트부터 시험 도입하는 접근이 적합했습니다.


UV를 PIP 대체 도구로 소개하며 설치와 기본 사용법, 주요 명령어를 정리했습니다. 가상환경 자동화와 빠른 성능, 의존성 및 Python 버전 관리 기능을 함께 설명했습니다.


FastAPI의 Depends()로 의존성 주입을 적용하는 방법을 설명했습니다. 비즈니스 로직과 구현체를 분리해 유연성과 테스트 용이성을 높이는 구조를 소개했습니다.


FastAPI와 SQLite로 사용자 관리 API를 빠르게 만들고, 모듈화된 구조로 기능을 분리하는 방법을 소개했습니다. 의존성 주입과 예외 처리, 자동 문서화를 활용해 유지 보수성과 프로토타이핑 속도를 높였습니다.


FastAPI 프로젝트에서 service와 router를 분리해 결합도를 낮추는 구조를 소개했습니다. 모듈 독립성과 테스트 용이성을 높여 유지보수성과 확장성을 개선하는 방법을 정리했습니다.


쿠버네티스로 검색추천 시스템을 컨테이너화하고 미디어 에이전트 서비스에 적용한 사례를 소개했습니다. 클러스터 구성, 배포, 모니터링, 운영 이슈 대응까지 함께 정리했습니다.