네이버 D22025년 7월 15일AIRay를 활용한 GPU Util 100% MLOps: 배치처리부터 모델 서빙까지Ray를 활용해 GPU Util 100% 배치 처리와 확장 가능한 모델 서빙 아키텍처를 소개했습니다. Ray Serve와 vLLM 기반 LLM 추론 파이프라인 및 운영 사례도 다뤘습니다.#Ray#MLOps#GPU22600Ray를 활용한 GPU Util 100% MLOps: 배치처리부터 모델 서빙까지