Velopers
모든 블로그모든 태그공지주간 인기글

새로운 기술 블로그가 추가되었어요

아임웹

오늘 새 글

0개

오늘 조회수

43회

최근 7일 인기 글AI로 웹 엔지니어 없이 LINE 앱 안에서 그룹 영상 통화 서비스 만들기라인 · 54회최근 30일 활발한 블로그AWS23개 발행 · 총 388개 · 18,937회
필터 1
생성형 AI 기반 실시간 검색 결과 재순위화 2편 - LLM 서빙
네이버 D2
·2024년 9월 25일
AI

생성형 AI 기반 실시간 검색 결과 재순위화 2편 - LLM 서빙

대규모 검색 재순위화를 위해 LLM 서빙 프레임워크와 최적화 방법을 비교하고, TRT-LLM과 Triton 조합을 채택했습니다. 양자화, 배치 조절, OpenTelemetry와 대시보드로 성능과 운영 가시성을 함께 확보했습니다.

#LLM#gRPC
21005분

Powered by Velopers

이용약관개인정보처리방침공지사항