Velopers
모든 블로그모든 태그공지주간 인기글

새로운 기술 블로그가 추가되었어요

아임웹

오늘 새 글

0개

오늘 조회수

43회

최근 7일 인기 글AI로 웹 엔지니어 없이 LINE 앱 안에서 그룹 영상 통화 서비스 만들기라인 · 54회최근 30일 활발한 블로그AWS23개 발행 · 총 388개 · 18,937회
필터 1
왓챠 추천 서비스 MLOps 적용기 Part2
watcha
·2024년 3월 6일
AI

왓챠 추천 서비스 MLOps 적용기 Part2

왓챠는 추천 서비스의 Monolithic 추론 구조를 분리된 TorchServe 기반 서버로 개선했습니다. CPU 최적화와 모델 경량화, Datadog 모니터링으로 성능과 안정성을 함께 높였습니다.

#MLOps#TorchServe
12005분
ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유
네이버 플레이스
·2023년 7월 13일
백엔드

ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유

GPU 모델 서버를 CPU 서버로 전환하면서 성능 저하를 막기 위해 worker, thread, IPEX, KD를 함께 최적화했습니다. 그 결과 서비스 품질을 유지하며 GPU 자원을 절감했습니다.

#ML#server
15005분

Powered by Velopers

이용약관개인정보처리방침공지사항