태그

TorchServe 기술 블로그 글

TorchServe 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 2개최신 2개 표시

홈에서 필터

#Kubernetes412 #ML283 #gRPC65 #server61 #MLOps42 #Datadog36 #FastAPI23 #PyTorch19 #LLM995 #AWS635 #cloud422 #UI/UX395

최신 게시글

2개 표시

2024년 3월 6일

왓챠 추천 서비스 MLOps 적용기 Part2

왓챠는 추천 서비스의 Monolithic 추론 구조를 분리된 TorchServe 기반 서버로 개선했습니다. CPU 최적화와 모델 경량화, Datadog 모니터링으로 성능과 안정성을 함께 높였습니다.

#MLOps#TorchServe#PyTorch

왓챠 추천 서비스 MLOps 적용기 Part2

2023년 7월 13일

ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유

GPU 모델 서버를 CPU 서버로 전환하면서 성능 저하를 막기 위해 worker, thread, IPEX, KD를 함께 최적화했습니다. 그 결과 서비스 품질을 유지하며 GPU 자원을 절감했습니다.

#ML#server#Kubernetes

ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유