Amazon EKS에서 Friendli Container로 LLM 추론 최적화하기 - AWS | Velopers

Amazon EKS에서 Friendli Container로 LLM 추론 최적화하기

2026년 2월 6일

7

AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 Amazon EKS에서 Friendli Container를 사용해 LLM 추론을 최적화하는 방법을 소개합니다.

핵심 내용

Friendli Container는 컨테이너 형태의 고성능 서빙 엔진으로 GPU 사용량 50% 이상 절감·Latency 2배 이상 개선·Throughput 2배 이상 향상
EKS Add-on으로 AWS 통합 빌링, 자동 업데이트, 간편 구독 제공
전제 조건: Kubernetes v1.28 이상, GPU Node Group 필요, 지원 GPU 목록(NVIDIA B200, H200, H100, A100, L40S, A10G, L4) 및 NVIDIA GPU Operator 권장
배포 흐름: GPU 노드 그룹 생성 → Add-on 구독 및 설치 → Pod Identity Association 설정 → FriendliDeployment CR 적용으로 모델 배포 및 포트포워딩으로 테스트

연관 게시글

Amazon EKS에서vLLM Deep Learning Container를 사용하여LLM 배포하기

Amazon EKS에서vLLM Deep Learning Container를 사용하여LLM 배포하기

AWS

AWS • 2025년 10월 27일

Amazon EKS MCP 서버를 통한 애플리케이션 개발 가속화

Amazon EKS MCP 서버를 통한 애플리케이션 개발 가속화

AWS

AWS • 2025년 11월 4일

NVIDIA GPU Operator로 GPU 모니터링 PoC 구축하기

NVIDIA GPU Operator로 GPU 모니터링 PoC 구축하기

데보션

데보션 • 2025년 5월 7일