Velopers
모든 블로그모든 태그공지주간 인기글

오늘 새 글

2개

오늘 조회수

461회

최근 7일 인기 글Istio 3-1편: 503과 Half-open Connection채널톡 · 39회최근 30일 활발한 블로그AWS25개 발행 · 총 388개 · 18,629회
필터 1
Nota AI가 제안하는 AWS Inferentia에서 다양한 LLM 모델 양자화 최적화기법 사용하기
AWS
· 2026년 1월 20일
AI

Nota AI가 제안하는 AWS Inferentia에서 다양한 LLM 모델 양자화 최적화기법 사용하기

AWS Inferentia/Trainium에서 LLM 양자화 최적화 방법을 소개했습니다.\n민감도 기반 선택적 양자화와 fake quantization으로 메모리를 줄이면서 정확도 손실을 완화했습니다.

#AWS Inferentia#Trainium
43005분

Powered by Velopers

이용약관개인정보처리방침공지사항