AWS2025년 10월 24일AISageMaker AI로 해보는 GPT-OSS 추론 성능 테스트와 용량 산정SageMaker AI에서 GPT-OSS 120B 추론 성능 테스트와 GPU 용량 산정 방법을 다뤘습니다. vLLM과 SGLang을 비교하며 워크로드별 성능 지표와 최적화 포인트를 정리했습니다.#SageMaker AI#LLM#vLLM6900