우아한 형제들 · 2025년 1월 31일AI로봇 ML 모델의 경량화 2부: 양자화 인식 훈련PTQ의 성능 저하 한계를 보완하기 위한 QAT 개념과 원리를 설명했습니다.\nNVIDIA pytorch-quantization으로 QAT를 수행하고 ONNX/TensorRT로 변환하는 절차를 소개했습니다.#ML#양자화21005분