로봇 ML 모델의 경량화 #1: 훈련 후 양자화

AI

로봇 ML 모델의 경량화 #1: 훈련 후 양자화

우아한 형제들

우아한 형제들2024년 8월 22일

두줄요약

실외 자율주행 로봇에서는 서버용 ML 모델을 그대로 쓰기 어려워 경량화가 필요했습니다. 이 글은 PTQ와 TensorRT 기반 최적화, ONNX 변환 흐름을 설명했습니다.

핵심 내용

실외 자율주행 로봇에서는 고성능 서버용 ML 모델을 그대로 배포하기 어려워 경량화가 필요함
Jetson과 TensorRT를 활용해 서버에서 학습한 모델을 엣지 환경에 맞게 최적화하는 흐름을 설명함
훈련 후 양자화(PTQ)의 원리, 캘리브레이션 개념, PyTorch 모델의 ONNX 변환과 TensorRT 엔진 생성 방법을 예시로 소개함
Torch-TensorRT와의 차이도 함께 비교하며, 실시간성이 중요한 경우 온전한 TensorRT 엔진 활용을 권장함

댓글 0개

댓글을 작성하려면 로그인이 필요합니다.

댓글을 불러오는 중...