로봇 ML 모델의 경량화 2부: 양자화 인식 훈련
PTQ의 성능 저하 한계를 보완하기 위한 QAT 개념과 원리를 설명했습니다.\nNVIDIA pytorch-quantization으로 QAT를 수행하고 ONNX/TensorRT로 변환하는 절차를 소개했습니다.
#ML#양자화#QAT
2200

TensorRT 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
5개 표시
PTQ의 성능 저하 한계를 보완하기 위한 QAT 개념과 원리를 설명했습니다.\nNVIDIA pytorch-quantization으로 QAT를 수행하고 ONNX/TensorRT로 변환하는 절차를 소개했습니다.

실외 자율주행 로봇에서는 서버용 ML 모델을 그대로 쓰기 어려워 경량화가 필요했습니다. 이 글은 PTQ와 TensorRT 기반 최적화, ONNX 변환 흐름을 설명했습니다.

리디는 추천 시스템을 SageMaker 기반 MLOps 플랫폼으로 재구성해 운영 복잡도를 줄였습니다. 모델 버전 관리, 롤백 자동화, 실시간 추론으로 더 동적인 추천 경험을 준비했습니다.

로봇 엣지 디바이스에서 동작하는 MLOps 파이프라인과 TensorRT 기반 추론 도구를 소개했습니다. Trtexec, TREx, Nsight Systems로 변환·시각화·성능 분석을 수행하는 흐름을 정리했습니다.

로봇용 머신러닝 개발에서 재현성과 온프레미스 자원 관리가 왜 중요한지 설명했습니다. K3s와 Airflow로 이를 해결하는 MLOps 구성 방법을 소개했습니다.
