모든 태그
태그

TensorRT 기술 블로그 글

TensorRT 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 5최신 5개 표시
홈에서 필터

최신 게시글

5개 표시

AI

로봇 ML 모델의 경량화 2부: 양자화 인식 훈련

PTQ의 성능 저하 한계를 보완하기 위한 QAT 개념과 원리를 설명했습니다.\nNVIDIA pytorch-quantization으로 QAT를 수행하고 ONNX/TensorRT로 변환하는 절차를 소개했습니다.

#ML#양자화#QAT
2200

AI

로봇 ML 모델의 경량화 #1: 훈련 후 양자화

실외 자율주행 로봇에서는 서버용 ML 모델을 그대로 쓰기 어려워 경량화가 필요했습니다. 이 글은 PTQ와 TensorRT 기반 최적화, ONNX 변환 흐름을 설명했습니다.

#ML#NVIDIA#TensorRT
3100

AI

리디 추천 시스템, MLOps Platform에 올라탈 결심

리디는 추천 시스템을 SageMaker 기반 MLOps 플랫폼으로 재구성해 운영 복잡도를 줄였습니다. 모델 버전 관리, 롤백 자동화, 실시간 추론으로 더 동적인 추천 경험을 준비했습니다.

#MLOps#AWS SageMaker#ML
3100

데브옵스

로봇을 위한 MLOps #2: 엣지 파이프라인의 구성

로봇 엣지 디바이스에서 동작하는 MLOps 파이프라인과 TensorRT 기반 추론 도구를 소개했습니다. Trtexec, TREx, Nsight Systems로 변환·시각화·성능 분석을 수행하는 흐름을 정리했습니다.

#MLOps#Airflow#Kubernetes
2300

데브옵스

로봇을 위한 MLOps #1: Edge device와 K3s, Airflow

로봇용 머신러닝 개발에서 재현성과 온프레미스 자원 관리가 왜 중요한지 설명했습니다. K3s와 Airflow로 이를 해결하는 MLOps 구성 방법을 소개했습니다.

#MLOps#K3s#Airflow
2700