모든 태그
태그

ONNX 기술 블로그 글

ONNX 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 4최신 4개 표시
홈에서 필터

최신 게시글

4개 표시

AI

대규모 서비스 환경에서의 이미지 콘텐츠 모더레이션(feat. 멀티모달 LLM)

대규모 서비스의 이미지 콘텐츠 모더레이션을 위해 멀티모달 LLM과 전통적 ML을 결합한 구조를 소개했습니다. 정확도, 지연 시간, 비용, 정책 유연성을 함께 개선하는 최적화 과정을 다뤘습니다.

#LLM#멀티모달#computer vision
4200

데브옵스

효율적 시맨틱 검색을 위한 kubernetes GPU inference 시스템 구축하기

Kubernetes에 GPU 기반 Triton 추론 서버를 구축해 시맨틱 검색을 실시간으로 처리한 사례를 정리했습니다. ONNX 최적화와 배치·모니터링·배포 자동화로 성능과 운영 효율을 높였습니다.

#Kubernetes#GPU#ONNX
5900

AI

AI 명함촬영인식 ‘리오(RIO)’ 적용기 2부 — ML Model Converter와 안드로이드 앱 적용기

리오(RIO) 명함 촬영 인식을 모바일 기기에서 동작시키기 위해 모델 변환과 안드로이드 적용 과정을 정리했습니다. PyTorch를 TF Lite로 옮기고, JNI와 OpenCV로 후처리를 구성한 실험 내용을 공유했습니다.

#ML#Android#TensorFlow Lite
2700

AI

로봇 ML 모델의 경량화 #1: 훈련 후 양자화

실외 자율주행 로봇에서는 서버용 ML 모델을 그대로 쓰기 어려워 경량화가 필요했습니다. 이 글은 PTQ와 TensorRT 기반 최적화, ONNX 변환 흐름을 설명했습니다.

#ML#NVIDIA#TensorRT
3100