태그

quantization 기술 블로그 글

quantization 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 4개최신 4개 표시

금융 보안 퀴즈, AI에게 풀게 해봤습니다: 2025 금융 AI Challenge 우수상 후기

금융보안 AI 경진대회에서 24GB 단일 GPU 제약 아래 LLM 파이프라인을 설계하고 우수상을 수상한 과정을 정리했습니다.\n모델 선정부터 CPT, RAG, 양자화, 출력 제어까지의 선택 이유와 성능 개선 결과를 공유했습니다.

2026년 3월 16일

GPT-4o-mini 번역의 오역과 운영 리스크를 줄이기 위해 TranslateGemma를 온프레미스 대안으로 실험했습니다. 한국어 리뷰 번역 비교에서 용어 보존과 자연스러움이 더 나은 결과를 확인했습니다.

2025년 9월 8일

GPT 기반 LLM의 추론 최적화와 양자화 개념을 설명했습니다. DeepSeek의 Latent Vector 기반 방식으로 KV Cache 메모리를 줄이는 사례도 다뤘습니다.

2024년 8월 22일

실외 자율주행 로봇에서는 서버용 ML 모델을 그대로 쓰기 어려워 경량화가 필요했습니다. 이 글은 PTQ와 TensorRT 기반 최적화, ONNX 변환 흐름을 설명했습니다.