VLM을 쓰지 않은 이유: Geometric Prior로 25배 빠른 의류 디테일컷 자동화
중고 의류 디테일컷 자동 생성을 위해 VLM 대신 Detector와 규칙 기반 크롭을 선택했습니다.\n그 결과 공정 시간을 90% 줄이고 11만 개 상품에 일괄 적용했습니다.
중고 의류 디테일컷 자동 생성을 위해 VLM 대신 Detector와 규칙 기반 크롭을 선택했습니다.\n그 결과 공정 시간을 90% 줄이고 11만 개 상품에 일괄 적용했습니다.


Slurm의 내부 구조와 Job 처리 흐름을 중심으로 HPC 스케줄러 활용법을 정리했습니다. 대화형·배치·배열 작업과 QOS, Fairshare, 선점, 의존성 연결까지 실무 패턴을 설명했습니다.


업스테이지 컨소시엄이 정부 독자 AI 모델 1차수 평가를 통과한 과정을 소개했습니다. 래블업과의 협업으로 인프라를 최적화하고 학습 효율과 장애 대응을 크게 개선했습니다.

LINE DEV AI 리포터즈가 조직 내 AI 활용 경험을 모아 공유하고 전파한 과정을 소개했습니다. 개인의 실험을 실무와 조직 문화로 확장한 사례를 정리했습니다.


업스테이지와 래블업이 독자 AI 파운데이션 모델 1차수 평가 통과 과정을 공유했습니다. 대규모 GPU 인프라 운영과 학습 최적화, 자동 복구 체계가 핵심이었습니다.


Attention 메커니즘의 개념과 필요성을 설명하고, Q/K/V 기반 작동 흐름을 정리했습니다. 또한 PyTorch와 TensorFlow 예제로 실제 구현 방법을 보여주었습니다.


Qwen3의 Hybrid Thinking mode를 소개하고, 추론 On/Off를 제어하는 두 가지 방식을 설명했습니다. `/think`·`/no_think`와 `enable_thinking`의 동작 차이도 정리했습니다.


UV를 PIP 대체 도구로 소개하며 설치와 기본 사용법, 주요 명령어를 정리했습니다. 가상환경 자동화와 빠른 성능, 의존성 및 Python 버전 관리 기능을 함께 설명했습니다.


데이터셋 로딩 중 발생한 CUDA OOM의 원인을 `all_gather_object` 내부 동작에서 찾았습니다. 데이터를 chunk로 나눠 gather하도록 바꿔 GPU 메모리 사용량을 줄였습니다.


안드로이드에서 DistilKoBERT 기반 스팸 분류 모델을 온디바이스 AI로 구현한 과정을 정리했습니다.\nTFLite 변환과 양자화로 모델 크기와 추론 속도를 개선하고 단말 벤치마크 결과도 확인했습니다.


S1의 Test-Time Scaling과 Budget Forcing으로 추론 모델을 구현하는 과정을 소개했습니다. 적은 데이터와 반복 자기검증만으로도 사고 성능을 끌어올리는 방법을 살펴보았습니다.

PyTorch 2.x의 핵심 기능인 Torch Compile을 소개하는 글입니다. 딥러닝 성능을 높이는 관점에서 PyTorch 2.0의 변화 포인트를 다뤘습니다.