

DeepSeek-R1 기술 분석
DeepSeek-R1의 구조와 학습 방식, GRPO와 지식 증류의 특징을 OpenAI o1과 비교해 정리했습니다. 비용 절감과 추론 성능 강점, 한국어 적용 시 주의점도 함께 살펴봤습니다.


DeepSeek-R1의 구조와 학습 방식, GRPO와 지식 증류의 특징을 OpenAI o1과 비교해 정리했습니다. 비용 절감과 추론 성능 강점, 한국어 적용 시 주의점도 함께 살펴봤습니다.

PyTorch 2.x의 핵심 기능인 Torch Compile을 소개하는 글입니다. 딥러닝 성능을 높이는 관점에서 PyTorch 2.0의 변화 포인트를 다뤘습니다.

AWS ParallelCluster를 Slurm 기준으로 생성하고 작업을 제출하는 절차를 소개했습니다. CLI 설정, 클러스터 접속, 삭제까지의 기본 흐름을 정리했습니다.


배달의민족은 GPT와 RAG를 활용해 상품 카탈로그 속성값 생성 자동화를 시도했습니다. 평가 모델을 보완해 작업 효율을 높이고 정확도도 개선했습니다.

인도 디지털 대출 시장의 성장 배경과 핵심 동인을 정리했습니다. 부실 대출 리스크와 규제 변화 속에서도 투자 기회가 크다고 보았습니다.

밸런스히어로가 국제 금융 데이터 사이언스 대회에서 2위를 수상했습니다. 대안신용평가시스템(ACS)의 기술력과 다른 지역으로의 확장 가능성을 입증했습니다.

X


DeepSeek-R1의 강화 학습 기반 추론 향상 방식과 지식 증류 전략을 정리했습니다. 또한 API 활용, 소형 모델 성능, 향후 개선 과제까지 함께 살펴봤습니다.


GPU 메모리 사용을 줄이기 위한 그레이디언트 누적, 체크포인팅, ZeRO, LoRA, QLoRA를 정리했습니다. 각 기법이 절감하는 메모리 영역과 적용 효과를 예시와 함께 설명했습니다.

동네생활 게시글과 댓글에서 업체 추천 정보를 찾아 RAG 기반 검색 서비스로 연결했습니다.\n벡터 검색, LLM 요약, 적절성 필터링을 거쳐 신뢰도 높은 추천 결과를 제공했습니다.


PTQ의 성능 저하 한계를 보완하기 위한 QAT 개념과 원리를 설명했습니다.\nNVIDIA pytorch-quantization으로 QAT를 수행하고 ONNX/TensorRT로 변환하는 절차를 소개했습니다.


CXL의 개념과 PCIe 기반 동작, 메모리 풀링·캐시 일관성 같은 특징을 정리했습니다. AI 연산 시스템과 데이터센터에서 메모리 확장성과 효율을 높이는 활용 가능성도 소개했습니다.