AI 아티클 - Velopers

새로운 기술 블로그가 추가되었어요

아임웹

필터 0

선택된 필터 없음

2025년 2월 12일

vLLM로 효율적인 모델 서빙하기

vLLM을 활용한 LLM 서빙 최적화 방법을 배치 전략, 어텐션 최적화, 추론 전략으로 나눠 설명했습니다. 온라인 서빙과 오프라인 서빙의 차이와 간단한 구현 예시도 함께 소개했습니다.

#vLLM#LLM

86005분

무신사 X GitHub Copilot은 정말로 우리의 생산성을 높였을까?

2025년 2월 11일

무신사 X GitHub Copilot은 정말로 우리의 생산성을 높였을까?

무신사는 GitHub Copilot의 생산성 효과를 30명 규모의 데이터와 설문으로 검증했습니다. 일부 지표는 개선됐지만 코드 품질 관리와 가이드라인의 중요성도 확인했습니다.

#GitHub Copilot#GitHub

175005분

2025년 2월 11일

손글씨에 강한 Google Cloud Vision AI 사용법 총정리

Google Cloud Vision API로 OCR을 수행하는 방법을 정리했습니다. API Key 방식과 서비스 계정 인증 방식을 비교하며 Colab에서의 사용법을 소개했습니다.

#Google Cloud Vision API#OCR

111005분

2025년 2월 11일

산업 현장에서 작동하는 AI 에이전트 구현하기

산업 현장에 맞는 Vertical AI 에이전트 구현 방식과 설계 원칙을 소개했습니다. Agent Flow와 Autonomous Agent를 조합해 예측 가능한 문제와 예외 상황을 함께 다뤘습니다.

#LLM#API

16005분

2025년 2월 8일

AI 학습을 위한 LLM 스터디 - 배치 전략 및 어텐션 개선 방안

LLM 추론 효율을 높이기 위한 배치 전략과 어텐션 개선 방법을 정리한 글입니다. FlashAttention, 페이지 어텐션, 추측 디코딩의 개념과 장점을 설명했습니다.

#LLM#batch

27005분

2025년 2월 7일

모두를 위한 LLM 애플리케이션 개발 환경 구축 사례

LLM 애플리케이션을 직군에 상관없이 쉽게 만들고 배포할 수 있는 환경 구축 사례를 소개했습니다. Prompt Store, Langflow, 자동 배포 구조로 개발과 피드백 주기를 단축했습니다.

#LLM#Langflow

39005분

2025년 2월 6일

RAG를 활용한 검색 서비스 만들기

동네생활 게시글과 댓글에서 업체 추천 정보를 찾아 RAG 기반 검색 서비스로 연결했습니다.\n벡터 검색, LLM 요약, 적절성 필터링을 거쳐 신뢰도 높은 추천 결과를 제공했습니다.

#RAG#검색

232005분

2025년 2월 6일

코파일럿 “열일”하게 만드는 방법

깃허브 코파일럿의 기본 기능과 VSCode에서의 활용법을 정리했습니다. 컨텍스트를 충분히 주고 슬래시 명령어와 챗 변수를 쓰면 더 유용하게 사용할 수 있습니다.

#GitHub Copilot#VSCode

45005분

2025년 2월 3일

실험으로 알아보는 LLM 파인튜닝 최적화 가이드 Part 1.

LLM 파인튜닝에서 배치 크기, 시퀀스 길이, 메모리 최적화 기법의 영향을 실험 기반으로 정리했습니다.\nGPU 제약과 데이터 특성에 맞춰 직접 실험하며 최적값을 찾는 접근을 강조했습니다.

#LLM#파인튜닝

32005분

2025년 1월 31일

로봇 ML 모델의 경량화 2부: 양자화 인식 훈련

PTQ의 성능 저하 한계를 보완하기 위한 QAT 개념과 원리를 설명했습니다.\nNVIDIA pytorch-quantization으로 QAT를 수행하고 ONNX/TensorRT로 변환하는 절차를 소개했습니다.

#ML#양자화

21005분

2025년 1월 24일

페이증권의 업무도우미 AI봇을 소개합니다! 근데 이제 춘식이를 곁들인

아마존 베드락을 활용해 사내 지식저장소를 구축하고 AI챗봇과 코드리뷰봇을 개발한 경험을 공유했습니다. 업무도우미 AI봇에 춘식이 요소를 더한 소개 글입니다.

#LLM#AWS

27005분

MoA(Mixture-of-Agents, 에이전트 혼합 기법), LLM 성능을 향상시키기 위한 새로운 기법

2025년 1월 22일

MoA(Mixture-of-Agents, 에이전트 혼합 기법), LLM 성능을 향상시키기 위한 새로운 기법

여러 LLM의 응답을 계층적으로 결합해 최종 답변 품질을 높이는 MoA 기법을 소개했습니다. 기존 모델을 바꾸지 않고도 성능과 비용 효율성을 동시에 개선할 수 있음을 설명했습니다.

#LLM#prompt

22005분