Velopers
모든 블로그모든 태그공지주간 인기글

새로운 기술 블로그가 추가되었어요

아임웹

오늘 새 글

0개

오늘 조회수

43회

최근 7일 인기 글AI로 웹 엔지니어 없이 LINE 앱 안에서 그룹 영상 통화 서비스 만들기라인 · 54회최근 30일 활발한 블로그AWS23개 발행 · 총 388개 · 18,937회
필터 1
vLLM의 기술적 혁신과 성능 향상 이야기
데보션
·2025년 4월 28일
AI

vLLM의 기술적 혁신과 성능 향상 이야기

vLLM의 핵심 기술과 성능 최적화 옵션, 그리고 v1 엔진의 구조 개선을 정리했습니다.\n기능 호환성과 운영 단순성을 높이면서 성능을 끌어올린 흐름을 함께 설명했습니다.

#vLLM#LLM
73005분
AI 학습을 위한 LLM 스터디 - 배치 전략 및 어텐션 개선 방안
데보션
·2025년 2월 8일
AI

AI 학습을 위한 LLM 스터디 - 배치 전략 및 어텐션 개선 방안

LLM 추론 효율을 높이기 위한 배치 전략과 어텐션 개선 방법을 정리한 글입니다. FlashAttention, 페이지 어텐션, 추측 디코딩의 개념과 장점을 설명했습니다.

#LLM#batch
28005분

Powered by Velopers

이용약관개인정보처리방침공지사항