데보션·2025년 4월 28일AIvLLM의 기술적 혁신과 성능 향상 이야기vLLM의 핵심 기술과 성능 최적화 옵션, 그리고 v1 엔진의 구조 개선을 정리했습니다.\n기능 호환성과 운영 단순성을 높이면서 성능을 끌어올린 흐름을 함께 설명했습니다.#vLLM#LLM73005분
데보션·2025년 2월 8일AIAI 학습을 위한 LLM 스터디 - 배치 전략 및 어텐션 개선 방안LLM 추론 효율을 높이기 위한 배치 전략과 어텐션 개선 방법을 정리한 글입니다. FlashAttention, 페이지 어텐션, 추측 디코딩의 개념과 장점을 설명했습니다.#LLM#batch28005분