데보션·2024년 10월 8일AILong context LLM : 2부 RoPE Extension MethodRoPE 기반 LLM의 context length를 늘리는 Position Interpolation 방법을 소개했습니다. 제한 범위를 넘어갈 때의 attention score 폭발을 줄이고, 적은 finetuning으로 성능을 유지한 결과를 다뤘습니다.#LLM#Transformer15005분