데보션2024년 9월 11일AILLM 모델이 LLM 성능을 평가한다. LLM-as-a-judge 알아보기LLM이 다른 LLM의 응답 품질을 평가하는 LLM-as-a-Judge 방법을 소개했습니다. 프롬프트를 단순화하고 평가 이유를 요구하면 인간 평가와의 일치도가 크게 높아졌습니다.#LLM#prompt#평가2200