AI

SHAP

데이블

데이블2024년 5월 6일

두줄요약

SHAP의 기반인 Shapley Value를 예시와 수식으로 풀어 설명했습니다. 모델 예측을 특징별 기여도로 나누는 원리와 계산 시 주의점도 정리했습니다.

핵심 내용

SHAP의 기반인 Shapley Value를 공정한 공헌도 분배 문제로 설명
전체 순열에서 한 참여자의 한계 기여를 평균해 공헌도를 구하는 원리 정리
SHAP을 모델 입력 특징의 기여도로 대응해 해석하는 방식 제시

구조와 흐름

모든 특징을 순열로 배치하며 앞선 특징 집합 대비 출력 변화량을 공헌도로 계산
무입력 상태의 기준값과 각 특징의 기여값으로 모델 출력을 분해하는 관점 정리
배경 데이터, 마스커, permutation explainer를 통한 실무 계산 흐름 설명

주의할 점

순열 완전 계산은 조합 폭증으로 현실적으로 어려워 샘플링 추정이 필요
조건부 비입력값 구성은 데이터 희소성 때문에 비현실적 입력을 만들 수 있음
상관이 큰 특징이나 고차원 임베딩은 묶어서 계산하는 편이 효율적

적용해볼 점

Tabular 데이터에서는 Permutation Explainer와 Background Dataset 구성을 함께 검토
특정 특징 비입력 처리는 Custom Masker로 조정
구조를 아는 모델이면 model-agnostic 방식보다 구조 활용 방법을 우선 검토

댓글 0개

댓글을 작성하려면 로그인이 필요합니다.

댓글을 불러오는 중...