ICML 2020 논문 소개 - 딥러닝 이론 연구

AI

ICML 2020 논문 소개 - 딥러닝 이론 연구

이스트소프트

이스트소프트2020년 9월 6일

두줄요약

ICML 2020 논문으로 범주형 확률에 베이지안 관점을 적용한 분류 학습 방법을 소개했습니다. 오버 컨피던스를 줄이고 예측 불확실성을 더 잘 표현하며 분류 성능도 향상시켰습니다.

핵심 내용

ICML 2020 논문 ‘Being Bayesian about Categorical Probability’ 소개
분류 문제에서 오답에 대한 과한 확신, 즉 오버 컨피던스 완화 목표
범주형 확률을 확률변수로 두고 디리클레 분포 기반 belief matching framework 적용

구조와 흐름

라벨 생성 시 베이지안 관점 도입과 사전분포 스무딩으로 극단적 one-hot 타깃 완화
신경망이 예측한 디리클레 분포와 타깃 분포의 KL divergence를 ELBO로 최소화

성능/운영 포인트

이미지 분류 벤치마크에서 softmax cross-entropy 대비 성능 향상
confidence와 accuracy 정합성 개선 및 ECE 향상
out-of-distribution 샘플에서 높은 불확실성 표현

적용해볼 점

분류 모델의 과신 완화와 불확실성 추정이 필요한 문제에 활용 가능
큰 모델과 대규모 데이터셋에도 확장 가능성 확인

댓글 0개

댓글을 작성하려면 로그인이 필요합니다.

댓글을 불러오는 중...