
AI
고등학생도 이해하는 Transformer (Deep Learning) #5
두줄요약
벡터 내적과 Linear Layer를 MNIST 분류 예제로 풀어 설명했습니다. 학습이 진행되며 가중치가 숫자 이미지와 닮아가는 과정을 통해 원리를 이해하도록 돕습니다.
핵심 내용
- Transformer 이해를 위한 기초로 벡터의 내적과 Linear Layer의 동작 원리 설명
- MNIST 손글씨 분류 예제로 입력 벡터와 가중치 행렬의 내적이 분류 점수로 이어지는 과정 정리
- 학습이 진행되며 가중치가 정답 이미지와 유사한 형태로 변하는 흐름 관찰
- Linear Layer가 여러 이름으로 불리며 딥러닝에서 널리 쓰이는 기본 모듈임을 강조
적용해볼 점
- 이미지 데이터를 1차원 벡터로 펼쳐 간단한 분류기부터 실습해보기
- 내적과 가중치 행렬의 관계를 이해하며 모델 출력의 의미를 해석해보기
- 학습 후 가중치 시각화로 모델이 무엇을 학습했는지 확인해보기
