
AI
토스가 다양한 ML 모델을 만드는 법: Feature Store & Trainkit
두줄요약
토스가 Feature Store와 Trainkit으로 ML 학습·서빙 파이프라인을 표준화한 사례를 소개했습니다. 재사용성, 재현성, skew 해소를 통해 운영 효율을 높인 점이 핵심입니다.
핵심 내용
- 토스의 ML 플랫폼에서 Feature Store와 학습 자동화 도구 Trainkit을 자체 구축한 배경과 구조 소개
- Feature Store로 Feature 재사용, 품질 모니터링, 권한 관리, 학습-서빙 일관성 확보
- Trainkit으로 데이터 로딩, 전처리, 조인, PIT 처리, 시간 파티션 이동을 표준화해 학습 파이프라인 정형화
- 멀티 Feature Package 조인과 런타임 조인 방식을 통해 확장성과 메모리 효율성 개선
적용해볼 점
- ML 서비스 전 생애주기를 자동화하는 플랫폼 관점의 설계 필요성
- 학습과 서빙의 Feature 정의를 통합해 skew와 누수 방지
- 반복되는 전처리와 조인 로직을 공통 컴포넌트로 추상화해 재사용성 강화