
AI
안드로이드에서 온디바이스 AI로 스팸 분류하기
두줄요약
안드로이드에서 DistilKoBERT 기반 스팸 분류 모델을 온디바이스 AI로 구현한 과정을 정리했습니다.\nTFLite 변환과 양자화로 모델 크기와 추론 속도를 개선하고 단말 벤치마크 결과도 확인했습니다.
핵심 내용
- DistilKoBERT로 한국어 스팸 문자 분류 모델을 학습하고, TensorFlow Lite로 변환해 안드로이드 단말에서 온디바이스 추론을 수행한 사례
- 데이터셋 구성, HuggingFace 기반 파인튜닝, AI Edge Torch를 이용한 TFLite 변환, DRQ 양자화 적용 과정을 순서대로 정리
- 양자화로 모델 크기를 약 4배 줄이면서 정확도 저하는 매우 작게 유지
- LiteRT Interpreter와 직접 구현한 토크나이저로 예제 앱에 통합하고, 단말 벤치마크로 속도·메모리 개선 효과를 확인
적용해볼 점
- BERT 계열 경량 모델은 분류형 NLP 태스크의 온디바이스 대안으로 활용 가능
- TFLite 변환과 양자화를 통해 모바일 배포성과 추론 효율을 함께 개선 가능
- 메타데이터 호환성, 토크나이저 차이, 단말별 리소스 제약을 함께 검토할 필요
