셀럽 NOW - 딥러닝 기반의 연예 뉴스 분석 시스템
AI
셀럽 NOW - 딥러닝 기반의 연예 뉴스 분석 시스템
두줄요약
셀럽 NOW는 연예인 이름으로 뉴스 문서를 분석해 고품질 이미지와 최신 이벤트를 제공하는 시스템입니다. 문서 주체 추출, 중복 이미지 제거, 클러스터링, 품질·시간 정렬을 결합해 검색 결과를 개선했습니다.
핵심 내용
- 셀럽 NOW는 연예인 이름을 입력받아 뉴스 이미지 집합을 그리드 또는 타임라인 형태로 제공하는 연예 뉴스 분석 시스템
- 문서 주체 추출, 중복 이미지 제거, 연관 이미지 클러스터링, 이미지 품질 스코어링, 이벤트 시간 추출, 이벤트 카테고리 분류로 구성
- 딥러닝, 자연어 처리, 영상 처리 기술을 함께 적용해 검색 결과의 품질과 사용자 만족도 향상을 목표로 함
구조와 흐름
- 쿼리 문서 탐색 단계에서 뉴스 문서의 주체를 파악해 연예인 역색인으로 연결
- 이미지 임베딩과 클러스터링으로 중복 이미지를 제거하고 유사 이미지를 묶어 제공
- 품질 순 정렬과 이벤트 시간 순 정렬로 그리드 UI와 타임라인 UI를 구성
선택 이유
- 연예인 검색은 고품질 이미지와 최신 소식에 대한 수요가 높아 특화된 탐색·정렬이 필요
- 일반 이미지가 아닌 인물 이미지에 맞는 품질 정의가 필요해 배경 특성을 모델링
- 기사 게재 시간만으로는 실제 이벤트 시점을 반영하기 어려워 본문 내 시간 정보도 함께 활용
성능/운영 포인트
- 비슷한 이미지 반복 노출을 줄여 품질 인상을 개선하고 데이터 양 증가를 억제
- 다양한 임베딩 특성에 맞춰 복수 클러스터링 알고리즘을 적용한 뒤 앙상블
- 향후 얼굴 인식, 동명이인 처리, 문화·스포츠 확장 가능성 제시
