연관 키워드 추천
AI
연관 키워드 추천
두줄요약
검색 로그의 동시 출현 패턴을 활용해 연관 키워드 추천 시스템을 구축했습니다. Word2Vec 후보를 로그 기반 필터링으로 보정해 롱테일 키워드까지 살렸습니다.
핵심 내용
- 검색 로그의 동시 검색 패턴과 지역적·맥락적 타당성을 기준으로 연관 키워드 추천 시스템을 설계
- 여행·숙소 도메인의 동의어 파편화, 롱테일 분포, 고유명사 중심 검색 특성을 반영해 적정 기술 선택
- Word2Vec으로 후보를 생성하고 코사인 유사도로 추천 목록을 구성
원인 분석
- 학습 데이터가 충분하지 않을 때 임베딩 초기화 상태가 제대로 보정되지 않아 노이즈 키워드가 섞이는 문제
- 빈도수 기준만으로 필터링하면 롱테일 영역의 중요한 세부 지역·명소를 함께 잃는 문제
해결 방법
- 질의어 분류기와 사전 데이터를 활용한 텍스트 정규화로 동의어를 통합
- Word2Vec 후보 생성 후 실제 로그의 동시 출현 여부를 검증하는 Co-occurrence Filtering 적용
- 모델 추천 결과를 통계적 사실로 재검증해 직관적으로 납득 가능한 키워드만 상위 노출
