
10
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 GloZ가 Amazon OpenSearch Service와 Amazon Bedrock을 활용해 자연어 기반 이력서 검색 시스템의 데이터 파이프라인과 인덱싱 설계를 설명하는 내용입니다.
핵심 요약
- OpenSearch로 BM25와 k-NN 벡터 검색을 단일 엔진에서 하이브리드 처리
- Amazon Bedrock(Cohere 임베딩, Claude Haiku 4.5)로 메타데이터 구조화·임베딩 생성 파이프라인 구성
- Nori 형태소 분석기로 한국어 복합어·조사 처리 강화
- 다단계 파싱(PDF·DOCX·이미지별 도구 + LLM fallback)로 비용과 처리율 최적화
- 요약 + 메타데이터 키워드 평탄화 입력 전략으로 임베딩 품질 및 nDCG@10 개선 확인
- HNSW+L2 knn_vector와 default_pipeline 기반 Ingest 파이프라인으로 자동 임베딩 및 일관된 메타데이터 정규화(별칭, 퍼지 매칭, 환각 검증)

