
[활용가이드] kt cloud AI RAG(검색 증강 생성) 활용법 – 컨텍스트 최적화로 성능 높이기
RAG 서비스에서는 프롬프트보다 컨텍스트 품질이 답변 성능을 더 크게 좌우했습니다.\nTopK 조정과 rerank, 버전 필터링, 질문 기반 압축으로 근거 밀도를 높이는 방법을 정리했습니다.

RAG 서비스에서는 프롬프트보다 컨텍스트 품질이 답변 성능을 더 크게 좌우했습니다.\nTopK 조정과 rerank, 버전 필터링, 질문 기반 압축으로 근거 밀도를 높이는 방법을 정리했습니다.


AWS와 NVIDIA가 자율주행 3.0을 위한 End-to-End Physical AI 데이터 파이프라인을 소개했습니다. 센서 수집부터 큐레이션, 복원, 학습, 시뮬레이션 검증까지의 반복 루프를 정리했습니다.


TwelveLabs Marengo 3.0의 멀티모달 비디오 검색 전략을 정리했습니다. 고정 가중치, 순위 기반 융합, 의도 기반 라우팅의 차이와 트레이드오프를 설명했습니다.


Strands Agents SDK로 TwelveLabs와 AWS 서비스를 결합한 에이전틱 비디오 엔진 구현 방식을 소개했습니다. 단일 에이전트와 멀티 에이전트 구조로 영상 검색, 요약, 자막 처리 흐름을 구성했습니다.
불편한 일을 직접 해결한 사이드 프로젝트 경험으로 프로덕트 엔지니어의 본질을 풀어냈습니다. 공개와 운영을 통해 배포, 테스트, 보안, 협업의 감각을 키우는 흐름을 공유했습니다.

라포랩스 Server Engineer들이 치열한 논의와 책임 있는 실행을 바탕으로 일하는 방식을 소개했습니다. 또한 AI 활용, 피드백 문화, 성장 기회와 과제까지 조직의 밀도를 보여주었습니다.

대규모 코드베이스를 자연어로 검색할 수 있게 만든 RAG 기반 코드 지식화 플랫폼 AskON을 소개했습니다. 정적 분석, 호출 그래프, 임베딩, 증분 인덱싱으로 코드 검색과 답변 품질을 높인 사례입니다.

엔터프라이즈 LLM 서비스에서 파인 튜닝, 청킹, 복잡한 워크플로를 덜어내고 단순한 구조를 선택한 사례를 다뤘습니다. 문서 참조, 검색 후 자르기, ReAct 조합으로 응답률을 높인 운영 경험을 공유했습니다.

네트워크 없이 모바일 기기에서 동작하는 메신저용 이미지 이해 기능을 만들고 지식 증류로 다국어 검색을 구현했습니다. 또한 LiteRT 변환과 벡터 DB 튜닝으로 온디바이스 배포와 실사용 성능을 맞췄습니다.

내부 백오피스 검색 지연 문제를 고객 사용 방식 인터뷰로 먼저 확인했습니다. IndexedDAO를 도입해 인덱스 히트를 보장하고 8초 쿼리를 200ms대로 개선했습니다.

biz-crm 대용량 검색 지연 문제를 사용자 인터뷰로 원인부터 재점검했습니다. 범용 필터를 줄이고 IndexedDAO를 도입해 인덱스 기반 조회로 개선했습니다.
MCP를 활용해 여행 상품 조회 툴을 AI와 연결하는 PoC를 구현하고 검증했습니다.\n카테고리 탐색부터 예약 가능 여부 확인까지 대화형 여행 설계 가능성을 확인했습니다.