
[활용가이드] kt cloud AI RAG(검색 증강 생성) 활용법 – 컨텍스트 최적화로 성능 높이기
RAG 서비스에서는 프롬프트보다 컨텍스트 품질이 답변 성능을 더 크게 좌우했습니다.\nTopK 조정과 rerank, 버전 필터링, 질문 기반 압축으로 근거 밀도를 높이는 방법을 정리했습니다.

RAG 서비스에서는 프롬프트보다 컨텍스트 품질이 답변 성능을 더 크게 좌우했습니다.\nTopK 조정과 rerank, 버전 필터링, 질문 기반 압축으로 근거 밀도를 높이는 방법을 정리했습니다.


야놀자가 Bedrock AgentCore와 Strands SDK로 AIOps 멀티 에이전트를 구축한 사례를 소개했습니다. 반복 운영 업무를 자동화해 수동 업무 시간과 MTTR을 줄이고 조직 내 AI 역량을 내재화했습니다.


OWASP의 LLM Top 10과 Agentic Top 10을 바탕으로 GenAI 보안 점검용 100개 체크리스트를 정리했습니다. 프롬프트, 데이터, 에이전트, 인프라까지 계층별 대응과 AWS 적용 시 주의사항을 함께 제시했습니다.

RAG 서비스의 신뢰성을 높이기 위해 RAGAS와 LLM-as-a-Judge 기반 자동 평가 체계를 소개했습니다. 또한 시맨틱 캐싱과 가드레일을 활용한 운영 최적화 방안도 함께 제시했습니다.


Amazon Neptune GraphRAG Toolkit으로 비정형 문서를 그래프와 벡터에 함께 인덱싱하는 방법을 소개했습니다. 그래프 탐색을 더해 유사성 검색의 한계를 보완하고 더 입체적인 답변을 만드는 흐름을 설명했습니다.

RAG에서 임베딩과 벡터 인덱싱의 원리, 모델 선정 기준, 최적화 기법을 정리했습니다. 특히 한국어 환경에서는 다국어 적합성과 메모리 비용을 함께 검증해야 한다고 설명했습니다.

대규모 코드베이스를 자연어로 검색할 수 있게 만든 RAG 기반 코드 지식화 플랫폼 AskON을 소개했습니다. 정적 분석, 호출 그래프, 임베딩, 증분 인덱싱으로 코드 검색과 답변 품질을 높인 사례입니다.

금융보안 AI 경진대회에서 24GB 단일 GPU 제약 아래 LLM 파이프라인을 설계하고 우수상을 수상한 과정을 정리했습니다.\n모델 선정부터 CPT, RAG, 양자화, 출력 제어까지의 선택 이유와 성능 개선 결과를 공유했습니다.

RAG의 필요성과 동작 원리를 설명하고, 교육 운영 시스템에 적용한 구현 사례를 정리했습니다. 6단계 구현 가이드와 색인·검색 설계 포인트도 함께 소개했습니다.

NeurIPS 2025에서 다뤄진 AI 가드레일 연구 흐름을 정책 코드화, 멀티모달 안전성, 프롬프트 인젝션 방어 관점에서 정리했습니다. 실서비스에서 안전성과 사용성을 함께 만족시키는 방향으로 가드레일이 진화하고 있음을 설명했습니다.

엔터프라이즈 LLM 서비스에서 파인 튜닝, 청킹, 복잡한 워크플로를 덜어내고 단순한 구조를 선택한 사례를 다뤘습니다. 문서 참조, 검색 후 자르기, ReAct 조합으로 응답률을 높인 운영 경험을 공유했습니다.

업무를 수행하는 AI 에이전트의 보안 아키텍처를 AWS 기준으로 정리했습니다. 네트워크 격리, 권한 통제, 사람 승인, 감사 추적을 결합해 안전성을 높이는 방법을 설명했습니다.