필터 1
[활용가이드] kt cloud AI RAG(검색 증강 생성) 활용법 – 컨텍스트 최적화로 성능 높이기
KT 클라우드
· 2026년 4월 10일
AI

[활용가이드] kt cloud AI RAG(검색 증강 생성) 활용법 – 컨텍스트 최적화로 성능 높이기

RAG 서비스에서는 프롬프트보다 컨텍스트 품질이 답변 성능을 더 크게 좌우했습니다.\nTopK 조정과 rerank, 버전 필터링, 질문 기반 압축으로 근거 밀도를 높이는 방법을 정리했습니다.

#RAG#LLM
59005분
야놀자의 Strands SDK와 Bedrock AgentCore를 활용한 AIOps Agent 구축 사례
AWS
· 2026년 4월 9일
AI

야놀자의 Strands SDK와 Bedrock AgentCore를 활용한 AIOps Agent 구축 사례

야놀자가 Bedrock AgentCore와 Strands SDK로 AIOps 멀티 에이전트를 구축한 사례를 소개했습니다. 반복 운영 업무를 자동화해 수동 업무 시간과 MTTR을 줄이고 조직 내 AI 역량을 내재화했습니다.

#AWS#LLM
57005분
OWASP 기반 GenAI 보안 실무 점검 가이드
AWS
· 2026년 4월 1일
AI

OWASP 기반 GenAI 보안 실무 점검 가이드

OWASP의 LLM Top 10과 Agentic Top 10을 바탕으로 GenAI 보안 점검용 100개 체크리스트를 정리했습니다. 프롬프트, 데이터, 에이전트, 인프라까지 계층별 대응과 AWS 적용 시 주의사항을 함께 제시했습니다.

#OWASP#LLM
25005분
RAG 기반 AI 서비스의 신뢰성을 확보하는 방법: 자동화 평가 체계 및 운영 최적화
교보DTS
· 2026년 4월 1일
AI

RAG 기반 AI 서비스의 신뢰성을 확보하는 방법: 자동화 평가 체계 및 운영 최적화

RAG 서비스의 신뢰성을 높이기 위해 RAGAS와 LLM-as-a-Judge 기반 자동 평가 체계를 소개했습니다. 또한 시맨틱 캐싱과 가드레일을 활용한 운영 최적화 방안도 함께 제시했습니다.

#RAG#LLMOps
55005분
Neptune GraphRAG Toolkit을 활용하여 정교한 비정형 데이터 검색하기
AWS
· 2026년 3월 31일
AI

Neptune GraphRAG Toolkit을 활용하여 정교한 비정형 데이터 검색하기

Amazon Neptune GraphRAG Toolkit으로 비정형 문서를 그래프와 벡터에 함께 인덱싱하는 방법을 소개했습니다. 그래프 탐색을 더해 유사성 검색의 한계를 보완하고 더 입체적인 답변을 만드는 흐름을 설명했습니다.

#GraphRAG#RAG
39005분
[Tech Series] kt cloud AI 검색 증강 생성(RAG) #4 : 임베딩(Embedding)과 벡터 인덱싱 기술
KT 클라우드
· 2026년 3월 23일
AI

[Tech Series] kt cloud AI 검색 증강 생성(RAG) #4 : 임베딩(Embedding)과 벡터 인덱싱 기술

RAG에서 임베딩과 벡터 인덱싱의 원리, 모델 선정 기준, 최적화 기법을 정리했습니다. 특히 한국어 환경에서는 다국어 적합성과 메모리 비용을 함께 검증해야 한다고 설명했습니다.

#RAG#임베딩
78005분
AskON: 코드를 검색 가능한 지식으로
롯데ON
· 2026년 3월 23일
AI

AskON: 코드를 검색 가능한 지식으로

대규모 코드베이스를 자연어로 검색할 수 있게 만든 RAG 기반 코드 지식화 플랫폼 AskON을 소개했습니다. 정적 분석, 호출 그래프, 임베딩, 증분 인덱싱으로 코드 검색과 답변 품질을 높인 사례입니다.

#RAG#검색
50005분
금융 보안 퀴즈, AI에게 풀게 해봤습니다: 2025 금융 AI Challenge 우수상 후기
카카오뱅크
· 2026년 3월 18일
AI

금융 보안 퀴즈, AI에게 풀게 해봤습니다: 2025 금융 AI Challenge 우수상 후기

금융보안 AI 경진대회에서 24GB 단일 GPU 제약 아래 LLM 파이프라인을 설계하고 우수상을 수상한 과정을 정리했습니다.\n모델 선정부터 CPT, RAG, 양자화, 출력 제어까지의 선택 이유와 성능 개선 결과를 공유했습니다.

#LLM#RAG
70005분
RAG, 들어는 봤는데… 내 서비스엔 어떻게 쓰지?
우아한 형제들
· 2026년 3월 10일
AI

RAG, 들어는 봤는데… 내 서비스엔 어떻게 쓰지?

RAG의 필요성과 동작 원리를 설명하고, 교육 운영 시스템에 적용한 구현 사례를 정리했습니다. 6단계 구현 가이드와 색인·검색 설계 포인트도 함께 소개했습니다.

#RAG#LLM
256005분
완벽한 AI 가드레일을 향한 여정: NeurIPS 2025 최신 안전성 기술 분석
라인
· 2026년 3월 10일
AI

완벽한 AI 가드레일을 향한 여정: NeurIPS 2025 최신 안전성 기술 분석

NeurIPS 2025에서 다뤄진 AI 가드레일 연구 흐름을 정책 코드화, 멀티모달 안전성, 프롬프트 인젝션 방어 관점에서 정리했습니다. 실서비스에서 안전성과 사용성을 함께 만족시키는 방향으로 가드레일이 진화하고 있음을 설명했습니다.

#LLM#VLM
75005분
엔터프라이즈 LLM 서비스 구축기 2: 에이전트 엔지니어링
라인
· 2026년 3월 9일
AI

엔터프라이즈 LLM 서비스 구축기 2: 에이전트 엔지니어링

엔터프라이즈 LLM 서비스에서 파인 튜닝, 청킹, 복잡한 워크플로를 덜어내고 단순한 구조를 선택한 사례를 다뤘습니다. 문서 참조, 검색 후 자르기, ReAct 조합으로 응답률을 높인 운영 경험을 공유했습니다.

#LLM#RAG
104005분
[Deep Dive] 고도화된 AI 에이전트 아키텍처: Zero Trust와 Human-in-the-Loop의 결합
교보DTS
· 2026년 2월 26일
AI

[Deep Dive] 고도화된 AI 에이전트 아키텍처: Zero Trust와 Human-in-the-Loop의 결합

업무를 수행하는 AI 에이전트의 보안 아키텍처를 AWS 기준으로 정리했습니다. 네트워크 격리, 권한 통제, 사람 승인, 감사 추적을 결합해 안전성을 높이는 방법을 설명했습니다.

#AWS#LLM
60005분