
RAG 기반 AI 서비스의 신뢰성을 확보하는 방법: 자동화 평가 체계 및 운영 최적화
RAG 서비스의 신뢰성을 높이기 위해 RAGAS와 LLM-as-a-Judge 기반 자동 평가 체계를 소개했습니다. 또한 시맨틱 캐싱과 가드레일을 활용한 운영 최적화 방안도 함께 제시했습니다.
새로운 기술 블로그가 추가되었어요

RAG 서비스의 신뢰성을 높이기 위해 RAGAS와 LLM-as-a-Judge 기반 자동 평가 체계를 소개했습니다. 또한 시맨틱 캐싱과 가드레일을 활용한 운영 최적화 방안도 함께 제시했습니다.
왓챠의 브랜드 태도를 오프라인 영화 주간 행사로 번역한 사례를 소개했습니다. 관객이 스스로 취향을 발견하고 참여하도록 공간과 동선을 설계한 점이 핵심입니다.
드림어스컴퍼니의 신사옥 이전과 공간 구성을 소개했습니다.일과 소통, 휴식을 아우르는 새로운 업무 환경과 이전 기념 이벤트를 전했습니다.


분산 트레이닝에서 GPU 간 통신 오버헤드가 큰 병목이므로 인터커넥트 선택이 중요하다고 설명했습니다. AWS는 클라우드 환경의 멀티테넌시와 운영 효율성 때문에 EFA를 선택했다고 정리했습니다.

도메인에 의존하지 않는 채팅 플랫폼 MessagingHub의 설계와 연동 구조를 소개했습니다. 웹 기반 공통 클라이언트와 정책 분리로 확장성과 이식성을 높였습니다.

토스가 lodash 대체용 JavaScript 유틸리티 라이브러리 es-toolkit을 소개했습니다.\nES Modules와 TypeScript 기반 재설계로 번들 크기와 성능을 크게 개선했습니다.


기술 문서의 주요 독자가 AI로 바뀌며, 인용되기 쉬운 문서 구조와 배포 조건이 중요해졌습니다. 각 섹션의 독립성, 구체성, 출처 명시, AI 크롤러 접근성과 인용 측정이 핵심입니다.


AWS와 NVIDIA가 자율주행 3.0을 위한 End-to-End Physical AI 데이터 파이프라인을 소개했습니다. 센서 수집부터 큐레이션, 복원, 학습, 시뮬레이션 검증까지의 반복 루프를 정리했습니다.

GitOps 환경의 시크릿 보안 문제를 해결하기 위해 Vault 기반 거버넌스를 소개했습니다. 또한 ESO와 CSI Provider의 역할과 선택 기준, 운영 전략을 정리했습니다.


TwelveLabs Marengo와 AWS 서비스를 결합해 VoD 영상 분석 파이프라인을 구성하는 방법을 설명했습니다. 업로드 즉시 처리, 배치, 대규모 병렬 처리에 맞는 아키텍처 선택 기준도 정리했습니다.

LINE Ads의 대규모 광고 데이터를 처리하기 위해 Spark on Kubernetes를 도입한 사례입니다. 성능 향상, 비용 절감, 버전 유연성을 함께 확보했습니다.

피지컬 AI를 현장 데이터와 업데이트로 다듬는 운영형 AI로 설명했습니다. AIDC는 GPU뿐 아니라 검증 체계, 스토리지, 전력·냉각까지 함께 설계해야 한다고 정리했습니다.