
Chat DIC 프로젝트에서 AWS Bedrock Prompt Caching으로 성능 최적화하기
AWS Bedrock Prompt Caching으로 Chat DIC의 반복 프롬프트 재계산을 줄이고 응답 지연과 Throttling을 개선했습니다. 또한 system과 tools 문맥을 캐싱해 평균 응답 시간을 단축하고 비용도 절감했습니다.
새로운 기술 블로그가 추가되었어요

AWS Bedrock Prompt Caching으로 Chat DIC의 반복 프롬프트 재계산을 줄이고 응답 지연과 Throttling을 개선했습니다. 또한 system과 tools 문맥을 캐싱해 평균 응답 시간을 단축하고 비용도 절감했습니다.


AI 모델 개발에서 GPU를 효율적으로 쓰기 위한 HPC의 필요성과 기본 구성요소를 설명했습니다. Slurm, 공유 스토리지, 컨테이너를 통해 대규모 학습 환경을 일관되게 운영하는 방법을 소개했습니다.


RAG 시스템에서 문서 전처리가 검색 정확도를 좌우한다는 점을 설명했습니다. HTML, PDF, Excel, 이미지별로 적절한 정제와 로더 선택 방법을 정리했습니다.


셀러팀이 ChatGPT와 Cursor로 반복 업무와 데이터 분석을 자동화한 사례를 소개했습니다. 주간 지표 처리와 파일 생성 시간을 크게 줄이며 내부 툴로 확장하고 있습니다.


자동발주 예측 품질을 높이기 위해 품절률 급등 원인을 분석하고 권고발주를 자동발주로 점진 전환했습니다. TFT와 분위수 예측을 적용해 행사와 Capacity 변화에 더 잘 대응하며 품절률과 RMSE를 개선했습니다.

OpenAI Academy의 메뉴 구조와 역할별 학습 트랙을 빠르게 살펴본 글입니다. ChatGPT 활용, GPT-5 자료, Builders 리소스를 실무 관점에서 소개했습니다.


AI 에이전트 성능이 프롬프트 중심에서 컨텍스트 엔지니어링 중심으로 이동하는 흐름을 정리했습니다. ACE의 구조와 델타 업데이트 방식으로 컨텍스트 붕괴를 줄이는 접근을 소개했습니다.

물어보새를 사내 지식과 업무를 아우르는 멀티 에이전트 서비스로 확장한 과정을 소개했습니다. 지식 확장, 메모리, Tracing, ReAct로 검색과 맥락 유지, 자율 실행을 강화했습니다.


Google Opal의 자연어 기반 AI 앱 생성 기능과 시각적 워크플로 편집을 소개했습니다.\n기술 블로그 자동화와 DevOps 반복 업무에 적용하는 방법과 보안 주의점도 정리했습니다.


Google Opal은 자연어 한 줄로 AI 앱과 워크플로를 만드는 노코드 플랫폼입니다. 반복 업무 자동화와 빠른 프로토타입에 유용하지만, 프로덕션과 보안 환경에서는 제약이 있습니다.


Dev Ground 2025 세미나에서 AI 코딩의 실무 활용법을 정리했습니다. LLM 컨텍스트 관리와 설계, 지침 파일과 Commands 활용이 핵심이었습니다.


LLM 활용 방식별 특징과 장단점을 기획자 관점에서 정리한 글입니다. 에이닷 적용 사례를 통해 서비스에 맞는 LLM 선택과 구조 설계의 중요성을 설명했습니다.