
AI
Amazon Bedrock기반 Agentic Text-to-Image로 사용자 의도를 정확히 반영하기 (프롬프트 분해에서 검증까지)
두줄요약
Amazon Bedrock 기반 Agentic Text-to-Image로 복잡한 프롬프트를 단계적으로 분해하고 검증하며 생성하는 방법을 소개했습니다. 또한 인페인팅, 아웃페인팅과 Gradio, LangGraph를 결합한 편집 데모도 함께 설명했습니다.
핵심 내용
- Amazon Bedrock 기반 Agentic Text-to-Image 접근법 소개
- 복잡한 텍스트 프롬프트를 분해해 단계적으로 생성하고, 각 단계마다 검증·수정을 반복하는 흐름
- 기존 생성 모델을 재학습하기보다 프롬프트 분해, 도구 사용, Reflection으로 의도 반영도를 높이는 방식
- 인페인팅·아웃페인팅과 Gradio, LangGraph를 결합한 통합 편집 데모 구성
구조와 흐름
- Planning으로 프롬프트를 단일 또는 2~3단계로 분해
- Tool use로 단계별 이미지 생성, 조건 이미지 활용으로 일관성 유지
- Reflection으로 수량, 위치, 속성 불일치 검증 후 Prompt Reformulation 반복
적용해볼 점
- 복잡한 장면, 객체 수량, 공간 관계가 있는 이미지 생성에 적합
- 생성 후 검증과 재생성을 넣어 프롬프트-결과 불일치 완화
- 텍스트/마스크 기반 편집까지 포함한 워크플로우 확장 가능
