프롬프트 인젝션이 노리는 당신의 AI \:\ 실전 공격 유형과 방어 전략
11
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 프롬프트 인젝션의 위험성·원리·공격 유형과 방어 계층을 정리

핵심 내용

  • 정의 및 원리: LLM이 시스템 프롬프트와 사용자 입력을 연속 토큰으로 처리해 악성 지시를 수용하는 취약점
  • 주요 공격: 지시 하이재킹·탈옥, 난독화·회피, 간접·멀티모달 인젝션, TokenBreak·정책 조작, 장기 메모리 조작, Prompt-to-XSS/SQLi, AI 웜
  • 실제 사례: 시스템 프롬프트 유출, Morris-II 웜, GitHub Copilot 데이터 유출
  • 방어 대책: XML 태그 기반 입력 분리·후위 프롬프팅, 출력 정제·권한 관리·샌드박스, 중앙 정책·가드레일, 적대적 훈련·모니터링

연관 게시글