The Machine: AI가 AI 활용 코드를 평가하다
AI 코딩 에이전트를 대규모로 평가하기 위한 멀티 에이전트 하네스 설계를 다뤘습니다. 마크다운 지침과 JSON Schema로 재현성을 확보하고 기능과 깊이를 분리해 채점했습니다.
AI 코딩 에이전트를 대규모로 평가하기 위한 멀티 에이전트 하네스 설계를 다뤘습니다. 마크다운 지침과 JSON Schema로 재현성을 확보하고 기능과 깊이를 분리해 채점했습니다.

AI 코드 리뷰의 신뢰성을 높이기 위해 자체 벤치마크와 반영률 지표를 만들고 개선 과정을 정리했습니다. 서브에이전트와 프롬프트 튜닝의 한계를 확인한 뒤 데이터 기반으로 모델과 워크플로를 바꿨습니다.
마이리얼트립 T&A실은 위키, KPI, FP&A, Slack을 AI로 묶어 매일 자동 브리핑하는 Control Tower를 만들었습니다. 리더는 반복 수집과 분류를 맡기고 판단과 액션에만 집중하는 구조로 바뀌었습니다.

AI로 PR 리뷰 정체를 줄이기 위해 스크리닝 리뷰, PR 자동화, 알림, 지표 가시화를 함께 도입했습니다. 사내 워크숍과 체험형 공유를 통해 활용률을 높이고 리뷰 문화를 확산했습니다.


EKS 장애를 자동 감지해 AWS DevOps Agent 조사로 연결하는 Operator 활용법을 소개했습니다.\n로그와 이벤트를 즉시 수집해 MTTR을 줄이고, Runbook과 GitHub 연동으로 원인 분석을 고도화했습니다.
마이리얼트립은 인사·홍보 조직이 먼저 AI Native 문화를 체화해야 한다고 판단했습니다. 개발 경험이 없는 구성원들도 2주 만에 채용, 온보딩, PR 업무를 AI로 개선했습니다.

디자이너가 Codex와 Cursor로 사소한 UI 버그를 직접 수정하는 실전 과정을 소개했습니다. 티켓 정리, Plan 모드, 개발자 리뷰를 통해 백로그를 줄이는 흐름을 공유했습니다.

디자이너가 AI 코딩 도구를 활용해 사소한 UI 버그를 직접 수정한 실전기를 소개했습니다. 티켓 정리, Plan 모드, PR 리뷰 흐름으로 백로그를 줄인 사례입니다.


Claude Code의 /simplify와 /batch로 병렬 리뷰와 대규모 변경 자동화를 다뤘습니다. PR 전 품질 점검과 작업 단위별 병렬 처리 활용법도 함께 정리했습니다.


바이브코딩은 프로토타입과 반복 작업에서 강력했지만, 실제 프로젝트에서는 이해와 검증 비용이 더 컸습니다. 그래서 설계는 사람이 하고 구현 일부만 AI에 맡기는 방식으로 전환했습니다.


GitHub Spec Kit 기반 SDD 프로세스를 소개하며 명세를 중심으로 AI와 협업하는 흐름을 정리했습니다. 4단계 워크플로우와 TDD·BDD 비교, 로그인 예시까지 함께 설명했습니다.


Claude Code의 Auto memory로 작업 중 컨텍스트를 자동 저장해 다음 세션에 이어 쓰는 방법을 소개했습니다. CLAUDE.md와의 역할 차이, /memory 사용법, 주의할 점도 함께 정리했습니다.