
데브옵스
SRE 팀의 반복 작업을 10분의 1로 줄인 SRE 봇 개발기
두줄요약
SRE 반복 작업과 문의 대응을 Slack 워크플로 중심의 봇으로 자동화한 개발기입니다. 배포와 일반 요청 처리 시간을 크게 줄이고 운영 가시성도 높였습니다.
문제 상황
- Flava 전환, 신규 인프라 도입, 서비스 확장으로 SRE 반복 문의와 배포 요청이 급증한 상황
- Slack, Confluence, Jira를 오가며 수동 처리해야 해 컨텍스트 스위칭과 실수 비용이 큰 워크플로
- 요청 처리 현황이 Slack 멘션에 묻혀 가시성이 낮고 추적이 어려운 구조
해결 방법
- Slack 워크플로를 요청 시작점으로 두고 Jira 티켓 생성, Fix Version, 스프린트, Epic 연결을 자동화
- 비동기 처리로 외부 API 호출을 백그라운드에서 수행하고 Slack 스레드에 상태와 결과를 지속 공유
- Redis와 트랜잭션으로 Slack 스레드-티켓 매핑을 관리하고, 헥사고날 아키텍처로 외부 시스템 결합도 축소
성능/운영 포인트
- 배포 요청 처리 시간이 약 1시간에서 1분 이내로 단축
- 일반 요청과 이전 배포 참고도 구조화되어 추적성과 운영 가시성 향상
- 데이터 축적과 온보딩 단축 같은 부수 효과도 확보