
데브옵스
100여개의 대출 기관 API, 자동으로 운영하기
두줄요약
100여 개 대출 기관 API의 성공률을 메트릭과 알림으로 자동 모니터링하도록 개선했습니다. 그 결과 장애를 더 빠르게 발견하고 대응해 API 성공률을 99%까지 올렸습니다.
문제 상황
- 100여 개 금융기관 대출 API 연동 환경에서 호출 실패가 곧 사용자 기회 손실로 이어지는 운영 부담
- 개발자 수동 확인만으로는 실제 사용자 영향과 장애 징후를 제때 파악하기 어려운 상태
원인 분석
- 금융사 네트워크 변경, 서버 점검 등 외부 요인으로 API 성공률 변동 발생
- 성공률을 눈으로 확인하는 방식만으로는 놓치는 구간 존재
해결 방법
- count 메트릭으로 금융사 API 호출 성공·실패를 집계하고 대시보드로 가시화
- 성공률 임계치 하락 시 슬랙 알림을 보내는 모니터링 시스템 구축
- 알림에 관련 로그와 대시보드 링크를 함께 제공해 원인 분석 속도 개선
성능/운영 포인트
- 요청이 들어오지 않는 상황을 정상으로 처리하는 예외 기준 반영
- 선제적 문의와 로직 반영으로 대응 속도 향상
- API 성공률 90%에서 99%로 개선