필터 1
Alert 시스템을 표준화하고 IaC로 운영하기
AB180
· 2026년 6월 28일
데브옵스

Alert 시스템을 표준화하고 IaC로 운영하기

Alert 생성과 전달, 대응 흐름을 IaC와 표준화된 Slack 메시지로 정리한 개선 과정을 소개했습니다. 반복 Alert 재사용, grouped Alert, AI 연동, 모니터링 자체 감시까지 운영 개선을 다뤘습니다.

#IaC#Grafana
0005분
창식이와 함께하는 물류 개발 라이프(with 하네스)
펫프렌즈
· 2026년 5월 27일
AI

창식이와 함께하는 물류 개발 라이프(with 하네스)

Slack 봇 창식이를 통해 하네스 엔지니어링과 컨텍스트/피드백 루프 설계를 실제 운영에 적용한 사례를 정리했습니다. MCP 채널, 지식 베이스, 교정 로그로 장기 작업의 정확도를 높인 구성이 핵심입니다.

#LLM#MCP
87005분
옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법
여기어때
· 2026년 4월 23일
데브옵스

옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법

Kubernetes Pod의 Request와 Limit을 실제 사용 패턴에 맞게 조정하는 Right-Sizing 기준 수립 과정을 다뤘습니다. P95, 버퍼율, 컴포넌트 특성, Throttling 지표를 함께 고려하는 방법을 정리했습니다.

#Kubernetes#Grafana
62005분
StarRocks 운영기: Resource Group으로 멀티테넌트 워크로드 격리하기
토스
· 2026년 4월 23일
백엔드

StarRocks 운영기: Resource Group으로 멀티테넌트 워크로드 격리하기

StarRocks에서 Resource Group으로 멀티테넌트 워크로드를 분류하고 CPU 우선순위를 조절한 운영 경험을 정리했습니다. 서비스 SLA가 필요한 경우에는 exclusive_cpu_cores와 주의점을 함께 적용했습니다.

#Starrocks#Resource Group
36005분
신뢰성 향상을 위한 SLI/SLO 활용 1편 - SLI/SLO 프레임워크 및 서비스 상태 확인 도구 LINE Status 개발기
라인
· 2026년 3월 19일
백엔드

신뢰성 향상을 위한 SLI/SLO 활용 1편 - SLI/SLO 프레임워크 및 서비스 상태 확인 도구 LINE Status 개발기

SLI/SLO 도입 과정을 공통 프레임워크로 정리하고 사내 템플릿으로 확산한 사례를 소개했습니다. 또한 웹훅과 DB 기반으로 자동 갱신되는 서비스 상태 확인 도구 LINE Status를 만든 과정을 공유했습니다.

#SRE#SLI/SLO
68005분
나만의 완벽한 AI 비서 만들기: Claude 활용 가이드 - Part 2
밸런스히어로
· 2026년 1월 26일
AI

나만의 완벽한 AI 비서 만들기: Claude 활용 가이드 - Part 2

Claude Code로 Slack·VS Code·Jupyter를 묶어 맥락이 이어지는 AI 비서를 설계하고 실무 자동화 사례를 소개했습니다. 개인 워크스페이스를 조직 자산으로 확장하는 방향과 AI를 대하는 실용주의도 함께 정리했습니다.

#Claude#Slack
0005분
왜 행사 상품은 항상 늦게 연동될까?
SSG.COM
· 2026년 1월 22일
아키텍처

왜 행사 상품은 항상 늦게 연동될까?

FCFS 기반 제휴 상품 연동의 한계를 보완하기 위해 SoAP 점수 체계를 도입했습니다. 주요 상품의 우선순위를 높여 연동 속도와 운영 효율을 개선했습니다.

#Kotlin#비동기
48005분
팀을 위한 Claude Code 모니터링 방법 4가지
인포그랩
· 2026년 1월 7일
AI

팀을 위한 Claude Code 모니터링 방법 4가지

Claude Code의 사용 패턴과 비용, 성능을 팀 단위로 모니터링하는 4가지 방법을 정리했습니다. OpenTelemetry, SigNoz, Datadog, claude-code-otel로 ROI와 활용도를 확인할 수 있습니다.

#Claude Code#OpenTelemetry
155005분
QA 자동화 결과를 데이터로 관리하다: Grafana Dashboard와 Weekly 분석의 힘
무신사
· 2025년 12월 28일
기타

QA 자동화 결과를 데이터로 관리하다: Grafana Dashboard와 Weekly 분석의 힘

QA 자동화 결과를 DB와 Grafana로 관리하며 Fail 원인을 주간 단위로 분석하고 개선했습니다. 협업과 일정 관리를 더해 3Q 목표였던 Fail률 0.7% 미만을 달성했습니다.

#Grafana#Jenkins
45005분
Observability를 위한 LGTM 첫걸음
여기어때
· 2025년 12월 22일
데브옵스

Observability를 위한 LGTM 첫걸음

LGTM 스택의 개요와 Mimir, Tempo, Loki의 구조를 처음 도입 관점에서 정리했습니다. 또한 배포 모드와 운영 시 주의할 점을 함께 소개했습니다.

#Grafana#Kubernetes
87005분
입사 2일차에 앱 기능 배포하며 만들어가는 임팩트
라포랩스
· 2025년 11월 25일
프론트엔드

입사 2일차에 앱 기능 배포하며 만들어가는 임팩트

입사 2일차에 실제 앱 기능을 배포하며 빠르게 실무에 적응한 프론트엔드 인턴 인터뷰입니다. 레거시 정리와 성능 개선, 모니터링 도구 활용을 통해 팀의 생산성과 안정성에 기여한 경험을 전했습니다.

#React#Sentry
26005분
29CM 에서 무신사머니 사용하기
무신사
· 2025년 10월 31일
백엔드

29CM 에서 무신사머니 사용하기

29CM 주문서에 무신사머니를 외부 서비스 연동으로 도입한 사례를 소개했습니다. 안정성과 연속성을 위해 폴백, 서킷 브레이커, 전략 패턴, 파드 증설을 적용했습니다.

#Spring Boot#Circuit Breaker
93005분