필터 1
Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기
AWS
· 2026년 5월 15일
AI

Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기

Amazon Bedrock AgentCore의 Policy, Evaluation, Observability를 결합해 기업용 Agent 운영 체계를 설명했습니다. 정책 제어, 품질 평가, 실시간 추적의 역할과 연계를 정리했습니다.

#AWS#MCP
23005분
옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법
여기어때
· 2026년 4월 23일
데브옵스

옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법

Kubernetes Pod의 Request와 Limit을 실제 사용 패턴에 맞게 조정하는 Right-Sizing 기준 수립 과정을 다뤘습니다. P95, 버퍼율, 컴포넌트 특성, Throttling 지표를 함께 고려하는 방법을 정리했습니다.

#Kubernetes#Grafana
62005분
[기술이 장르가 되는 곳, kt cloud] 케클러 인터뷰 시리즈 #1 kt cloud PLATFORM 재설계 이야기
KT 클라우드
· 2026년 4월 23일
아키텍처

[기술이 장르가 되는 곳, kt cloud] 케클러 인터뷰 시리즈 #1 kt cloud PLATFORM 재설계 이야기

kt cloud PLATFORM을 Cloud Native와 AI 시대에 맞게 재설계한 과정을 소개했습니다. 관측 가능성, IAM, VPC, DR까지 통합해 확장성과 운영성을 높였습니다.

#cloud#Observability
23005분
신뢰성 향상을 위한 SLO/SLI 도입 3편 - 서비스 적용 사례
라인
· 2026년 4월 22일
아키텍처

신뢰성 향상을 위한 SLO/SLI 도입 3편 - 서비스 적용 사례

SLI/SLO를 서비스 관점에서 정의하고 운영에 적용하는 방법을 정리했습니다. 오류 예산과 대시보드를 활용해 신뢰성과 개발 리소스 균형을 맞추는 사례를 소개했습니다.

#SRE#SLO
30005분
[미래를 담아낸 뼈대 4/7] 기반이 열어준 다음 문제
flex
· 2026년 3월 29일
아키텍처

[미래를 담아낸 뼈대 4/7] 기반이 열어준 다음 문제

Hexagonal Architecture와 표준화된 인프라에 투자해 멀티클라우드, AI 백엔드, Observability 전환 비용을 낮춘 사례를 다뤘습니다. 벤더가 바뀌어도 코드와 운영을 크게 흔들지 않는 구조의 효과를 설명했습니다.

#Hexagonal Architecture#멀티클라우드
46005분
OpenTelemetry 도입기
사람인
· 2026년 3월 19일
데브옵스

OpenTelemetry 도입기

Kubernetes 환경에서 OpenTelemetry를 도입해 로그·메트릭·트레이스를 통합 수집했습니다. 기존 정책과의 호환성과 데이터 무결성을 보완하며 MTTR도 개선했습니다.

#OpenTelemetry#Kubernetes
25005분
Claude Code 비용/사용량을 한눈에: AWS에 Observability 플랫폼 구축하기
AWS
· 2026년 3월 5일
AI

Claude Code 비용/사용량을 한눈에: AWS에 Observability 플랫폼 구축하기

Claude Code의 세션·비용·사용량을 보기 위해 AWS 관리형 서비스로 Observability 플랫폼을 구축하는 방법을 소개했습니다. 메트릭과 이벤트를 분리해 실시간 모니터링과 심층 분석을 함께 제공했습니다.

#AWS#Observability
97005분
여기어때 Secret 플랫폼 구축기 Part 3: 시크릿 저장소를 운영 가능한 상태로 만들기 — 컨테이너화부터 CI/CD, 로그 수집까지
여기어때
· 2026년 2월 27일
데브옵스

여기어때 Secret 플랫폼 구축기 Part 3: 시크릿 저장소를 운영 가능한 상태로 만들기 — 컨테이너화부터 CI/CD, 로그 수집까지

Secrethub를 운영 가능한 상태로 만들기 위해 컨테이너화, CI/CD, 로그 수집 구조를 정리했습니다. 서비스 단위가 아닌 플랫폼 레벨에서 관리 가능한 구조를 목표로 표준화를 진행했습니다.

#Docker#CI/CD
46005분
장애 대응의 성패를 가르는 First Action: 우아한형제들의 장애 관리 라이프사이클
우아한 형제들
· 2026년 2월 3일
아키텍처

장애 대응의 성패를 가르는 First Action: 우아한형제들의 장애 관리 라이프사이클

장애 대응에서 가장 중요한 초동 조치와 이를 관리하는 라이프사이클을 정리했습니다. 시간 기반 메트릭으로 병목을 찾고 운영 개선으로 연결하는 방식을 소개했습니다.

#SRE#모니터링
189005분
OpenTelemetry와 Kafka를 활용한 안정적인 Observability 구축기
여기어때
· 2025년 12월 16일
데브옵스

OpenTelemetry와 Kafka를 활용한 안정적인 Observability 구축기

OpenTelemetry와 Kafka를 활용해 마이크로서비스 환경의 Observability 파이프라인을 구축한 사례를 소개했습니다.\n자동 계측, 중앙 Collector, Signal별 분리로 안정성과 확장성을 높였습니다.

#OpenTelemetry#Kafka
78005분
LLMOps로 확장하는 AI플랫폼 2.0
우아한 형제들
· 2025년 9월 29일
AI

LLMOps로 확장하는 AI플랫폼 2.0

AI플랫폼 2.0에서 LLMOps를 지원하기 위한 운영 과제와 대응 방안을 정리했습니다. Studio, SDK, API Gateway, Labs를 중심으로 프롬프트 관리와 관측성, 보안을 강화했습니다.

#LLM#MLOps
29005분
AI 시대, 요즘 테스트 – UI 에서 API 중심으로
데보션
· 2025년 8월 21일
AI

AI 시대, 요즘 테스트 – UI 에서 API 중심으로

AI 시대에는 UI 중심 테스트보다 API 중심 테스트와 시나리오 기반 검증이 중요해졌습니다. 핵심 플로우만 UI로 확인하고, 나머지는 자동화와 Observability로 품질을 보장해야 했습니다.

#test#API
106005분