태그

Observability 기술 블로그 글

Observability 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 20개최신 20개 표시

#OpenTelemetry24 #Kubernetes412 #AWS635 #LLM995 #모니터링256 #CI/CD202 #Grafana37 #MSA132 #SRE47 #API213 #cloud422 #자동화304

Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기

Amazon Bedrock AgentCore의 Policy, Evaluation, Observability를 결합해 기업용 Agent 운영 체계를 설명했습니다. 정책 제어, 품질 평가, 실시간 추적의 역할과 연계를 정리했습니다.

#AWS#MCP#LLM

2300

Agentic AI 기반 플랫폼 – Part3 : AgentCore Policy, Evaluation, Observability로 기업 운영 체계 구축하기

2026년 4월 24일

데브옵스

옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법

Kubernetes Pod의 Request와 Limit을 실제 사용 패턴에 맞게 조정하는 Right-Sizing 기준 수립 과정을 다뤘습니다. P95, 버퍼율, 컴포넌트 특성, Throttling 지표를 함께 고려하는 방법을 정리했습니다.

#Kubernetes#Grafana#OpenTelemetry

6200

옵저버빌리티 Right-Sizing: 여기어때에서 기준을 만드는 법

2026년 4월 23일

아키텍처

[기술이 장르가 되는 곳, kt cloud] 케클러 인터뷰 시리즈 #1 kt cloud PLATFORM 재설계 이야기

kt cloud PLATFORM을 Cloud Native와 AI 시대에 맞게 재설계한 과정을 소개했습니다. 관측 가능성, IAM, VPC, DR까지 통합해 확장성과 운영성을 높였습니다.

#cloud#Observability#IAM

2300

2026년 4월 22일

아키텍처

신뢰성 향상을 위한 SLO/SLI 도입 3편 - 서비스 적용 사례

SLI/SLO를 서비스 관점에서 정의하고 운영에 적용하는 방법을 정리했습니다. 오류 예산과 대시보드를 활용해 신뢰성과 개발 리소스 균형을 맞추는 사례를 소개했습니다.

#SRE#SLO#SLI

3200

2026년 3월 30일

아키텍처

[미래를 담아낸 뼈대 4/7] 기반이 열어준 다음 문제

Hexagonal Architecture와 표준화된 인프라에 투자해 멀티클라우드, AI 백엔드, Observability 전환 비용을 낮춘 사례를 다뤘습니다. 벤더가 바뀌어도 코드와 운영을 크게 흔들지 않는 구조의 효과를 설명했습니다.

#Hexagonal Architecture#멀티클라우드#LLM

4700

2026년 3월 20일

데브옵스

OpenTelemetry 도입기

Kubernetes 환경에서 OpenTelemetry를 도입해 로그·메트릭·트레이스를 통합 수집했습니다. 기존 정책과의 호환성과 데이터 무결성을 보완하며 MTTR도 개선했습니다.

#OpenTelemetry#Kubernetes#MSA

2500

OpenTelemetry 도입기

2026년 3월 5일

Claude Code 비용/사용량을 한눈에: AWS에 Observability 플랫폼 구축하기

Claude Code의 세션·비용·사용량을 보기 위해 AWS 관리형 서비스로 Observability 플랫폼을 구축하는 방법을 소개했습니다. 메트릭과 이벤트를 분리해 실시간 모니터링과 심층 분석을 함께 제공했습니다.

#AWS#Observability#OpenTelemetry

9800

Claude Code 비용/사용량을 한눈에: AWS에 Observability 플랫폼 구축하기

2026년 2월 27일

데브옵스

여기어때 Secret 플랫폼 구축기 Part 3: 시크릿 저장소를 운영 가능한 상태로 만들기 — 컨테이너화부터 CI/CD, 로그 수집까지

Secrethub를 운영 가능한 상태로 만들기 위해 컨테이너화, CI/CD, 로그 수집 구조를 정리했습니다. 서비스 단위가 아닌 플랫폼 레벨에서 관리 가능한 구조를 목표로 표준화를 진행했습니다.

#Docker#CI/CD#GitLab

4600

여기어때 Secret 플랫폼 구축기 Part 3: 시크릿 저장소를 운영 가능한 상태로 만들기 — 컨테이너화부터 CI/CD, 로그 수집까지

2026년 2월 3일

아키텍처

장애 대응의 성패를 가르는 First Action: 우아한형제들의 장애 관리 라이프사이클

장애 대응에서 가장 중요한 초동 조치와 이를 관리하는 라이프사이클을 정리했습니다. 시간 기반 메트릭으로 병목을 찾고 운영 개선으로 연결하는 방식을 소개했습니다.

#SRE#모니터링#AIOps

19000

장애 대응의 성패를 가르는 First Action: 우아한형제들의 장애 관리 라이프사이클

2025년 12월 17일

데브옵스

OpenTelemetry와 Kafka를 활용한 안정적인 Observability 구축기

OpenTelemetry와 Kafka를 활용해 마이크로서비스 환경의 Observability 파이프라인을 구축한 사례를 소개했습니다.\n자동 계측, 중앙 Collector, Signal별 분리로 안정성과 확장성을 높였습니다.

#OpenTelemetry#Kafka#Observability

7900

OpenTelemetry와 Kafka를 활용한 안정적인 Observability 구축기

2025년 9월 29일

LLMOps로 확장하는 AI플랫폼 2.0

AI플랫폼 2.0에서 LLMOps를 지원하기 위한 운영 과제와 대응 방안을 정리했습니다. Studio, SDK, API Gateway, Labs를 중심으로 프롬프트 관리와 관측성, 보안을 강화했습니다.

#LLM#MLOps#API Gateway

2900

LLMOps로 확장하는 AI플랫폼 2.0

2025년 8월 21일

AI 시대, 요즘 테스트 – UI 에서 API 중심으로

AI 시대에는 UI 중심 테스트보다 API 중심 테스트와 시나리오 기반 검증이 중요해졌습니다. 핵심 플로우만 UI로 확인하고, 나머지는 자동화와 Observability로 품질을 보장해야 했습니다.

#test#API#Observability

10600

2025년 8월 1일

데브옵스

표준을 통한 마이크로 서비스의 Observability 구축기

Kubernetes 기반 마이크로서비스의 가시성을 확보하기 위해 OpenTelemetry와 SigNoz를 활용한 Observability 구축 과정을 정리했습니다. Collector 파이프라인과 Auto-Instrumentation, 운영 효율 개선 포인트를 함께 소개했습니다.

#Kubernetes#OpenTelemetry#observability

4300