
OpenTelemetry와 Kafka를 활용한 안정적인 Observability 구축기
OpenTelemetry와 Kafka를 활용해 마이크로서비스 환경의 Observability 파이프라인을 구축한 사례를 소개했습니다.\n자동 계측, 중앙 Collector, Signal별 분리로 안정성과 확장성을 높였습니다.

OpenTelemetry와 Kafka를 활용해 마이크로서비스 환경의 Observability 파이프라인을 구축한 사례를 소개했습니다.\n자동 계측, 중앙 Collector, Signal별 분리로 안정성과 확장성을 높였습니다.
Elasticsearch 데이터 노드 재시작 시 캐시 미적재로 레이턴시가 급증하는 문제를 다뤘습니다. search-coordinator와 웜업 절차로 배포 중에도 안정적으로 트래픽을 받도록 개선했습니다.
AI로 숙소 후기를 요약·구조화해 탐색에 바로 쓸 수 있는 데이터로 전환했습니다. 사용자는 장문 리뷰를 읽지 않고도 핵심 정보를 빠르게 확인할 수 있게 되었습니다.

DynamoDB 부하를 실시간으로 감지해 Kafka 컨슈머를 pause/resume하는 역압력 아키텍처를 구축했습니다. 운영 적용 후 처리량을 낮추고 실시간 API 안정성과 비용 절감을 확인했습니다.
20년 된 결제 원장을 MySQL 기반 신규 구조로 전환한 사례를 다뤘습니다. 무중단 마이그레이션과 장애 복구 경험을 통해 확장성과 회복 탄력성을 높였습니다.

재고 정산 처리에 Kafka Streams window를 도입한 경험을 다룬 글입니다. 윈도우 적용 과정에서의 이야기를 중심으로 정리했습니다.

DAN25에서 공개된 기술세션 영상과 주요 발표 5개를 소개했습니다. 네이버의 AI, 검색, 개인화, 로그 파이프라인 적용 사례를 확인할 수 있습니다.
다앙근페이 FDS가 규칙 엔진을 기반으로 이상거래 탐지 체계를 확장한 과정을 소개했습니다. 이후 LLM을 붙여 검토 속도와 판단 일관성을 높이려는 시도를 설명했습니다.

외부 Batch Scheduler를 Quartz 기반으로 내재화한 과정과 최종 구조를 공유했습니다. 배포·롤백·중복 실행·무한 RUNNING 같은 운영 예외를 줄이기 위한 시행착오도 함께 정리했습니다.

장시간 엑셀 생성 작업에서 Kafka Consumer 타임아웃으로 중복 발송이 발생했습니다. RDB 기반 Task Queue와 Heartbeat로 재시도와 장애 복구를 안정화했습니다.

Kafka Consumer Group Protocol v2를 소개하고 v1의 문제점, v2의 장점과 마이그레이션 포인트를 다뤘습니다.\n서비스 조직에서 Kafka를 사용할 때 참고할 실무 팁을 정리했습니다.

우아한형제들의 기술 콘퍼런스 WOOWACON 2025 개최 소식을 전했습니다. 기술 공유와 교류를 통해 더 나은 내일을 준비하는 행사로 소개했습니다.