Redis 6.x에서 Valkey 9.0으로: 운영 캐시 성능과 비용을 함께 개선한 전환기
Redis OSS 6.x 캐시를 Valkey 9.0으로 전환해 성능과 비용을 함께 개선한 사례를 정리했습니다. 업그레이드 중 client 재연결과 클러스터 대응 검증이 핵심이었습니다.
Redis 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
20개 표시
Redis OSS 6.x 캐시를 Valkey 9.0으로 전환해 성능과 비용을 함께 개선한 사례를 정리했습니다. 업그레이드 중 client 재연결과 클러스터 대응 검증이 핵심이었습니다.
Spring Data Redis Repository와 RedisTemplate의 실전 성능을 비교했습니다. 단순 캐시에는 RedisTemplate이 더 적합하며 CPU와 메모리 효율이 좋았습니다.
의료 설문 플랫폼에서 설문 정의와 수집을 담당하는 서비스를 헥사고날 구조와 CQRS로 설계했습니다. Master/Snapshot, Kafka, Outbox 등을 적용해 정합성과 운영 안정성을 확보했습니다.
메뉴 권한처럼 변경은 적고 조회는 많은 데이터를 싱글톤 인메모리 캐시로 관리하는 방법을 소개했습니다. 이를 통해 로그인 시 DB 부하를 줄이고 응답 속도와 유지보수성을 개선했습니다.
Spark Connect를 멀티세션 서비스로 운영하며 생기는 단일 장애점과 리소스 경합 문제를 다뤘습니다. replica, Gateway, 부하 점수 기반 세션 배치로 안정성을 높인 과정을 정리했습니다.

13년 된 단일 Writer 구조에서 전사 장애가 반복되자, 새로운 DB 전환보다 캐싱과 쿼리 최적화를 먼저 적용했습니다. 그 결과 Writer 연결과 응답 시간이 크게 줄고, 장애 탐지와 복구 체계도 함께 개선했습니다.
GS SHOP이 영상의 소구 포인트를 추출해 추천 신호로 바꾸고, 기존 추천 엔진과 결합한 Hybrid 시스템을 구축했습니다. A/B 테스트에서 클릭과 주문, 전환율이 모두 개선되었습니다.

DynamoDB managed GSI의 핫 파티션이 Boot 트래픽까지 막는 구조를 분석했습니다. 이를 해결하기 위해 인덱스 테이블과 쓰기 전파 파이프라인을 설계했습니다.
DynamoDB GSI 핫 파티션이 Boot까지 막는 장애 구조를 분석했습니다. 인덱스 테이블과 스트림 기반 파이프라인으로 쓰기 병목을 분리하는 설계를 소개했습니다.
MSA 환경에서 전체 시스템을 띄우지 않고 수정 중인 서비스만 로컬로 교체하는 Rewrite Host를 소개했습니다. 디버그 헤더로 라우팅을 바꾸고, 응답 헤더로 적용 여부를 알려주는 방식입니다.
![[코드가 환경을 모르는 구조 5/7] Rewrite Host — 공간 축을 교체한다](https://cdn.sanity.io/images/v31psllp/production/880cbd1201bc94d8f408147dcd135aef78e683b4-1684x1030.png)
비개발자가 AI와 사내 가이드를 활용해 생산성 측정 대시보드를 만든 과정을 공유했습니다. 리드타임 계산부터 서버 구축, 데이터 검증까지의 시행착오와 배운 점을 정리했습니다.
팀챗을 공용 인터페이스로 삼아 AI를 조직의 실행 흐름에 연결한 구축 사례를 소개했습니다.\nClaude Code 위에 상태머신, K8s 실행기, 메모리 계층을 얹어 보안 대응과 운영 점검까지 확장했습니다.
AI Native 레포를 조직 전체가 쓰는 실행 harness로 확장한 hollon-ai 구축기를 소개했습니다. 팀챗, Kubernetes, 상태머신, 메모리 계층으로 요청부터 복구까지 같은 흐름에 묶었습니다.
상품·쿠폰·증정·프로모션 데이터를 Kafka 기반 준실시간 구조로 전환한 사례입니다.\nRedis Pub/Sub, Aggregation Topic, Shadow Table로 정합성과 안전한 이관을 확보했습니다.
Amazon DocumentDB 전환 후 발생한 인덱스와 쿼리 성능 문제를 실제 사례로 정리했습니다. explain, profiler, 인덱스 재설계와 쿼리 변경으로 성능을 개선했습니다.

채널톡 메인 백엔드 서버의 CI 병목을 단계적으로 분해해 개선한 과정을 정리했습니다. 공유 상태 제거, prepare 분리, 동적 큐와 캐시로 실행 시간을 크게 줄였습니다.
AI가 코드를 빠르게 만들수록 CI 병목과 피드백 속도가 더 중요해졌습니다. 채널톡은 공유 상태 제거와 캐시, 동적 큐로 메인 백엔드 CI를 36.6분에서 15분대까지 줄였습니다.
마이리얼트립이 여행 상품 등록의 수작업 병목을 AI로 자동화한 사례를 공유했습니다.\n번역, 상세 페이지 생성, 카테고리 분류를 묶어 하루 20개 수준을 5,000개 이상으로 늘렸습니다.

Apache Flink와 RocksDB 튜닝으로 광고 Frequency Capping 실시간 집계를 7일 구간까지 확장한 사례를 다루었습니다. 세 개의 Flink 앱으로 분리해 병목을 각각 해결하고 Redis 단일 조회 구조로 단순화했습니다.

공동구매 트래픽 폭증으로 재고 처리의 lock 경합이 병목이 되자 Redis와 Kafka 중심으로 구조를 재설계했습니다. 재고 경로를 단일화하고 비동기 반영과 fallback을 더해 약 20배 트래픽을 안정적으로 견뎠습니다.