

Testcontainers에 의한 docker container 생성 폭발을 막아라
Testcontainers로 생기는 컨테이너 폭증과 메모리 고갈 문제를 Gradle BuildService로 줄였습니다. 하나의 컨테이너를 재사용하고 스키마 초기화 방식을 정리해 CI 시간을 크게 단축했습니다.
새로운 기술 블로그가 추가되었어요


Testcontainers로 생기는 컨테이너 폭증과 메모리 고갈 문제를 Gradle BuildService로 줄였습니다. 하나의 컨테이너를 재사용하고 스키마 초기화 방식을 정리해 CI 시간을 크게 단축했습니다.

Toxiproxy로 nbase-arc와 ZooKeeper 장애를 네트워크 결함으로 모사해 테스트했습니다.외부 인프라 의존 서비스의 복구 경로를 사전에 검증하는 방법을 소개했습니다.


오라클 클라우드의 무료 서버를 설정하는 방법을 단계별로 소개했습니다. 계정 생성부터 기본 세팅까지 무료로 시작하는 절차를 정리했습니다.


로봇 엣지 디바이스에서 동작하는 MLOps 파이프라인과 TensorRT 기반 추론 도구를 소개했습니다. Trtexec, TREx, Nsight Systems로 변환·시각화·성능 분석을 수행하는 흐름을 정리했습니다.
Debezium 기반 CDC 파이프라인의 운영 지표와 개선 방법을 정리한 글입니다. end-to-end 지연, 처리량, 확장성 개선으로 생성과 복구 시간을 줄인 사례를 소개했습니다.

네이버 검색 SRE의 상위 레벨 모니터링 시스템 구축 사례를 소개했습니다. 통합 대시보드, 규칙 기반 이상 탐지, ChatOps로 장애 대응 효율을 높였습니다.

네이버 검색의 지진 대응 사례를 통해 비상 대응 시스템과 상위 레벨 모니터링의 필요성을 설명했습니다. 빠른 이상 탐지, 자동 비상 모드, 수동 대응 UI가 서비스 안정성의 핵심이라고 정리했습니다.

카카오페이의 배포 효율화 경험과 자동화 도입 과정을 회고한 글입니다. 배포 프로세스 개선이 팀 생산성 향상으로 이어진 사례를 공유합니다.


로봇용 머신러닝 개발에서 재현성과 온프레미스 자원 관리가 왜 중요한지 설명했습니다. K3s와 Airflow로 이를 해결하는 MLOps 구성 방법을 소개했습니다.
Redis Stream으로 session_id 히스토리 적재를 분리해 트래픽 급증 시 지연 문제를 해소했습니다. Pub/Sub의 한계를 피하면서도 병렬 처리와 pending 재처리로 운영 안정성을 확보했습니다.

AWS WAF의 개념과 네트워크 방화벽과의 차이를 설명했습니다. 웹 공격 차단, 중앙 관리, 오탐 대응을 위한 운영 포인트도 함께 정리했습니다.


AWS Lambda에서 Snowflake Connector(Python)를 쓰기 위해 Custom Layer를 만드는 과정을 설명했습니다. Ubuntu EC2에서 의존성을 패키징하고 Lambda에 연결해 실행을 확인했습니다.