

Dataflow로 컬리의 준실시간 수요 예측모델 파이프라인 구축하기 - 1편
컬리의 준실시간 수요 예측 모델을 위해 Dataflow 파이프라인을 도입한 배경과 전체 동작 방식을 설명했습니다. Beam, Flex 템플릿, CI/CD, 권한 설정 등 실무 적용 포인트도 함께 정리했습니다.
새로운 기술 블로그가 추가되었어요


컬리의 준실시간 수요 예측 모델을 위해 Dataflow 파이프라인을 도입한 배경과 전체 동작 방식을 설명했습니다. Beam, Flex 템플릿, CI/CD, 권한 설정 등 실무 적용 포인트도 함께 정리했습니다.

AWS EKS에서 운영 중인 챗봇 서비스의 비용을 Spot by NetApp 도입으로 최적화한 사례입니다. 파드와 노드 교체 안정성을 보완해 수수료 포함 약 40% 절감했습니다.


MinIO를 아카이빙 스토리지로 도입하며 HA와 Failover 동작을 검증하고, 장애 레벨별 대응 기준을 정리했습니다. 또한 HDFS distcp와 Airflow로 Backup & Restore 체계를 구성해 DR 전략을 마련했습니다.


클라우드 사용량을 체계적으로 분석하고 도메인 팀과 협업해 운영 비용을 최적화한 사례를 다루었습니다. 비프로덕션 자동화, 인스턴스 조정, 스토리지 전환으로 큰 폭의 비용 절감 효과를 거두었습니다.


쿠팡은 재무와 엔지니어링 협업으로 클라우드 지출 최적화 체계를 만들었습니다. 중앙팀과 분석 대시보드, 인프라 전환으로 대규모 비용 절감을 이끌었습니다.


Envoy와 Nginx의 성능을 비교한 테스트 결과를 공유했습니다. 성능 차이와 함께 각 도구의 장단점을 함께 살펴본 글입니다.

서비스 중단 없이 MySQL 스키마를 변경하기 위해 pt-osc를 도입한 경험을 공유했습니다. RDS/Aurora 환경에서의 제약과 부하 조절, CDC 영향 등 운영 이슈와 대응 방법도 정리했습니다.


Argo의 주요 제품군을 간단히 소개하고, 특히 Argo CD가 Kubernetes용 GitOps 배포 도구임을 설명했습니다. Kubernetes 배포 자동화와 GitOps 흐름을 이해하는 데 도움이 되는 글입니다.

BackstopJS로 시각적 회귀 테스트를 구축한 경험을 정리했습니다. 스토리북과 Docker를 함께 사용해 UI 변경 검증과 운영 안정성을 높였습니다.


AWS 도쿄 리전 AZ 장애로 쿠키런: 킹덤의 DB 노드 일부가 동시 장애를 겪었습니다. 백업과 비상 복구 절차, Locality 재설계로 유저 데이터 유실 없이 복구했습니다.

iOS 앱 배포를 fastlane과 CircleCI로 자동화한 구축 과정을 소개했습니다. 로컬 설정부터 match, TestFlight 업로드, 슬랙 알림, CI 트리거까지 정리했습니다.

Amazon ECS를 Spot Ocean으로 마이그레이션하는 방법을 소개하는 글입니다. 다만 제공된 내용이 짧아 구체적인 절차나 결과는 확인할 수 없었습니다.