광고 성과 데이터 StarRocks 도입기
MySQL 기반 광고 성과 집계의 확장성과 안정성 문제를 해결하기 위해 StarRocks를 도입했습니다.\n외부 원천, MV 설계, 아키텍처 전환으로 부하 분리와 복구 편의성을 확보했습니다.
BigQuery 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
20개 표시
MySQL 기반 광고 성과 집계의 확장성과 안정성 문제를 해결하기 위해 StarRocks를 도입했습니다.\n외부 원천, MV 설계, 아키텍처 전환으로 부하 분리와 복구 편의성을 확보했습니다.
200개 이상 DB를 BigQuery로 옮기던 ELT 운영 문제를 DT Platform으로 분리·표준화했습니다. UI와 DSL, 자동 마이그레이션으로 리드타임과 리뷰 병목을 줄였습니다.
슬랙 기반 데이터 에이전트로 반복 분석 요청을 자동 처리하는 구조를 소개했습니다.정확도와 안전성을 위해 지식 체계, 서브 에이전트, 평가 루프를 함께 설계했습니다.
데이터가치화팀이 지난 1년간 AI를 업무와 플랫폼에 통합한 변화를 정리했습니다. 반복 작업은 빨라졌지만, 검증과 데이터 기반의 중요성은 더 커졌습니다.
마이리얼트립 T&A실은 위키, KPI, FP&A, Slack을 AI로 묶어 매일 자동 브리핑하는 Control Tower를 만들었습니다. 리더는 반복 수집과 분류를 맡기고 판단과 액션에만 집중하는 구조로 바뀌었습니다.
모바일 앱 릴리스 전에 로그 품질을 자동으로 검증하는 구조를 설계하고 운영한 사례를 공유했습니다. 수동 검수의 한계를 줄이고, 실제 배포 전 로그 이슈를 조기에 발견한 과정을 설명했습니다.
입사 초기 세일즈 MD가 AI로 외부 영업의 비효율을 개선한 사례를 소개했습니다. 반복 업무는 AI에 맡기고, 브랜드 판단과 관계 형성은 사람이 맡는 방식이 핵심이었습니다.
Astronomer Agents는 Airflow API와 로그를 활용해 Dag 개발, 테스트, 디버깅을 돕는 AI 도구입니다. 또한 마이그레이션과 데이터 분석까지 지원해 운영 효율을 높였습니다.

당근에서 택소노미와 LLM 분류 파이프라인을 어떻게 운영했는지 정리한 글입니다. 정확도와 비용의 균형, 평가 체계, 확장 전략을 함께 다뤘습니다.
여기어때 현장실습생 4명의 직무 경험과 프로젝트를 소개했습니다. 각 직무에서 필요한 역량과 실무 성장을 함께 정리했습니다.
Astronomer Agents로 Airflow 작업의 작성, 테스트, 디버깅 방식이 달라질 수 있음을 소개했습니다. 또한 마이그레이션과 데이터 웨어하우스 분석까지 지원하는 핵심 기능을 설명했습니다.

Google Apps Script를 비개발자도 바로 시작할 수 있는 업무 자동화 도구로 소개했습니다. 라포랩스 AX 팀의 실제 활용 사례를 통해 AI 시대의 실행 장벽을 낮추는 역할을 설명했습니다.
마이리얼트립 T&A에서 파트너 성장을 성과로 연결하기 위해 AI와 데이터 구조를 활용한 실험을 소개했습니다. 운영 해석을 자동화하고 파트너가 직접 지표를 보며 행동을 바꾸는 구조를 만들었습니다.
대규모 사용자 이벤트를 더 일관되고 안전하게 관리하기 위해 Event Center를 구축했습니다. 기존 Git 기반 스키마 관리의 복잡도와 명명 불일치를 UI 기반 플랫폼으로 해결했습니다.
당근은 사용자 행동 로그가 커지며 코드 기반 스키마 관리의 한계를 겪었습니다. 이벤트센터를 만들어 전사 공통 규칙과 UI 기반 자동화로 로그 관리 효율을 높였습니다.
리더가 먼저 AI를 업무에 붙여보며 반복 업무와 구조적 한계를 줄인 사례를 다뤘습니다. 데이터 기준을 정리한 뒤 자동화와 AI 초안을 연결해 조직의 질문과 태도를 바꿨습니다.
당근은 GenAI 활용 확산에 맞춰 LLM Router, Prompt Studio, KarrotChat으로 공통 플랫폼을 구축했습니다. 이를 통해 AI API 통합 관리, 빠른 실험과 배포, 사내 Agent 활용을 지원했습니다.
Redshift 단일 클러스터의 적재 지연과 리소스 경합 문제를 해결하기 위해 Iceberg 기반 데이터레이크를 구축했습니다.\nGCS, BigLake Metastore, Spark, BigQuery를 분리해 멀티 엔진 운영과 벤더 종속 완화를 노렸습니다.
Karrot가 MongoDB 적재 방식의 한계를 해결하기 위해 CDC를 도입한 과정을 공유했습니다. 변경 로그 기반으로 BigQuery 적재를 구성하되, 초기 스냅샷은 별도 도구 활용을 검토했습니다.
MongoDB 덤프의 DB 부하와 SLO 문제를 해결하기 위해 CDC를 도입했습니다. Flink CDC와 Spark, 이중 테이블 구조로 적재와 스키마 변경, 정합성 검증을 묶었습니다.