토스플레이스 데이터봇 ‘판다(PANDA)’를 소개합니다 : 모든 팀원이 데이터 전문가처럼 일하는 방법
토스플레이스가 데이터봇 판다를 통해 팀원들이 직접 데이터를 조회하고 활용하는 환경을 만들었습니다.\nSSOT 정비, 비즈니스 용어 연결, Agentic Loop 설계로 정확도와 일관성을 높였습니다.
DBT 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
9개 표시
토스플레이스가 데이터봇 판다를 통해 팀원들이 직접 데이터를 조회하고 활용하는 환경을 만들었습니다.\nSSOT 정비, 비즈니스 용어 연결, Agentic Loop 설계로 정확도와 일관성을 높였습니다.
운영 DB 중심 분석의 한계를 넘기 위해 S3, Athena, Airflow, dbt 기반 데이터 환경을 구축했습니다.\nAI skill로 소스 연결, 모델링, 문서화를 자동화하며 실무 생산성을 높였습니다.
카라트는 사용자 활성화 분석을 공통 Activation Layer로 표준화했습니다. 팀별 ad hoc 쿼리 대신 DBT 기반 모델로 신뢰성과 운영 안정성을 높였습니다.
당근이 User Activation을 전사 공통 데이터 레이어로 만든 배경과 구조를 설명했습니다. 상태와 전이 분석을 위해 신뢰성, 비용, 생산성을 함께 고려한 설계였습니다.
DBT와 Airflow로 데이터 계보 중심 파이프라인 Flow.er를 구축한 사례를 소개했습니다. 운영 비용 절감과 조직 확장을 위한 구성 요소와 개선 경험을 공유했습니다.
데이터는 많지만 도구와 흐름이 흩어져 있어 활용이 어려운 문제를 다뤘습니다. 이를 해결하기 위해 JupyterHub와 dbt 조합을 통합 데이터 허브의 기반으로 선택했습니다.
DBT와 CDC, Airflow로 클라이언트 여정을 추적하는 `data_logs` 테이블 구축 사례를 소개했습니다.복잡한 조인과 스캔 비용을 줄이기 위해 증분 모델링과 파티션 최적화를 적용했습니다.
매월 반복되던 재무 결산을 Spring Batch와 코드 중심 구조에서 Airflow와 dbt 기반 데이터 파이프라인으로 전환했습니다. SQL 수정만으로 결산 대응이 가능해져 유연성과 가시성을 높였습니다.

DBT와 Airflow를 도입하며 겪은 7가지 문제와 해결 방안을 정리했습니다. 데이터 구조화, 연동, 테스트, 백필까지 운영 관점의 설계 경험을 공유했습니다.
