Mapping Karrot’s Data: How We Built Column-Level Lineage
Karrot 데이터팀이 BigQuery SQL 로그를 파싱해 컬럼 단위 데이터 계보를 구축한 과정을 소개했습니다. 테이블 단위 한계를 보완하고 영향 분석과 PII 추적을 정교하게 만든 사례입니다.
Karrot 데이터팀이 BigQuery SQL 로그를 파싱해 컬럼 단위 데이터 계보를 구축한 과정을 소개했습니다. 테이블 단위 한계를 보완하고 영향 분석과 PII 추적을 정교하게 만든 사례입니다.
BigQuery 쿼리 로그를 SQL 파싱해 컬럼 레벨 리니지를 구축한 사례를 소개했습니다. 테이블·컬럼 의존 관계를 빠르게 추적해 데이터 신뢰성과 운영 효율을 높였습니다.

Zeppelin의 익숙한 사용성을 유지하면서 JupyterHub에 기능과 운영 체계를 단계적으로 구현한 내용을 정리했습니다. 대용량 SQL 안정화, GitHub 자동화, 무중단 운영과 추적성 확보가 핵심이었습니다.

라포랩스 MD 전략팀 인턴이 광고 업무 자동화와 매스 세일즈 캠페인 실행을 통해 성장한 경험을 소개했습니다. 데이터 공유와 심리적 안전감이 있는 문화 속에서 오너십과 실행력을 키운 사례를 담았습니다.


Trino는 빠른 실시간 분석과 멀티 소스 조인에 적합하고, Spark는 대규모 배치와 ETL에 유리하다고 설명했습니다. 두 엔진을 역할 분담하는 하이브리드 전략과 Trino의 운영 한계도 함께 정리했습니다.

라포랩스 퀸잇과 팔도감 마케팅 팀의 업무와 문화, AI 활용 방식이 소개되었습니다. 빠른 실험과 데이터 기반 의사결정, 풀 퍼널 경험을 중시하는 팀 분위기를 강조했습니다.


LLM 기반 Text-to-SQL의 오류 유형과 빈도를 정리하고, 기존 수리 방식의 한계를 분석했습니다. 규칙 기반 감지와 LLM 보조 수정을 결합한 MapleRepair의 실무적 효과를 소개했습니다.


Jira 이슈 검색을 더 정교하게 만들기 위한 JQL 활용법을 소개했습니다. 기본 검색을 JQL로 확장하는 방법과 자주 쓰는 예제를 정리했습니다.


Text2SQL이 왜 어려운지 명시적·암묵적 맥락, 사용자 의도, SQL 방언 차이 관점에서 정리했습니다. ERP 데이터 시각화 Agent 맥락에서 실무적으로 고려할 점도 함께 짚었습니다.

AI 에이전트가 표 데이터를 이해하기 어렵다는 문제를 짚고, RAG와 SQL을 결합한 Table Agent 설계를 소개했습니다. 셀 단위 전처리, 도구 호출 루프, 에러 핸들링으로 복잡한 질문 대응력을 높였습니다.


Aurora MySQL에서 Long Query와 긴 트랜잭션이 성능에 미치는 영향을 설명했습니다. 로그, Performance Insights, 스키마 정보를 활용한 모니터링과 개선 방법을 정리했습니다.

AWS Athena로 ELB 액세스 로그를 S3에서 조회하는 방법을 소개했습니다. 테이블 생성, 파티션 프로젝션, IP·기간 조건 조회 예시를 정리했습니다.