필터 1
(Airflow #1) 데이터 엔지니어들이 선택하는 Apache Airflow 소개
현대자동차그룹
· 2025년 2월 16일
기타

(Airflow #1) 데이터 엔지니어들이 선택하는 Apache Airflow 소개

X

#Airflow
26005분
데이터카탈로그 PM이 ‘데이터 디스커버리’라는 가치를 풀어내는 방법
우아한 형제들
· 2025년 2월 13일
기타

데이터카탈로그 PM이 ‘데이터 디스커버리’라는 가치를 풀어내는 방법

데이터카탈로그를 통해 데이터 디스커버리를 검색, 미리보기, 리니지의 3단계로 풀어낸 사례를 소개했습니다. 데이터 찾기뿐 아니라 이해와 신뢰 확보까지 연결하는 방향을 제시했습니다.

#검색#데이터베이스
46005분
사용자에서 데이터 엔지니어로, 쏘카 온보딩 회고
쏘카
· 2025년 1월 16일
백엔드

사용자에서 데이터 엔지니어로, 쏘카 온보딩 회고

쏘카 데이터 엔지니어링팀 합류 후 온보딩과 프로젝트, 온콜 경험을 회고한 글입니다. 체계적인 문서화와 협업 문화가 실무 적응에 큰 도움이 되었다고 정리했습니다.

#Kubernetes#Airflow
29005분
[DAN 24] 검색과 피드의 만남: LLM으로 완성하는 초개인화 서비스 ② 사용자 검색 의도 세분화
네이버 D2
· 2025년 1월 2일
AI

[DAN 24] 검색과 피드의 만남: LLM으로 완성하는 초개인화 서비스 ② 사용자 검색 의도 세분화

검색어와 문서를 함께 고려해 사용자 의도를 세분화하는 LLM 기반 모델을 설계했습니다. 이를 통해 추천의 맥락 정확도를 높이고 CTR도 개선했습니다.

#LLM#검색
35005분
FDS에 지속 성장하는 ML 모델 적용 이야기
카카오페이
· 2024년 12월 26일
AI

FDS에 지속 성장하는 ML 모델 적용 이야기

카카오페이 FDS에 지속 성장하는 ML을 적용해 급변하는 사고 패턴에 대응한 사례를 소개했습니다. 지속적 학습과 자가 적응 피처로 신규 유형 사고 탐지 성능을 높였습니다.

#ML#MLOps
43005분
당근페이 재무 결산 사례로 보는 백엔드와 데이터의 만남
당근마켓
· 2024년 12월 19일
백엔드

당근페이 재무 결산 사례로 보는 백엔드와 데이터의 만남

매월 반복되던 재무 결산을 Spring Batch와 코드 중심 구조에서 Airflow와 dbt 기반 데이터 파이프라인으로 전환했습니다. SQL 수정만으로 결산 대응이 가능해져 유연성과 가시성을 높였습니다.

#Airflow#dbt
41005분
Airflow로 펀드 배치 시스템 완벽 구축하기
카카오뱅크
· 2024년 12월 19일
데브옵스

Airflow로 펀드 배치 시스템 완벽 구축하기

카카오뱅크가 퍼블릭 클라우드에 펀드 시스템을 구축한 사례를 소개했습니다. Airflow로 금융 규제를 충족하며 배치 작업을 효율화한 과정을 다뤘습니다.

#Airflow#batch
27005분
입수는 Datalake로! (feat. Iceberg)
토스
· 2024년 10월 29일
백엔드

입수는 Datalake로! (feat. Iceberg)

Iceberg를 DataLake에 도입해 Kafka·CDC 입수와 테이블 운영을 더 효율적으로 개선했습니다. 또한 자동화된 모니터링과 유지보수로 실시간 조회와 성능 최적화를 함께 달성했습니다.

#Iceberg#Spark
34005분
Spark Streaming을 활용한 파생 데이터 생성 시간 감축 사례
SK플래닛
· 2024년 10월 23일
백엔드

Spark Streaming을 활용한 파생 데이터 생성 시간 감축 사례

Hive 배치 기반 파생 데이터 생성 지연 문제를 Spark Streaming으로 실시간 처리하도록 전환한 사례를 소개했습니다. Kafka 오프셋과 처리량, LAG 모니터링으로 안정적인 운영 방법도 함께 설명했습니다.

#Spark Streaming#Kafka
38005분