기억에 대해서

기억에 대해서
AI 세션이 많아지면서 무엇을 저장할지가 아니라 어떻게 다시 꺼낼지가 중요한 병목으로 다뤄졌습니다. 회상용 레퍼런스를 여섯 축으로 남기면 검색보다 재인식이 쉬워진다는 관점을 제시했습니다.
#LLM#RAG
16005분

AI 세션이 많아지면서 무엇을 저장할지가 아니라 어떻게 다시 꺼낼지가 중요한 병목으로 다뤄졌습니다. 회상용 레퍼런스를 여섯 축으로 남기면 검색보다 재인식이 쉬워진다는 관점을 제시했습니다.
토스 Data Architect의 커리어와 데이터 설계 철학을 소개했습니다. 데이터 품질, 속도, AI 이해 가능성을 함께 고려하는 구조화 관점이 핵심입니다.


데이터가 AI의 기반이라는 점을 프로젝트 경험을 바탕으로 정리했습니다. 메타스토어, 중간지 DB, RAG와 Memory를 통한 실험과 앞으로의 방향도 소개했습니다.


분산된 데이터 플랫폼의 메타데이터를 통합 관리하는 DataHub의 개념과 주요 기능을 소개했습니다. 검색, 계보 추적, 거버넌스, 접근 제어 관점에서 활용 포인트를 정리했습니다.


데이터레이크 확산으로 데이터 카탈로그와 거버넌스의 중요성을 설명했습니다. 오픈소스 Datahub의 메타데이터 수집, 검색, 리니지, 연동 기능을 소개했습니다.


데이터카탈로그를 통해 데이터 디스커버리를 검색, 미리보기, 리니지의 3단계로 풀어낸 사례를 소개했습니다. 데이터 찾기뿐 아니라 이해와 신뢰 확보까지 연결하는 방향을 제시했습니다.