

현대오토에버의 Amazon Bedrock으로 구축한 빅데이터 클러스터 장애 대응 자동화 에이전트 구축기
LangGraph와 Amazon Bedrock, OpenSearch를 결합해 빅데이터 클러스터 장애 대응을 자동화했습니다. 병렬 RCA와 반증 검증으로 진단 품질을 높이고 MTTA를 줄였습니다.


LangGraph와 Amazon Bedrock, OpenSearch를 결합해 빅데이터 클러스터 장애 대응을 자동화했습니다. 병렬 RCA와 반증 검증으로 진단 품질을 높이고 MTTA를 줄였습니다.

팀챗을 공용 인터페이스로 삼아 AI를 조직의 실행 흐름에 연결한 구축 사례를 소개했습니다.\nClaude Code 위에 상태머신, K8s 실행기, 메모리 계층을 얹어 보안 대응과 운영 점검까지 확장했습니다.

AI Native 레포를 조직 전체가 쓰는 실행 harness로 확장한 hollon-ai 구축기를 소개했습니다. 팀챗, Kubernetes, 상태머신, 메모리 계층으로 요청부터 복구까지 같은 흐름에 묶었습니다.

채널톡 메인 백엔드 서버의 CI 병목을 단계적으로 분해해 개선한 과정을 정리했습니다. 공유 상태 제거, prepare 분리, 동적 큐와 캐시로 실행 시간을 크게 줄였습니다.

AI가 코드를 빠르게 만들수록 CI 병목과 피드백 속도가 더 중요해졌습니다. 채널톡은 공유 상태 제거와 캐시, 동적 큐로 메인 백엔드 CI를 36.6분에서 15분대까지 줄였습니다.


Aurora PostgreSQL에서 CloudWatch Database Insights로 실행 계획을 비교해 성능 저하 원인을 분석했습니다. 인덱스 삭제와 work_mem 부족으로 인한 병목을 찾아 최적화하는 방법을 소개했습니다.

고객 타게팅 정교화를 위해 주문·쿠폰·장바구니 데이터를 ClickHouse 기반 OLAP로 옮긴 과정을 정리했습니다. 다만 ReplacingMergeTree, JOIN, Point Query 한계를 보완하려고 하이브리드 아키텍처를 함께 도입했습니다.

Amazon RDS for PostgreSQL에서 시계열 데이터 수집을 빠르게 만드는 파티셔닝 방법을 정리했습니다. 벤치마크로 단일 테이블 대비 수집 시간이 크게 줄고, 인덱스 수가 성능에 미치는 영향도 확인했습니다.


Amazon RDS for PostgreSQL에서 시계열 테이블을 고성능으로 설계하는 방법을 설명했습니다. 데이터 타입 최적화, BRIN 인덱스, 일별 파티셔닝으로 수집 성능을 크게 높였습니다.


AWS DMS의 Data Resync 기능으로 마이그레이션 중 데이터 불일치를 자동으로 수정하는 방법을 소개했습니다. Full load와 CDC 작업에서의 구성 방식과 운영 시 주의점도 함께 설명했습니다.


PostgreSQL의 JSON/JSONB 기능으로 스키마 유연성과 트랜잭션 무결성을 함께 확보하는 방법을 소개했습니다. CMS 예제를 통해 GIN 인덱스, JSON_TABLE, 전문 검색, AWS 운영 팁까지 정리했습니다.


Aurora PostgreSQL과 RDS PostgreSQL에서 TOAST OID 고갈이 INSERT 지연을 유발하는 원인과 진단 방법을 정리했습니다. 단기 대응과 함께 파티셔닝, 지속 모니터링 같은 장기 대응이 중요하다고 설명했습니다.