HPC를 여행하는 히치하이커를 위한 안내서 Part 3 - 8단계로 완성하는 클러스터
온프레미스 HPC 클러스터를 8단계로 쌓는 순서와 의존성을 정리했습니다. 기본 설정, GPU 스택, 스토리지, 스케줄러, 모니터링, 자동화가 핵심입니다.

Ansible 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
8개 표시
온프레미스 HPC 클러스터를 8단계로 쌓는 순서와 의존성을 정리했습니다. 기본 설정, GPU 스택, 스토리지, 스케줄러, 모니터링, 자동화가 핵심입니다.

Nginx 설정을 공통화하고 멀티사이트 구조로 통합한 인프라 개선 사례를 소개했습니다. Promtail과 Loki, Ansible을 연계해 로그 수집과 배포 자동화까지 확장했습니다.

IaC로 정의한 Kubernetes 클러스터를 Mermaid Chart로 시각화하는 방법을 소개했습니다. LLM을 활용해 다이어그램 코드를 만들고 편집·공유하는 흐름도 함께 다뤘습니다.

Vault와 Kubernetes를 활용해 SSH 로그인 인증을 구성하는 절차를 소개했습니다. 토큰 서명, 만료, 폐기 검증까지 포함해 운영 흐름을 정리했습니다.
Vault와 Kubernetes로 SSH 로그인 인증 체계를 구성하는 방법을 정리했습니다. 토큰 기반 서명, 인증서 만료, 폐기와 재발급 흐름까지 함께 설명했습니다.

AWX를 활용해 배포 자동화 툴을 구축한 사례와 구성 요소를 정리했습니다. 또한 Kubernetes 연동, 무중단 배포, 운영 시 고려사항까지 함께 살펴봤습니다.
CDH 의존을 줄이기 위해 HitBase 전환용 관리 도구 HBH를 개발한 과정을 공유했습니다. 설치 자동화, 프로세스 제어, 잡 실행, 설정 관리, 모니터링 기능을 단계적으로 구현했습니다.

Rundeck과 Ansible로 서버 작업을 자동화하고 권한을 분리한 사례를 소개했습니다. 수천 대 서버 환경에서 반복 작업과 직접 접근 위험을 줄이고 운영 신뢰성을 높였습니다.
