
데브옵스
분산 트레이닝 관점에서의 AWS 인터커넥트 기술 소개 – AWS의 인터커넥트 기반 기술, ENI 소개
두줄요약
AWS EC2의 ENI와 네트워크 카드 구조, EFA 할당 규칙을 설명했습니다. p5와 p6 인스턴스의 분산 트레이닝용 네트워크 구성과 운영 포인트를 정리했습니다.
핵심 내용
- AWS EC2에서 ENI가 가상 네트워크 인터페이스로 동작하는 구조
- 네트워크 카드와 ENI의 계층 분리, NetworkCardIndex와 DeviceIndex의 의미
- EFA with ENA, EFA-only, Primary ENI, Secondary ENI의 유형과 할당 규칙
- p5.48xlarge, p6-b300.48xlarge의 실제 EFA 구성과 대역폭 설계
적용해볼 점
- 고성능 GPU 인스턴스에서 관리 트래픽과 HPC 트래픽 분리
- 인스턴스 타입별 ENI 수, 카드당 대역폭, EFA 구성 규칙 확인
- CloudFormation, Terraform, ParallelCluster로 네트워크 구성 자동화
