[기술리포트] 클라우드 네이티브 3편 : 장애 도메인과 격리 설계 - 가용성·복원력 강화 전략
멀티 리전이라도 공유 지점이 남으면 장애가 전파될 수 있다는 점을 정리했습니다. 가용성과 복원력을 높이기 위한 격리 설계와 순차 배포 원칙을 설명했습니다.
DNS 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
13개 표시
멀티 리전이라도 공유 지점이 남으면 장애가 전파될 수 있다는 점을 정리했습니다. 가용성과 복원력을 높이기 위한 격리 설계와 순차 배포 원칙을 설명했습니다.
삼성계정은 대규모 트래픽 속에서도 무중단 EKS 업그레이드를 위해 멀티 클러스터와 DNS 기반 트래픽 전환을 적용했습니다. 한 달간 3개 리전, 6개 클러스터를 전환하며 연동 서비스 이슈 없이 업그레이드를 마쳤습니다.

빗썸은 여러 VPC의 AWS Interface Endpoint를 허브 VPC로 통합해 비용과 운영 복잡도를 줄였습니다. Route 53 Resolver와 Transit Gateway를 활용해 DNS 해석과 연결을 중앙화했습니다.
vCluster로 기존 Kubernetes 클러스터 안에 가상 클러스터를 만들고 격리 환경을 구성하는 방법을 다루었습니다. 설치, 배포, 네트워크 동작까지 실습하며 멀티 테넌시 운영 방식을 설명했습니다.

굿리치는 온프레미스 DNS를 Amazon Route 53으로 옮기며 공용·사설 도메인을 통합 관리했습니다. 무중단 전환을 위해 병행 운영과 단계적 이관, 모니터링 검증을 진행했습니다.

웹호스팅 이전 대행의 진행 절차와 사전 확인 사항을 정리했습니다. 지원 사양, 백업 파일, 네임서버 변경 시 유의점을 함께 안내했습니다.
도메인의 기본 개념과 DNS 작동 원리, 계층 구조를 설명했습니다. 또한 도메인 등록 대행사를 통한 도입 방법과 관리 절차를 정리했습니다.
토스증권의 Kafka 데이터센터 이중화 개요를 소개하며 Active-Active와 Stretched Cluster를 비교했습니다. 가용성과 성능을 고려해 Active-Active를 선택하고 DNS와 Offset Sync 전략을 설명했습니다.
네임서버를 왜 바꾸는지와 가비아에서 변경하는 절차를 설명했습니다. 또한 DNS 전파 시간과 레코드 설정 같은 유의 사항도 함께 정리했습니다.
네임서버의 개념과 도메인-IP 연결 역할, 그리고 확인 방법을 정리했습니다. KISA 후이즈와 nslookup으로 조회하고 최소 2개 이상 설정해 안정성을 높일 수 있습니다.
주 도메인 전체를 옮기지 않고, 서브도메인 영역만 Route 53에 위임해 관리하는 방법을 설명했습니다. 기존 네임서버를 유지하면서 신규 서비스용 DNS를 분리 운영할 수 있습니다.

Kubernetes에서 DNS를 어떻게 구성하고 질의가 흐르는지 CoreDNS와 NodeLocal DNSCache 중심으로 설명했습니다. Pod와 Node의 nameserver 차이, Corefile 분석, Autoscaler와 DNS Policy까지 함께 다뤘습니다.
DNS를 서버보다 클라이언트 관점에서 바라보는 글입니다. DNS 보안 이슈를 클라이언트와 서버로 나눠 점검해야 한다고 설명했습니다.
![[여기보기] DNS 점검 요망?! “홍대 어떻게 가요? 뉴진스 하입보이요~”](https://netmarble.engineering/wp-content/uploads/2023/06/dns-client-and-server-security-setting-feature.jpg)