
[인사이트] 정전 0.1초의 싸움 — 데이터센터 비상발전기에서는 무슨 일이 벌어질까?
데이터센터 정전 시 UPS와 비상발전기가 전원을 이어가는 원리와 절체 조건을 설명했습니다. 발전기 기동보다 전압·주파수 안정성과 엔지니어의 판단이 더 중요하다고 정리했습니다.

데이터센터 정전 시 UPS와 비상발전기가 전원을 이어가는 원리와 절체 조건을 설명했습니다. 발전기 기동보다 전압·주파수 안정성과 엔지니어의 판단이 더 중요하다고 정리했습니다.

웹, API, 봇을 노리는 최신 외부 공격과 그 대응으로 WAAP의 필요성을 설명했습니다. 엣지 기반 통합 방어로 성능 저하 없이 보안을 강화하는 방향을 제시했습니다.

채널톡 메인 백엔드 서버의 CI 병목을 단계적으로 분해해 개선한 과정을 정리했습니다. 공유 상태 제거, prepare 분리, 동적 큐와 캐시로 실행 시간을 크게 줄였습니다.

AI가 코드를 빠르게 만들수록 CI 병목과 피드백 속도가 더 중요해졌습니다. 채널톡은 공유 상태 제거와 캐시, 동적 큐로 메인 백엔드 CI를 36.6분에서 15분대까지 줄였습니다.
Job 워크로드는 중단에 취약해 EKS 노드그룹 오토스케일링이 어려웠습니다. 이를 해결하기 위해 PodAffinity로 bin-packing을 유도하고, 애노테이션으로 축소 중 종료를 막았습니다.

Jib에서 Buildpacks로 옮긴 뒤 GraalVM Native Image까지 적용해 기동 시간을 11배 단축했습니다. AI로 메타데이터 반복 보완을 자동화해 운영 적용 가능성까지 높였습니다.
Job 워크로드를 위한 EKS Node Group 오토스케일링 적용 과정을 정리한 글입니다. Bin-packing과 강제 종료 방지, kubelet maxPods 조정까지 함께 다뤘습니다.

Apache Flink와 RocksDB 튜닝으로 광고 Frequency Capping 실시간 집계를 7일 구간까지 확장한 사례를 다루었습니다. 세 개의 Flink 앱으로 분리해 병목을 각각 해결하고 Redis 단일 조회 구조로 단순화했습니다.


EFS 유지보수 시 새 서버의 TCP RST가 Security Group Outbound에서 차단되면 NFS I/O가 수분간 멈출 수 있었습니다. mount target에 EC2 SG 대상 All TCP Outbound를 추가하고 tcpdump로 RST 수신 여부를 확인해야 했습니다.

Istio Ambient mode의 요청 흐름을 Envoy config와 트래픽 경로로 단계별로 해부했습니다.\nHBONE, ztunnel, Waypoint가 어떻게 구현되는지 실제 설정 기준으로 설명했습니다.

Istio Ambient mode의 요청 흐름을 Envoy config와 트래픽 경로로 해부했습니다. Gateway, Waypoint, ztunnel이 어떻게 HBONE과 리다이렉션을 구현하는지 정리했습니다.


AWS EC2의 ENI와 네트워크 카드 구조, EFA 할당 규칙을 설명했습니다. p5와 p6 인스턴스의 분산 트레이닝용 네트워크 구성과 운영 포인트를 정리했습니다.