Velopers 홈

오늘 새 글

0개

오늘 조회수

149회

필터 1

[교육환경 AX와 데스크톱 가상화 ②] 데스크톱 가상화로 한정된 AI GPU 자원 효율적으로 배분하기

· 2026년 7월 1일

데브옵스

[교육환경 AX와 데스크톱 가상화 ②] 데스크톱 가상화로 한정된 AI GPU 자원 효율적으로 배분하기

AI 연구용 GPU가 부족하고 활용률도 낮아 효율적 운영이 필요했습니다. 데스크톱 가상화로 연구 규모에 맞게 나누고 자동 회수해 공정성을 높였습니다.

#ML#GPU

0005분

SNOW의 Automatic Sharding 도입기

· 2026년 6월 23일

SNOW의 Automatic Sharding 도입기

수천 개의 서비스를 위한 GPU 공유와 모델 서빙 최적화를 다룬 Automatic Sharding 도입 사례를 소개했습니다. Manual Sharding의 한계를 넘어 자동 반영과 안정적 배포 전략까지 함께 공유했습니다.

교육환경 AX의 핵심, DaaS·VDI 활용 전략

교육환경의 AX 전환에서 DaaS·VDI의 역할을 정리했습니다. 동일한 GPU 실습 환경과 제로트러스트 보안, 캠퍼스 일괄 관리 방안을 소개했습니다.

[운영가이드] Kubernetes 기반 Fault-Tolerant GPU 클러스터 유지 관리

Kubernetes 기반 GPU 클러스터를 안정적으로 운영하기 위한 유지 관리 방안을 정리했습니다. 자동화, 관측, 스케줄링 통합, 네트워크·보안 분리를 통해 장애 대응과 성능 안정성을 높이는 방법을 소개했습니다.

#Kubernetes#GPU

7005분

· 2026년 6월 1일

[AI인프라] GPU 5만장 시대, AI 인프라 비즈니스 성공 조건

GPU 수량 경쟁보다 풀스택 최적화가 AI 인프라 비즈니스의 핵심이라고 설명했습니다. 운영 효율과 총비용 관점에서 AI NIC와 베어메탈 아키텍처의 중요성을 짚었습니다.

[AI인프라] AI 데이터센터(AIDC)는 무엇이 다른가: GPU 전력과 운영 전환

생성형 AI 확산으로 데이터센터는 고밀도 GPU와 급격한 전력 변동에 대응하는 AIDC로 바뀌었습니다. 전력 품질 모니터링, 액체 냉각, 예측 냉각 같은 운영 전환이 핵심이라고 설명했습니다.

#AIDC#GPU

38005분

· 2026년 4월 21일

HPC를 여행하는 히치하이커를 위한 안내서 Part 2.

Slurm의 내부 구조와 Job 실행 흐름을 설명하며 HPC에서의 자원 관리 방식을 정리했습니다. 또한 대화형 작업, 배치 학습, Job 배열, QOS와 Fairshare 활용법을 실무 예제로 소개했습니다.

#Slurm#HPC

22005분

· 2026년 4월 8일

AI 시대 고성능 GPU, 사야 할까 빌려야 할까?

AI 스타트업과 연구 조직의 GPU 수요 증가에 맞춰, 자체 구매보다 서버호스팅이 유리한 상황을 설명했습니다. AI 학습·렌더링·시뮬레이션처럼 프로젝트형 워크로드에 즉시 쓰는 연산 자원을 제안했습니다.

#GPU#LLM

53005분

· 2026년 3월 31일

[기술동향] 2026 피지컬 AI 확산과 AI 데이터센터(AIDC) 인프라 전망

피지컬 AI를 현장 데이터와 업데이트로 다듬는 운영형 AI로 설명했습니다. AIDC는 GPU뿐 아니라 검증 체계, 스토리지, 전력·냉각까지 함께 설계해야 한다고 정리했습니다.

[트렌드분석] 글로벌 데이터센터의 전력 문제와 AI 인프라 – Megawatt 시대의 도전과제

AI 인프라 경쟁의 중심이 GPU 성능보다 전력 확보 능력으로 이동했다고 설명했습니다. 지역별 전력망과 규제 차이를 바탕으로 데이터센터 투자와 운영의 핵심 과제를 정리했습니다.

#AI인프라#GPU

38005분

VAMS에서 NVIDIA Isaac Lab을 활용한 GPU 가속 로봇 시뮬레이션 훈련

· 2026년 2월 12일

VAMS에서 NVIDIA Isaac Lab을 활용한 GPU 가속 로봇 시뮬레이션 훈련

VAMS에 NVIDIA Isaac Lab을 통합해 로봇 자산에서 GPU 가속 RL 훈련과 평가를 직접 실행하는 방법을 소개했습니다. AWS Batch와 Step Functions로 인프라를 자동화하고 자산 계보와 결과 추적성을 강화했습니다.

#AWS Batch#NVIDIA Isaac Lab

16005분

Amazon EKS에서 Friendli Container로 LLM 추론 최적화하기

· 2026년 2월 6일

데브옵스

Amazon EKS에서 Friendli Container로 LLM 추론 최적화하기

Amazon EKS에 Friendli Container Add-on을 적용해 LLM 추론 성능과 비용 효율을 높이는 방법을 소개했습니다. 클러스터 준비부터 배포, 검증, 정리까지의 절차를 단계별로 안내했습니다.

#Amazon EKS#Kubernetes

43005분