모든 태그
태그

GPU 기술 블로그 글

GPU 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 44최신 20개 표시
홈에서 필터

최신 게시글

20개 표시

데브옵스

[교육환경 AX와 데스크톱 가상화 ②] 데스크톱 가상화로 한정된 AI GPU 자원 효율적으로 배분하기

AI 연구용 GPU가 부족하고 활용률도 낮아 효율적 운영이 필요했습니다. 데스크톱 가상화로 연구 규모에 맞게 나누고 자동 회수해 공정성을 높였습니다.

#ML#GPU#데스크톱 가상화
200

AI

SNOW의 Automatic Sharding 도입기

수천 개의 서비스를 위한 GPU 공유와 모델 서빙 최적화를 다룬 Automatic Sharding 도입 사례를 소개했습니다. Manual Sharding의 한계를 넘어 자동 반영과 안정적 배포 전략까지 함께 공유했습니다.

#GPU#cloud#배포
4100

기타

교육환경 AX의 핵심, DaaS·VDI 활용 전략

교육환경의 AX 전환에서 DaaS·VDI의 역할을 정리했습니다. 동일한 GPU 실습 환경과 제로트러스트 보안, 캠퍼스 일괄 관리 방안을 소개했습니다.

#DaaS#VDI#cloud
2000

데브옵스

[운영가이드] Kubernetes 기반 Fault-Tolerant GPU 클러스터 유지 관리

Kubernetes 기반 GPU 클러스터를 안정적으로 운영하기 위한 유지 관리 방안을 정리했습니다. 자동화, 관측, 스케줄링 통합, 네트워크·보안 분리를 통해 장애 대응과 성능 안정성을 높이는 방법을 소개했습니다.

#Kubernetes#GPU#Slurm
700

AI

[AI인프라] GPU 5만장 시대, AI 인프라 비즈니스 성공 조건

GPU 수량 경쟁보다 풀스택 최적화가 AI 인프라 비즈니스의 핵심이라고 설명했습니다. 운영 효율과 총비용 관점에서 AI NIC와 베어메탈 아키텍처의 중요성을 짚었습니다.

#AI인프라#GPU#Kubernetes
3500

데브옵스

[AI인프라] AI 데이터센터(AIDC)는 무엇이 다른가: GPU 전력과 운영 전환

생성형 AI 확산으로 데이터센터는 고밀도 GPU와 급격한 전력 변동에 대응하는 AIDC로 바뀌었습니다. 전력 품질 모니터링, 액체 냉각, 예측 냉각 같은 운영 전환이 핵심이라고 설명했습니다.

#AIDC#GPU#액체냉각
4000

AI

HPC를 여행하는 히치하이커를 위한 안내서 Part 2.

Slurm의 내부 구조와 Job 실행 흐름을 설명하며 HPC에서의 자원 관리 방식을 정리했습니다. 또한 대화형 작업, 배치 학습, Job 배열, QOS와 Fairshare 활용법을 실무 예제로 소개했습니다.

#Slurm#HPC#cgroup
2300

AI

AI 시대 고성능 GPU, 사야 할까 빌려야 할까?

AI 스타트업과 연구 조직의 GPU 수요 증가에 맞춰, 자체 구매보다 서버호스팅이 유리한 상황을 설명했습니다. AI 학습·렌더링·시뮬레이션처럼 프로젝트형 워크로드에 즉시 쓰는 연산 자원을 제안했습니다.

#GPU#LLM#ML
5400

AI

[기술동향] 2026 피지컬 AI 확산과 AI 데이터센터(AIDC) 인프라 전망

피지컬 AI를 현장 데이터와 업데이트로 다듬는 운영형 AI로 설명했습니다. AIDC는 GPU뿐 아니라 검증 체계, 스토리지, 전력·냉각까지 함께 설계해야 한다고 정리했습니다.

#피지컬 AI#AIDC#GPU
4100

아키텍처

[트렌드분석] 글로벌 데이터센터의 전력 문제와 AI 인프라 – Megawatt 시대의 도전과제

AI 인프라 경쟁의 중심이 GPU 성능보다 전력 확보 능력으로 이동했다고 설명했습니다. 지역별 전력망과 규제 차이를 바탕으로 데이터센터 투자와 운영의 핵심 과제를 정리했습니다.

#AI인프라#GPU#PPA
3800

AI

VAMS에서 NVIDIA Isaac Lab을 활용한 GPU 가속 로봇 시뮬레이션 훈련

VAMS에 NVIDIA Isaac Lab을 통합해 로봇 자산에서 GPU 가속 RL 훈련과 평가를 직접 실행하는 방법을 소개했습니다. AWS Batch와 Step Functions로 인프라를 자동화하고 자산 계보와 결과 추적성을 강화했습니다.

#AWS Batch#NVIDIA Isaac Lab#로봇 시뮬레이션
1700

데브옵스

Amazon EKS에서 Friendli Container로 LLM 추론 최적화하기

Amazon EKS에 Friendli Container Add-on을 적용해 LLM 추론 성능과 비용 효율을 높이는 방법을 소개했습니다. 클러스터 준비부터 배포, 검증, 정리까지의 절차를 단계별로 안내했습니다.

#Amazon EKS#Kubernetes#LLM
4400

기타

[트렌드분석] 데이터센터 자산 전쟁 : 투자 자본이 몰리는 AI 인프라의 현재와 미래

AI 인프라 수요 확대로 데이터센터가 GPU 기반 자산으로 재편되는 흐름을 정리했습니다. 전력, 냉각, PPA, ESS가 수익률을 좌우하는 핵심 변수로 제시했습니다.

#AI인프라#GPU#데이터센터
2900

데브옵스

KubeVirt로 구현하는 GPU VM (3) - PCoIP 연동 및 오프라인 라이센스 서버 설치

KubeVirt GPU VM에 PCoIP Graphics Agent를 연동해 원격 그래픽 가속 환경을 구성했습니다. 또한 Air-Gap 환경용 오프라인 라이선스 서버와 GPU 최적화 설정을 적용했습니다.

#KubeVirt#GPU#PCoIP
3200

데브옵스

KubeVirt로 구현하는 GPU VM (3) - PCoIP 연동 및 오프라인 라이센스 서버 설치

KubeVirt GPU VM에 PCoIP Graphics Agent를 연동해 원격 그래픽 환경을 구축했습니다. 또한 Air-Gap 환경용 오프라인 라이선스 서버를 설치해 내부망에서도 정상 인증되도록 설정했습니다.

#KubeVirt#GPU#PCoIP
3900

기타

[웨비나 후기] AI 데이터센터, 이론을 넘어 실증으로 검증하다

AI 워크로드 확산에 따라 데이터센터 혁신 방향과 실증 사례를 소개했습니다. 고밀도 GPU 인프라를 위한 전력·냉각·네트워크 설계와 운영 기술을 정리했습니다.

#데이터센터#GPU#RAG
1900

프론트엔드

WebGL 활용한 화상회의 배경 블러 처리 개선

화상회의 배경 블러의 성능 병목을 JavaScript 픽셀 순회에서 찾고 WebGL로 전환했습니다. GPU 병렬 처리와 하이브리드 구조로 CPU 사용률을 크게 낮췄습니다.

#WebGL#GPU#Canvas 2D
100

프론트엔드

WebGL 활용한 화상회의 배경 블러 처리 개선

화상회의 배경 블러의 느린 성능을 WebGL과 GPU 병렬 처리로 개선했습니다.\nCPU 병목을 줄여 저사양 기기에서도 부드럽게 동작하도록 만들었습니다.

#WebGL#GPU#Canvas 2D
1100

데브옵스

KubeVirt로 구현하는 GPU VM (2) - Ceph 연동 및 VM 생성

KubeVirt GPU VM을 위해 Ceph CSI와 RBD PVC를 연동하고 OS 이미지를 영구 rootdisk로 구성했습니다. 또한 Multus Bridge 네트워크와 CPU pinning, GPU Passthrough 설정으로 VM을 안정적으로 생성했습니다.

#KubeVirt#Ceph#Kubernetes
5200

데브옵스

KubeVirt로 구현하는 GPU VM (1) - GPU Passthrough 및 Kubevirt 설치

쿠버네티스에서 VM을 관리하기 위한 KubeVirt와 GPU Passthrough 설정 과정을 다루었습니다. vfio-pci 바인딩, GPU Operator, CPU 전용 할당으로 GPU VM 기반을 마련했습니다.

#KubeVirt#GPU#Passthrough
6200