[교육환경 AX와 데스크톱 가상화 ②] 데스크톱 가상화로 한정된 AI GPU 자원 효율적으로 배분하기
AI 연구용 GPU가 부족하고 활용률도 낮아 효율적 운영이 필요했습니다. 데스크톱 가상화로 연구 규모에 맞게 나누고 자동 회수해 공정성을 높였습니다.
ML 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
20개 표시
AI 연구용 GPU가 부족하고 활용률도 낮아 효율적 운영이 필요했습니다. 데스크톱 가상화로 연구 규모에 맞게 나누고 자동 회수해 공정성을 높였습니다.
검색 리랭킹의 콜드 스타트와 임베딩 공간 불일치 문제를 안정화 기법으로 해결했습니다. 오프라인과 A/B 테스트에서 성능과 매출 개선도 확인했습니다.

SageMaker Immersion Day에서 MLOps와 통합 ML 개발 환경을 체험한 워크샵 후기를 소개했습니다. 모델 구축, 튜닝, 배포까지의 흐름과 실무 적용 가능성을 살펴보았습니다.
기존 SOFA와 qSOFA의 한계를 짚고, 패혈증 조기 예측을 위한 딥러닝 모델 개발 과정을 소개했습니다. 데이터 확보부터 레이블링, 학습, 임상시험까지의 흐름과 의료 현장 적용 필요성을 설명했습니다.
토스는 2,800만 MAU를 이해하기 위해 이용 패턴 기반 세그먼트 TUES를 만들고 활용했습니다. 이를 통해 성장 전략, 탑라인 분석, 타겟 마케팅을 더 정교하게 수행했습니다.

버추얼 휴먼의 초기 한계였던 불쾌한 골짜기와 높은 비용 문제를 사이버가수 아담 사례로 설명했습니다. AI 기술 발전으로 제작 효율이 높아지며 의료 등 다양한 분야로 활용이 넓어질 가능성을 짚었습니다.
얼굴인식 기술의 발전사를 60년 흐름으로 정리하고 페이스페이의 결제 적용을 소개했습니다. 에지·클라우드 구조, 보안, 안티스푸핑, 성능 검증과 서비스 성장도 함께 다뤘습니다.

AWS와 NVIDIA Isaac으로 Physical AI를 시뮬레이션과 실세계 학습으로 나눠 가속화하는 아키텍처를 소개했습니다. 엣지 배포와 운영 데이터 재학습을 통해 sim-to-real gap을 줄이는 방법을 설명했습니다.

Google for Developers의 6월 첫째 주 주요 업데이트를 정리한 소식입니다. Gemma, Gemini, Android, Firebase 관련 새 문서와 사례를 한눈에 소개했습니다.
사람이 자연스럽게 듣고 이해하는 오디오 전송을 목표로 하는 AI/ML 물리계층 접근을 소개했습니다. 비트 정확도보다 체감 품질을 우선하는 방향을 다뤘습니다.
Google for Developers의 5월 셋째 주 주요 업데이트를 정리한 글입니다. AI, Android, Telecom, Flutter 관련 새 소식과 번역 안내를 함께 소개했습니다.
AWS EFA 환경에서 NCCL이 GPU 간 집합 통신을 어떻게 최적화하는지 소개했습니다. 기본 설정과 플러그인 구조, 알고리즘 선택 원리까지 함께 정리했습니다.

한국 ICT 리더들이 어피닛 인도 사무실을 방문해 SMS 기반 신용평가와 포용 금융 사례를 살펴봤습니다. 데이터·AI를 활용한 금융 소외 해소와 한-인도 협력 가능성을 논의했습니다.
Raspberry Pi 5에서 EfficientDet-Lite0와 TensorFlow Lite로 실시간 객체 탐지하는 샘플 코드를 소개했습니다. 입력 타입 분기, XNNPACK 가속, FPS 측정까지 포함한 엣지 AI 구현 흐름을 정리했습니다.

검색 오타 보정의 기존 로그 기반 방식 한계를 줄이기 위해 번역 모델과 멀티태스크 학습을 도입했습니다. 검색 실패율을 낮추고 CTR을 유지하는 성과와 함께 후속 개선 과제도 정리했습니다.
Google for Developers의 4월 둘째 주 주요 개발자 업데이트를 소개했습니다. TorchTPU, Android XR, Flutter 관련 소식을 한눈에 정리했습니다.
AI 스타트업과 연구 조직의 GPU 수요 증가에 맞춰, 자체 구매보다 서버호스팅이 유리한 상황을 설명했습니다. AI 학습·렌더링·시뮬레이션처럼 프로젝트형 워크로드에 즉시 쓰는 연산 자원을 제안했습니다.

모바일 메신저용 이미지 캡션 생성을 위해 비자기회귀 디코딩과 지식 증류를 적용했습니다. 캡션 재생성과 다단계 정제로 200~400ms 지연과 실사용 가능한 품질을 달성했습니다.

업스테이지 컨소시엄이 정부 독자 AI 모델 1차수 평가를 통과한 과정을 소개했습니다. 래블업과의 협업으로 인프라를 최적화하고 학습 효율과 장애 대응을 크게 개선했습니다.

FLO가 음악 발견부터 몰입, 팬 경험까지 이어지는 사용자 여정을 확장한 과정을 소개했습니다. 1.2억 곡 라이브러리와 기기 연동, 아티스트 콘텐츠로 청취 경험을 넓혔습니다.