[22. 9. 22] AWS Sagemaker Immersion Day 워크샵 참관기
SageMaker Immersion Day에서 MLOps와 통합 ML 개발 환경을 체험한 워크샵 후기를 소개했습니다. 모델 구축, 튜닝, 배포까지의 흐름과 실무 적용 가능성을 살펴보았습니다.
MLOps 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
20개 표시
SageMaker Immersion Day에서 MLOps와 통합 ML 개발 환경을 체험한 워크샵 후기를 소개했습니다. 모델 구축, 튜닝, 배포까지의 흐름과 실무 적용 가능성을 살펴보았습니다.
Kubernetes 환경에 LLM 서빙 최적화 기술을 도입하며 발생한 충돌과 해결 과정을 공유했습니다. Istio, 스케줄러, Pod 보호 정책과의 실전 문제를 진단한 사례입니다.
업스테이지 컨소시엄이 정부 독자 AI 모델 1차수 평가를 통과한 과정을 소개했습니다. 래블업과의 협업으로 인프라를 최적화하고 학습 효율과 장애 대응을 크게 개선했습니다.

여기어때 현장실습생 4명의 직무 경험과 프로젝트를 소개했습니다. 각 직무에서 필요한 역량과 실무 성장을 함께 정리했습니다.
업스테이지와 래블업이 독자 AI 파운데이션 모델 1차수 평가 통과 과정을 공유했습니다. 대규모 GPU 인프라 운영과 학습 최적화, 자동 복구 체계가 핵심이었습니다.

MLOps는 모델을 안정적으로 운영하기 위한 공정이며, 생성형 AI 시대에는 LLMOps와 AgentOps로 확장되고 있습니다. 조직은 도구보다 운영 루프와 책임 경계를 먼저 설계해야 했습니다.
Event-driven MLOps와 Omni-Evaluator 구조를 소개한 세션입니다. 메시지 기반 오케스트레이션으로 확장성과 느슨한 결합을 확보한 점이 핵심입니다.
OpenRTB 기반 광고 플랫폼에서 수익 최적화를 위해 휴리스틱, MAB, GMM을 단계적으로 진화시켰습니다. AWS MLOps와 이상 탐지로 실시간 보정까지 연결해 광고 매출 효율을 높였습니다.
AI 규제와 윤리를 개발 실무의 핵심 경쟁력으로 정리했습니다. 한국 AI 기본법과 글로벌 규제 동향, 윤리 도구 활용 방안을 함께 살펴봤습니다.

배송 완료 사진에서 퍼플 박스와 종이봉투를 탐지해 수기 검수 대상을 줄인 사례를 소개했습니다. 데이터 중심 학습과 라벨 개선 반복으로 성능을 높이고 검수 비용을 93% 절감했습니다.

AI플랫폼 2.0에서 LLMOps를 지원하기 위한 운영 과제와 대응 방안을 정리했습니다. Studio, SDK, API Gateway, Labs를 중심으로 프롬프트 관리와 관측성, 보안을 강화했습니다.
AI 개발과 실서비스 적용을 위해 MLOps 기반 시스템 구축 필요성을 다뤘습니다. Kubeflow와 MLflow 활용을 주제로 하지만 본문 정보는 제한적입니다.
토스가 Feature Store와 Trainkit으로 ML 학습·서빙 파이프라인을 표준화한 사례를 소개했습니다. 재사용성, 재현성, skew 해소를 통해 운영 효율을 높인 점이 핵심입니다.

Two-Tower 모델로 추천시스템의 후보 검색 단계와 학습 방식을 개선한 적용 사례를 다루었습니다. In-Batch Sampled SoftMax, LogQ Correction, ScaNN 활용과 운영 모니터링까지 함께 소개했습니다.

Ray를 활용해 GPU Util 100% 배치 처리와 확장 가능한 모델 서빙 아키텍처를 소개했습니다. Ray Serve와 vLLM 기반 LLM 추론 파이프라인 및 운영 사례도 다뤘습니다.
시계열 분석용 AI 모델 개발에서 전처리와 훈련 자동화를 위한 MLOps 파이프라인 구축 경험을 소개했습니다. 상세 본문은 확인되지 않아 핵심 주제만 파악할 수 있었습니다.
공공기관 폐쇄망에서 K8s 기반 AI 플랫폼을 안전하게 운영하기 위한 네트워크 구조를 설계했습니다.\nDMZ, HAProxy, WireGuard와 오프라인 배포 자동화를 조합해 내부망 보호와 외부 접속을 함께 만족했습니다.

우아한형제들 기술블로그를 엮은 두 번째 책 “요즘 우아한 AI 개발”을 소개했습니다. AI·데이터·로봇의 실무 적용 사례와 구성 내용을 함께 담았습니다.
Kubeflow의 개념을 소개하는 글입니다. MLOps 관점에서 Kubeflow가 무엇인지 간단히 안내했습니다.
![[MLOPS] Kubeflow란?](https://blog.bespinglobal.com/wp-content/uploads/2025/02/다운로드.png)
카카오페이 FDS에 지속 성장하는 ML을 적용해 급변하는 사고 패턴에 대응한 사례를 소개했습니다. 지속적 학습과 자가 적응 피처로 신규 유형 사고 탐지 성능을 높였습니다.