VAMS에서 NVIDIA Isaac Lab을 활용한 GPU 가속 로봇 시뮬레이션 훈련
VAMS에 NVIDIA Isaac Lab을 통합해 로봇 자산에서 GPU 가속 RL 훈련과 평가를 직접 실행하는 방법을 소개했습니다. AWS Batch와 Step Functions로 인프라를 자동화하고 자산 계보와 결과 추적성을 강화했습니다.

강화학습 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.
14개 표시
VAMS에 NVIDIA Isaac Lab을 통합해 로봇 자산에서 GPU 가속 RL 훈련과 평가를 직접 실행하는 방법을 소개했습니다. AWS Batch와 Step Functions로 인프라를 자동화하고 자산 계보와 결과 추적성을 강화했습니다.

ICAIF 2025 현장을 바탕으로 금융 AI의 최신 연구 흐름을 정리했습니다. 카카오뱅크의 쿼리 생성 파이프라인과 답변 가능성 평가, 그리고 신뢰성과 안전성의 중요성을 함께 소개했습니다.
NeurIPS 2025에서 데이터, 추론, 효율성, 벤치마크 한계 등 핵심 트렌드를 정리했습니다. XAI와 인과추론을 통해 AI를 더 신뢰하고 제대로 측정해야 한다는 메시지를 담았습니다.

if(kakao)25에서 카카오모빌리티가 자율주행 AI와 경로탐색, AI 업무 자동화 사례를 공유했습니다. 실서비스 적용과 기술 교류를 함께 강조한 행사 리뷰였습니다.
Reasoning 모델의 개념과 학습 방법, 성능 특징을 정리하고 AI 검색 고도화 방향을 소개했습니다. 질문 특성에 따라 Reasoning과 Non-Reasoning 모델을 선택해 정확도와 속도를 함께 높이는 방안을 다뤘습니다.

토스 광고 노출 과정과 추천 시스템의 전체 흐름을 ML 관점에서 정리했습니다. Targeting부터 Ranking까지 각 단계별 모델 활용 방식도 소개했습니다.
딥시크와 마누스의 등장으로 중국 오픈소스 LLM 생태계가 빠르게 다원화되고 있음을 정리했습니다. 딥시크는 고성능 개방형 LLM, 마누스는 자율 에이전트라는 서로 다른 방향을 보여주었습니다.
DeepSeek-R1의 구조와 학습 방식, GRPO와 지식 증류의 특징을 OpenAI o1과 비교해 정리했습니다. 비용 절감과 추론 성능 강점, 한국어 적용 시 주의점도 함께 살펴봤습니다.

퍼즐봇과 유저 행동 데이터를 바탕으로 퍼즐 스테이지의 품질을 수치화하는 지표를 설계했습니다.\n폴리싱 효율을 높이기 위해 총 미션 수 구간별 기준을 달리 적용하고 사내 테스트로 검증했습니다.

ASIC floorplan 자동화에 강화학습을 적용해 엔지니어 대비 수행 시간을 크게 줄이고 성능을 개선한 사례를 소개했습니다. standard cell 처리, 분산 학습, 후처리까지 더해 현실적인 배치 자동화 가능성을 확인했습니다.

ASIC floorplan 자동화를 강화학습으로 구현한 장기 프로젝트 결과를 소개했습니다. 엔지니어 대비 수행 시간을 줄이고 PPA 성능도 개선한 사례를 공유했습니다.

SMT 공정의 chip mount planning을 강화학습으로 최적화한 초기 결과를 소개했습니다. 33개 sample 실험과 IPC sample 분석을 통해 적용 가능성과 개선 과제를 확인했습니다.

Dynamics Model을 제어와 시뮬레이션 문제에 활용하는 사례를 소개했습니다. 실제 데이터와 물리 모델을 결합해 sim-to-real gap을 줄이는 가능성을 설명했습니다.

자연어처리의 토픽 모델링을 개인화 추천에 적용하는 방식을 소개했습니다. 사용자 행동 데이터를 바탕으로 관심 주제를 추출해 맞춤형 추천을 구성하는 개념을 설명했습니다.
