모든 태그
태그

강화학습 기술 블로그 글

강화학습 태그가 달린 국내 IT 기업 기술 블로그 글을 최신순으로 모았습니다.

전체 14최신 14개 표시
홈에서 필터

최신 게시글

14개 표시

AI

VAMS에서 NVIDIA Isaac Lab을 활용한 GPU 가속 로봇 시뮬레이션 훈련

VAMS에 NVIDIA Isaac Lab을 통합해 로봇 자산에서 GPU 가속 RL 훈련과 평가를 직접 실행하는 방법을 소개했습니다. AWS Batch와 Step Functions로 인프라를 자동화하고 자산 계보와 결과 추적성을 강화했습니다.

#AWS Batch#NVIDIA Isaac Lab#로봇 시뮬레이션
1700

AI

AI in Finance, ICAIF 2025로 보는 금융 AI 연구 동향

ICAIF 2025 현장을 바탕으로 금융 AI의 최신 연구 흐름을 정리했습니다. 카카오뱅크의 쿼리 생성 파이프라인과 답변 가능성 평가, 그리고 신뢰성과 안전성의 중요성을 함께 소개했습니다.

#LLM#강화학습#에이전트 시스템
2500

AI

AI 스케일링과 동질화의 경계: NeurIPS 2025 핵심 트렌드 분석

NeurIPS 2025에서 데이터, 추론, 효율성, 벤치마크 한계 등 핵심 트렌드를 정리했습니다. XAI와 인과추론을 통해 AI를 더 신뢰하고 제대로 측정해야 한다는 메시지를 담았습니다.

#NeurIPS#LLM#강화학습
5800

AI

if(kakao)25 - 카카오모빌리티의 랩업과 리뷰

if(kakao)25에서 카카오모빌리티가 자율주행 AI와 경로탐색, AI 업무 자동화 사례를 공유했습니다. 실서비스 적용과 기술 교류를 함께 강조한 행사 리뷰였습니다.

#자율주행#강화학습#HD MAP
8100

AI

Reasoning 모델 기반의 AI 검색 고도화

Reasoning 모델의 개념과 학습 방법, 성능 특징을 정리하고 AI 검색 고도화 방향을 소개했습니다. 질문 특성에 따라 Reasoning과 Non-Reasoning 모델을 선택해 정확도와 속도를 함께 높이는 방안을 다뤘습니다.

#LLM#검색#ML
5900

AI

토스는 어떻게 광고를 보여줄까? 토스 애즈 ML 톺아보기

토스 광고 노출 과정과 추천 시스템의 전체 흐름을 ML 관점에서 정리했습니다. Targeting부터 Ranking까지 각 단계별 모델 활용 방식도 소개했습니다.

#ML#LLM#추천 시스템
4500

AI

딥시크(DeepSeek)에 이어 마누스(MANUS) 까지 – 다원화되는 중국 오픈소스 LLM 생태계

딥시크와 마누스의 등장으로 중국 오픈소스 LLM 생태계가 빠르게 다원화되고 있음을 정리했습니다. 딥시크는 고성능 개방형 LLM, 마누스는 자율 에이전트라는 서로 다른 방향을 보여주었습니다.

#LLM#오픈소스#Transformer
8000

AI

DeepSeek-R1 기술 분석

DeepSeek-R1의 구조와 학습 방식, GRPO와 지식 증류의 특징을 OpenAI o1과 비교해 정리했습니다. 비용 절감과 추론 성능 강점, 한국어 적용 시 주의점도 함께 살펴봤습니다.

#LLM#ML#강화학습
5700

AI

머신러닝 엔지니어가 퍼즐 게임을 더 재미있게 만드는 방법

퍼즐봇과 유저 행동 데이터를 바탕으로 퍼즐 스테이지의 품질을 수치화하는 지표를 설계했습니다.\n폴리싱 효율을 높이기 위해 총 미션 수 구간별 기준을 달리 적용하고 사내 테스트로 검증했습니다.

#ML#강화학습#퍼즐 게임
1700

AI

주문형 반도체 Floorplan 자동화 (3)

ASIC floorplan 자동화에 강화학습을 적용해 엔지니어 대비 수행 시간을 크게 줄이고 성능을 개선한 사례를 소개했습니다. standard cell 처리, 분산 학습, 후처리까지 더해 현실적인 배치 자동화 가능성을 확인했습니다.

#강화학습#ASIC#floorplan
1600

AI

주문형 반도체 (ASIC) Floorplan 자동화 - Part III

ASIC floorplan 자동화를 강화학습으로 구현한 장기 프로젝트 결과를 소개했습니다. 엔지니어 대비 수행 시간을 줄이고 PPA 성능도 개선한 사례를 공유했습니다.

#강화학습#ASIC#반도체 설계
1600

AI

강화학습을 이용한 SMT 공정의 Chip Mount Planning 최적화

SMT 공정의 chip mount planning을 강화학습으로 최적화한 초기 결과를 소개했습니다. 33개 sample 실험과 IPC sample 분석을 통해 적용 가능성과 개선 과제를 확인했습니다.

#강화학습#최적화#ML
700

AI

Dynamics Model로 무엇을 할 수 있을까?

Dynamics Model을 제어와 시뮬레이션 문제에 활용하는 사례를 소개했습니다. 실제 데이터와 물리 모델을 결합해 sim-to-real gap을 줄이는 가능성을 설명했습니다.

#LLM#ML#강화학습
500

AI

자연어처리 모델을 활용한 개인화 추천시스템

자연어처리의 토픽 모델링을 개인화 추천에 적용하는 방식을 소개했습니다. 사용자 행동 데이터를 바탕으로 관심 주제를 추출해 맞춤형 추천을 구성하는 개념을 설명했습니다.

#NLP#추천시스템#토픽 모델링
1800