

QA 엔지니어가 AI로 만든 교육 영상, 25분짜리 인시던트 가이드 탄생기
QA팀이 인시던트 교육을 영상으로 전환하기 위해 AI 툴 조합과 제작 파이프라인을 구축했습니다. 문서보다 전달력과 학습 효과를 높이고 사내 배포까지 연결했습니다.
#영상 편집#TTS
56005분


QA팀이 인시던트 교육을 영상으로 전환하기 위해 AI 툴 조합과 제작 파이프라인을 구축했습니다. 문서보다 전달력과 학습 효과를 높이고 사내 배포까지 연결했습니다.


매경AX는 AWS 서버리스와 생성형 AI로 뉴스 기반 오디오 팟캐스트 자동 생성 시스템을 구축했습니다. 기사 선정부터 검수, TTS까지 자동화해 생산성과 신뢰성을 함께 높였습니다.

상담사처럼 발화하는 TTS를 만들기 위해 한국어 적응, 단일 화자 미세조정, GRPO, DPO를 단계적으로 적용했습니다. 명료도와 상담사향 프로소디를 함께 개선하며 실제 전화 상담에 맞는 음성을 추구했습니다.

상담사처럼 말하는 한국어 TTS를 만들기 위해 데이터 학습, 명료도 개선, 선호도 기반 후학습을 단계적으로 적용했습니다. GRPO와 DPO로 상담사향 프로소디와 화자 일관성을 높인 과정을 소개했습니다.


에이닷 3.1에 한국어 최적화 음성모드를 도입한 내용을 소개했습니다. 스트리밍 응답을 문장 단위로 나눠 TTS 지연을 줄인 구현 방식도 다뤘습니다.

AI 아나운서 개발 과정과 데이터 전처리, TTS·STF 기반 모듈 구성을 소개했습니다. 프로토타입은 높은 품질을 보였지만 데이터 효율성과 전용 TTS 고도화가 과제로 남았습니다.