목록 보기
Node.js 와 OpenAI Realtime Websocket API 로 만드는 Voice Chat 서비스
AI

Node.js 와 OpenAI Realtime Websocket API 로 만드는 Voice Chat 서비스

데보션
데보션
2025년 7월 30일

두줄요약

Node.js Stream으로 OpenAI Realtime Websocket API 음성 채팅 예제를 구성했습니다. 마이크 입력과 스피커 출력을 연결해 실시간 음성 처리를 보여주었습니다.

핵심 내용

  • Node.js Stream과 Eventloop를 활용해 OpenAI Realtime Websocket API 기반 음성 채팅 서비스 구현 예시
  • 마이크 입력을 input_audio_buffer.append로 전송하고, response.audio.delta 응답을 스피커로 재생하는 흐름
  • ws, mic, @mastra/node-speaker, dotenv 조합으로 동작 코드 구성

적용해볼 점

  • 맥북 환경에서 마이크·스피커 권한과 헤드폰 사용 고려
  • SIGINT 처리로 WebSocket, 마이크, 스피커 종료 정리
  • 텍스트 중심 LLM 활용을 넘어 음성 같은 멀티모달 처리 확장 가능성 확인

댓글 0

댓글을 작성하려면 로그인이 필요합니다.

댓글을 불러오는 중...