
AI
Node.js 와 OpenAI Realtime Websocket API 로 만드는 Voice Chat 서비스
두줄요약
Node.js Stream으로 OpenAI Realtime Websocket API 음성 채팅 예제를 구성했습니다. 마이크 입력과 스피커 출력을 연결해 실시간 음성 처리를 보여주었습니다.
핵심 내용
- Node.js Stream과 Eventloop를 활용해 OpenAI Realtime Websocket API 기반 음성 채팅 서비스 구현 예시
- 마이크 입력을
input_audio_buffer.append로 전송하고,response.audio.delta응답을 스피커로 재생하는 흐름 ws,mic,@mastra/node-speaker,dotenv조합으로 동작 코드 구성
적용해볼 점
- 맥북 환경에서 마이크·스피커 권한과 헤드폰 사용 고려
- SIGINT 처리로 WebSocket, 마이크, 스피커 종료 정리
- 텍스트 중심 LLM 활용을 넘어 음성 같은 멀티모달 처리 확장 가능성 확인
