우회로 쓰던 음성 입력이 공식 기능으로 들어왔습니다.
/voice 한 줄이면 됩니다.
Claude Code에서 음성으로 지시하고 싶은 사람들은 이전부터 있었습니다. 그래서 VoiceMode MCP라는 커뮤니티 프로젝트가 나왔습니다. MCP 서버를 설치하고, OpenAI API 키를 따로 발급받고, 음성 인식 엔진을 연결해야 했습니다. 12강에서 다뤘던 MCP 설정 과정을 한 번 더 거치는 셈이라, 쓰고 싶어도 진입장벽이 있었습니다.
2026년 3월, 이 기능이 Claude Code에 공식으로 들어왔습니다. MCP 서버도, 외부 API 키도 필요 없습니다. /voice 한 줄이면 됩니다.
커뮤니티가 우회로 만들어 쓰던 기능이 공식으로 흡수된 케이스.
MCP 설정도, 외부 API 키도 필요 없어졌습니다.
이전 방식 vs 지금
이전에는 VoiceMode MCP를 설치해서 우회했습니다. MCP 서버 등록, OpenAI API 키 발급, 음성 인식 엔진(Whisper) 설정까지 거쳐야 말로 지시할 수 있었습니다. 로컬에서 돌리면 프라이버시는 좋지만, 비개발자가 세팅하기엔 부담이 컸습니다.
공식 보이스 모드는 이 과정을 통째로 건너뜁니다. /voice 입력하면 바로 쓸 수 있고, 끄려면 다시 /voice를 입력하면 됩니다.
쓰는 법
/voice
Plain Text
복사
터미널에 이것만 입력하면 보이스 모드가 켜집니다.
말할 때는 스페이스바를 누른 채로 말하고, 끝나면 뗍니다. 워키토키 방식이라 마이크가 항상 켜져 있지는 않습니다. 주변이 시끄러워도 실수로 엉뚱한 명령이 들어가는 일은 없습니다.
말한 내용은 텍스트로 변환되어 입력 필드에 들어갑니다. Claude가 음성으로 대답해주는 건 아닙니다. 말은 내가 하고, 결과는 텍스트로 읽는 구조입니다.
타이핑과 섞어 쓸 수 있습니다
보이스 모드의 좋은 점은 말과 타이핑을 동시에 쓸 수 있다는 겁니다. 큰 그림은 말로 설명하고, 파일 경로나 변수명처럼 정확해야 하는 부분은 직접 타이핑하면 됩니다.
음성 인식이 src/components/AuthProvider.tsx 같은 경로를 정확하게 잡아내긴 어렵습니다. 이런 부분은 복사해서 붙여넣는 게 낫습니다.
8강에서 다뤘던 지시법, 말로도 같습니다
8강에서 목표 → 조건 → 맥락 → 예시 순서로 지시하면 결과가 좋아진다고 했는데, 보이스 모드에서도 마찬가지입니다. 다만 말로 할 때는 구조를 잡기가 좀 더 어렵습니다.
복잡한 지시는 두 번에 나눠서 하면 편합니다. 먼저 말로 큰 방향을 설명하고, 세부 조건은 타이핑으로 추가하는 식입니다. "매출 보고서 만들어줘, 이번 달 거"라고 말한 다음, 형식이나 조건을 키보드로 덧붙이면 됩니다.
15강 회의록 워크플로우가 더 편해집니다
15강에서 회의 녹음을 텍스트로 변환하고, Claude Code에게 회의록 정리를 시키는 워크플로우를 다뤠습니다. 그때는 지시를 전부 타이핑해야 했는데, 보이스 모드를 쓰면 회의가 끝나자마자 말로 바로 지시를 넣을 수 있습니다.
"방금 회의 녹음 파일 meeting-0313.txt 읽고, 결정 사항이랑 다음 단계 위주로 정리해줘" — 이 정도는 말이 타이핑보다 빠릅니다.
누가 쓸 수 있나
현재 Pro, Max, Team, Enterprise 플랜 사용자에게 점진적으로 열리고 있습니다. 3강에서 다뤠던 구독 플랜 중 하나를 쓰고 있다면 대상입니다. 계정에 기능이 활성화되면 Claude Code를 열 때 환영 화면에 안내가 뜋니다.
아직 안 보인다면 기다리면 됩니다. 3월 초 기준 약 5%의 사용자에게 열렸고, 몇 주에 걸쳐 확대 중입니다. 추가 비용은 없고, 기존 구독의 사용량 한도 안에서 소진됩니다.
아직 영어만 됩니다
현재 보이스 모드의 음성 인식은 영어 전용입니다. 한국어로 말하면 인식이 안 되거나, 영어로 엉뚱하게 변환됩니다. 직접 테스트해봐도 한국어는 제대로 잡히지 않습니다. 한국어뿐 아니라 프랑스어, 독일어, 터키어 등 영어 외 언어 사용자들이 같은 문제를 겪고 있고, GitHub에 다국어 지원 요청 이슈가 올라와 있지만 아직 Anthropic의 공식 답변은 없습니다.
그래서 한국어 사용자에게는 지금 당장 쓰기 어렵습니다. 영어로 지시하는 게 익숙하다면 바로 써볼 수 있지만, 한국어로 쓰고 싶다면 지원이 추가될 때까지 기다려야 합니다. 맥이나 윈도우의 OS 음성 입력(맥: 받아쓰기, 윈도우: Win+H)은 한국어를 지원하니까, 그쪽을 대신 쓰는 방법도 있습니다.
그 외 몇 가지: 주변이 시끄러우면 인식률이 떨어질 수 있고, 전문 용어나 고유명사는 잘못 변환될 수 있습니다. 타이핑으로 수정하면 됩니다.
이전 VoiceMode MCP가 제공하던 양방향 음성 대화(Claude가 말로 대답)는 공식 보이스 모드에는 아직 없습니다. Claude의 응답을 음성으로도 듣고 싶다면, 당분간은 VoiceMode MCP를 병행하는 방법이 남아 있습니다.
Claude.ai에도 보이스 모드가 있습니다
참고로, 터미널이 아니라 웹(claude.ai)이나 모바일 앱에서도 보이스 모드를 쓸 수 있습니다. 이쪽은 Claude Code와 방식이 다릅니다. 실시간 양방향 음성 대화가 가능해서, Claude가 음성으로 대답해줍니다. 현재 영어만 지원됩니다.
웹에서는 채팅창 오른쪽 아래 음파 아이콘, 모바일 앱에서는 입력 필드 옆 음파 아이콘을 누르면 됩니다. 핸즈프리 모드(계속 듣기)와 푸시투톡 모드(버튼 누를 때만 듣기)를 선택할 수 있습니다.
Claude Code 보이스 모드가 "말 → 텍스트 → 실행"이라면, Claude.ai 보이스 모드는 "말 → 말"에 가깝습니다. 파일 작업이나 자동화가 목적이면 Claude Code, 가벼운 질문이나 브레인스토밍이면 Claude.ai가 자연스럽습니다.
