음성을 텍스트로
마이크로 말하면 실시간으로 텍스트로 변환됩니다. 회의록 작성, 받아쓰기에 유용합니다.
브라우저 호환성 안내
이 기능은 Chrome, Edge, Safari에서 가장 잘 작동합니다. Firefox는 지원이 제한적입니다.
마이크 버튼을 눌러 시작하세요
텍스트를 직접 수정할 수 있습니다
음성 인식(STT)이란?
음성 인식(Speech to Text, STT)은 사람의 말을 실시간으로 텍스트로 변환하는 기술입니다. 이 도구는 브라우저에 내장된 Web Speech API를 활용하여 별도의 프로그램 설치 없이 음성을 텍스트로 바꿔줍니다. 회의록 작성, 인터뷰 기록, 받아쓰기, 메모 등 키보드 입력이 불편한 상황에서 특히 유용합니다.
주요 기능
- 실시간 변환 - 말하는 즉시 텍스트가 화면에 표시됩니다
- 다국어 지원 - 한국어, 영어, 일본어, 중국어 등 다양한 언어를 인식합니다
- 연속 인식 모드 - 한 번 시작하면 멈출 때까지 계속 인식합니다
- 텍스트 편집 - 인식된 텍스트를 바로 수정하거나 복사할 수 있습니다
- 프라이버시 보장 - 음성 데이터가 이 사이트의 서버로 전송되지 않습니다
사용 방법
- 인식할 언어를 드롭다운에서 선택합니다
- 마이크 버튼을 클릭하여 녹음을 시작합니다
- 브라우저에서 마이크 접근 권한을 허용합니다
- 마이크를 향해 또박또박 말합니다
- 말한 내용이 실시간으로 텍스트로 표시됩니다
- 마이크 버튼을 다시 클릭하면 인식이 중지됩니다
- 결과 텍스트를 복사하거나 편집하여 활용합니다
활용 사례
- 회의록 작성 - 회의 내용을 실시간으로 텍스트로 기록합니다
- 인터뷰 기록 - 인터뷰 내용을 받아쓰기 형태로 빠르게 정리합니다
- 강의 필기 - 강의 내용을 들으며 자동으로 텍스트화합니다
- 메모 및 아이디어 기록 - 떠오르는 생각을 말로 빠르게 기록합니다
- 접근성 활용 - 키보드 사용이 어려운 분들이 텍스트를 입력할 수 있습니다
팁과 주의사항
- 조용한 환경에서 사용하면 인식 정확도가 크게 향상됩니다
- 마이크와 입 사이의 거리를 15-30cm 정도로 유지하세요
- 너무 빠르게 말하면 인식률이 떨어질 수 있으니 적당한 속도로 말하세요
- 외부 마이크(헤드셋, USB 마이크 등)를 사용하면 더 좋은 결과를 얻을 수 있습니다
- 긴 문장보다 적당한 길이의 문장으로 끊어 말하면 정확도가 높아집니다
자주 묻는 질문
Q: 어떤 브라우저를 사용해야 하나요?
Chrome과 Edge에서 가장 잘 작동합니다. Safari도 지원되지만 일부 기능이 제한될 수 있습니다. Firefox는 현재 Web Speech API 지원이 불완전합니다.
Q: 인식 정확도를 높이려면 어떻게 해야 하나요?
조용한 환경에서 마이크에 가까이 대고 또박또박 말하세요. 배경 소음을 최소화하고, 외부 마이크를 사용하면 정확도가 크게 향상됩니다. 전문 용어가 많은 경우 천천히 발음하는 것이 도움됩니다.
Q: 음성 데이터가 서버로 전송되나요?
이 사이트의 서버로는 음성 데이터가 전송되지 않습니다. 다만 Web Speech API는 브라우저에 따라 Google이나 Apple의 클라우드 음성 인식 서비스를 활용할 수 있습니다.
Q: 오프라인에서도 작동하나요?
대부분의 브라우저는 음성 인식을 위해 인터넷 연결이 필요합니다. 일부 최신 안드로이드 기기에서는 오프라인 음성 인식이 가능하지만, PC 환경에서는 일반적으로 온라인 상태여야 합니다.
Q: 마이크 권한을 허용했는데도 작동하지 않아요
브라우저 주소창 왼쪽의 자물쇠 아이콘을 클릭하여 마이크 권한이 '허용'으로 설정되었는지 확인하세요. 다른 앱이 마이크를 사용 중이라면 해당 앱을 종료한 후 다시 시도해보세요.
Q: 특수 문자나 숫자도 인식되나요?
기본적으로 음성 인식은 일반 텍스트를 출력합니다. 숫자는 "삼십이"처럼 말하면 텍스트로, 문맥에 따라 "32"로 변환될 수 있습니다. 정확한 특수 문자 입력이 필요하면 텍스트를 수동으로 편집하세요.
Q: 인식 도중에 텍스트가 바뀌는 것은 왜 그런가요?
음성 인식 엔진은 실시간으로 문맥을 분석하면서 결과를 수정합니다. 처음에 임시 결과가 표시되고, 문장이 진행되면서 더 정확한 결과로 갱신되는 것이 정상입니다.
Q: 여러 사람의 목소리도 구분할 수 있나요?
Web Speech API는 화자 분리 기능을 지원하지 않습니다. 여러 사람이 동시에 말하면 정확도가 떨어지므로, 한 사람씩 차례로 말하는 것이 좋습니다.
Q: 인식 결과를 파일로 저장할 수 있나요?
인식된 텍스트를 복사(Ctrl+C)하여 메모장, 워드 등에 붙여넣기 하면 됩니다. 이 도구 자체에서 파일 다운로드 기능은 제공하지 않지만, 복사 기능을 통해 간편하게 내보낼 수 있습니다.
Q: 모바일에서도 사용할 수 있나요?
스마트폰에서도 Chrome, Safari 등 지원 브라우저를 통해 사용 가능합니다. 모바일 기기의 내장 마이크를 사용하므로 별도 장비 없이 바로 이용할 수 있습니다.