음성을 텍스트로

마이크로 말하면 실시간으로 텍스트로 변환됩니다. 회의록 작성, 받아쓰기에 유용합니다.

마이크 버튼을 눌러 시작하세요

텍스트를 직접 수정할 수 있습니다

브라우저 기반 처리 - 음성이 서버로 전송되지 않습니다

음성 인식(STT)이란?

음성 인식(Speech to Text, STT)은 사람의 말을 실시간으로 텍스트로 변환하는 기술입니다. 이 도구는 브라우저에 내장된 Web Speech API를 활용하여 별도의 프로그램 설치 없이 음성을 텍스트로 바꿔줍니다. 회의록 작성, 인터뷰 기록, 받아쓰기, 메모 등 키보드 입력이 불편한 상황에서 특히 유용합니다.

주요 기능

  • 실시간 변환 - 말하는 즉시 텍스트가 화면에 표시됩니다
  • 다국어 지원 - 한국어, 영어, 일본어, 중국어 등 다양한 언어를 인식합니다
  • 연속 인식 모드 - 한 번 시작하면 멈출 때까지 계속 인식합니다
  • 텍스트 편집 - 인식된 텍스트를 바로 수정하거나 복사할 수 있습니다
  • 프라이버시 보장 - 음성 데이터가 이 사이트의 서버로 전송되지 않습니다

사용 방법

  1. 인식할 언어를 드롭다운에서 선택합니다
  2. 마이크 버튼을 클릭하여 녹음을 시작합니다
  3. 브라우저에서 마이크 접근 권한을 허용합니다
  4. 마이크를 향해 또박또박 말합니다
  5. 말한 내용이 실시간으로 텍스트로 표시됩니다
  6. 마이크 버튼을 다시 클릭하면 인식이 중지됩니다
  7. 결과 텍스트를 복사하거나 편집하여 활용합니다

활용 사례

  • 회의록 작성 - 회의 내용을 실시간으로 텍스트로 기록합니다
  • 인터뷰 기록 - 인터뷰 내용을 받아쓰기 형태로 빠르게 정리합니다
  • 강의 필기 - 강의 내용을 들으며 자동으로 텍스트화합니다
  • 메모 및 아이디어 기록 - 떠오르는 생각을 말로 빠르게 기록합니다
  • 접근성 활용 - 키보드 사용이 어려운 분들이 텍스트를 입력할 수 있습니다

팁과 주의사항

  • 조용한 환경에서 사용하면 인식 정확도가 크게 향상됩니다
  • 마이크와 입 사이의 거리를 15-30cm 정도로 유지하세요
  • 너무 빠르게 말하면 인식률이 떨어질 수 있으니 적당한 속도로 말하세요
  • 외부 마이크(헤드셋, USB 마이크 등)를 사용하면 더 좋은 결과를 얻을 수 있습니다
  • 긴 문장보다 적당한 길이의 문장으로 끊어 말하면 정확도가 높아집니다

자주 묻는 질문

Q: 어떤 브라우저를 사용해야 하나요?

Chrome과 Edge에서 가장 잘 작동합니다. Safari도 지원되지만 일부 기능이 제한될 수 있습니다. Firefox는 현재 Web Speech API 지원이 불완전합니다.

Q: 인식 정확도를 높이려면 어떻게 해야 하나요?

조용한 환경에서 마이크에 가까이 대고 또박또박 말하세요. 배경 소음을 최소화하고, 외부 마이크를 사용하면 정확도가 크게 향상됩니다. 전문 용어가 많은 경우 천천히 발음하는 것이 도움됩니다.

Q: 음성 데이터가 서버로 전송되나요?

이 사이트의 서버로는 음성 데이터가 전송되지 않습니다. 다만 Web Speech API는 브라우저에 따라 Google이나 Apple의 클라우드 음성 인식 서비스를 활용할 수 있습니다.

Q: 오프라인에서도 작동하나요?

대부분의 브라우저는 음성 인식을 위해 인터넷 연결이 필요합니다. 일부 최신 안드로이드 기기에서는 오프라인 음성 인식이 가능하지만, PC 환경에서는 일반적으로 온라인 상태여야 합니다.

Q: 마이크 권한을 허용했는데도 작동하지 않아요

브라우저 주소창 왼쪽의 자물쇠 아이콘을 클릭하여 마이크 권한이 '허용'으로 설정되었는지 확인하세요. 다른 앱이 마이크를 사용 중이라면 해당 앱을 종료한 후 다시 시도해보세요.

Q: 특수 문자나 숫자도 인식되나요?

기본적으로 음성 인식은 일반 텍스트를 출력합니다. 숫자는 "삼십이"처럼 말하면 텍스트로, 문맥에 따라 "32"로 변환될 수 있습니다. 정확한 특수 문자 입력이 필요하면 텍스트를 수동으로 편집하세요.

Q: 인식 도중에 텍스트가 바뀌는 것은 왜 그런가요?

음성 인식 엔진은 실시간으로 문맥을 분석하면서 결과를 수정합니다. 처음에 임시 결과가 표시되고, 문장이 진행되면서 더 정확한 결과로 갱신되는 것이 정상입니다.

Q: 여러 사람의 목소리도 구분할 수 있나요?

Web Speech API는 화자 분리 기능을 지원하지 않습니다. 여러 사람이 동시에 말하면 정확도가 떨어지므로, 한 사람씩 차례로 말하는 것이 좋습니다.

Q: 인식 결과를 파일로 저장할 수 있나요?

인식된 텍스트를 복사(Ctrl+C)하여 메모장, 워드 등에 붙여넣기 하면 됩니다. 이 도구 자체에서 파일 다운로드 기능은 제공하지 않지만, 복사 기능을 통해 간편하게 내보낼 수 있습니다.

Q: 모바일에서도 사용할 수 있나요?

스마트폰에서도 Chrome, Safari 등 지원 브라우저를 통해 사용 가능합니다. 모바일 기기의 내장 마이크를 사용하므로 별도 장비 없이 바로 이용할 수 있습니다.