음성을 텍스트로

마이크로 말하면 실시간으로 텍스트로 변환됩니다. 회의록 작성, 받아쓰기에 유용합니다.

인식 언어

마이크 버튼을 눌러 시작하세요

변환된 텍스트

텍스트를 직접 수정할 수 있습니다

브라우저 기반 처리 - 음성이 서버로 전송되지 않습니다

음성 인식(STT)이란?

음성 인식(Speech to Text, STT)은 사람의 말을 실시간으로 텍스트로 변환하는 기술입니다. 이 도구는 브라우저에 내장된 Web Speech API를 활용하여 별도의 프로그램 설치 없이 음성을 텍스트로 바꿔줍니다. 회의록 작성, 인터뷰 기록, 받아쓰기, 메모 등 키보드 입력이 불편한 상황에서 특히 유용합니다.

작동 원리

음성 인식은 Web Speech API의 SpeechRecognition 인터페이스를 사용합니다. 마이크로 캡처한 오디오를 브라우저의 음성 인식 엔진(또는 클라우드 서비스)이 처리합니다. 오디오 신호를 음소 단위로 분석하고, 언어 모델을 사용하여 가장 가능성 높은 텍스트로 변환합니다. 실시간(continuous) 모드와 단일 발화 모드를 지원합니다.

음성을 텍스트로

음성 인식(STT)이란?

작동 원리

관련 도구

관련 블로그 글