OCR 이미지 텍스트 추출
이미지에서 텍스트를 인식하여 추출합니다.
이미지를 드래그하거나 클릭하여 선택
PNG, JPG, WEBP, BMP 지원
OCR 엔진 로딩 중...
원본 이미지
인식된 텍스트
OCR 텍스트 추출이란?
OCR(Optical Character Recognition, 광학 문자 인식)은 이미지 속 문자를 컴퓨터가 읽을 수 있는 텍스트로 변환하는 기술입니다. 스캔 문서, 사진, 스크린샷 등 다양한 이미지에서 텍스트를 자동으로 추출하여 편집, 검색, 복사할 수 있는 형태로 만들어줍니다. 이 도구는 Tesseract.js 엔진을 기반으로 한국어, 영어, 일본어, 중국어 등 100개 이상의 언어를 지원합니다.
시작하기
- 인식할 언어를 드롭다운에서 선택합니다 (복수 선택 가능)
- 이미지를 드래그하여 업로드하거나 업로드 영역을 클릭합니다
- 언어 데이터 로드 후 자동으로 텍스트 인식이 시작됩니다
- 진행률 바를 통해 처리 상태를 확인합니다
- 인식이 완료되면 결과 텍스트를 확인하고 복사합니다
기능 소개
- 100개 이상의 언어 지원 (한국어, 영어, 일본어, 중국어 등)
- 다국어 동시 인식 가능 (예: 한국어+영어)
- 드래그 앤 드롭 또는 클릭으로 간편한 이미지 업로드
- 인식 진행률 실시간 표시
- 추출된 텍스트 즉시 복사 기능
- 모든 처리가 브라우저 내에서 이루어져 개인정보 보호
주의할 점
- 해상도가 높고 선명한 이미지일수록 인식률이 높아집니다
- 텍스트가 기울어져 있으면 미리 이미지를 회전시켜 주세요
- 배경과 글자 사이 대비가 클수록 인식 정확도가 좋습니다
- 최초 사용 시 언어 데이터 다운로드로 시간이 걸릴 수 있습니다
- 여러 언어가 섞인 문서는 해당 언어들을 모두 선택해 주세요
활용 팁
- 종이 문서를 디지털 텍스트로 변환할 때
- 스크린샷이나 이미지 속 텍스트를 복사해야 할 때
- 외국어 간판이나 메뉴판 텍스트를 추출하여 번역할 때
- PDF나 이미지 형태의 계약서에서 텍스트를 뽑아낼 때
- 강의 자료나 프레젠테이션 이미지에서 내용을 추출할 때
자주 하는 질문
Q: OCR 인식률을 높이려면 어떻게 해야 하나요?
선명하고 대비가 높은 이미지를 사용하세요. 글자가 수평으로 정렬되어 있고, 배경이 깨끗하며, 해상도가 300DPI 이상이면 최적의 결과를 얻을 수 있습니다.
Q: 손글씨도 인식할 수 있나요?
깔끔하고 정자로 쓴 손글씨는 어느 정도 인식 가능하지만, 인쇄된 텍스트에 비해 정확도가 크게 떨어집니다. 필기체나 흘림체는 거의 인식되지 않습니다.
Q: 처리 시간이 왜 오래 걸리나요?
최초 실행 시 선택한 언어의 학습 데이터(10~30MB)를 다운로드해야 합니다. 한 번 다운로드된 데이터는 브라우저에 캐시되어 이후에는 빠르게 처리됩니다.
Q: 여러 언어가 섞인 이미지는 어떻게 처리하나요?
언어 선택 드롭다운에서 '한국어+영어'처럼 여러 언어를 동시에 선택하면 혼합 텍스트도 인식할 수 있습니다. 다만 언어를 많이 선택할수록 처리 시간이 늘어납니다.
Q: 이미지 데이터가 서버로 전송되나요?
아닙니다. 모든 OCR 처리는 브라우저 내 Tesseract.js 엔진에서 로컬로 수행됩니다. 이미지가 외부 서버로 전송되지 않아 개인정보가 안전하게 보호됩니다.
Q: 어떤 이미지 형식을 지원하나요?
JPG, PNG, BMP, GIF, WebP 등 브라우저에서 표시할 수 있는 대부분의 이미지 형식을 지원합니다. PDF 파일은 이미지로 먼저 변환한 후 업로드해야 합니다.
Q: 표나 도표 속 텍스트도 인식되나요?
표 안의 텍스트 자체는 인식되지만, 표의 구조(행/열 구분)까지 보존되지는 않습니다. 결과를 수동으로 정리해야 할 수 있습니다.
Q: 스마트폰에서도 사용할 수 있나요?
네, 모바일 브라우저에서도 정상 작동합니다. 스마트폰 카메라로 촬영한 사진을 바로 업로드하여 텍스트를 추출할 수 있습니다.
Q: 인식 결과가 완벽하지 않을 때는?
OCR은 이미지 품질에 크게 영향을 받습니다. 이미지를 더 선명하게 촬영하거나, 밝기와 대비를 조정한 후 다시 시도해 보세요. 노이즈가 많은 배경이나 복잡한 레이아웃은 인식률을 떨어뜨립니다.
모든 처리는 브라우저에서 이루어지며 이미지 데이터가 서버로 전송되지 않습니다.