OCR 소프트웨어로 이미지에서 텍스트를 캡처하는 방법

종종 나를 실망시킨 것 중 하나는 이미지와 특정 PDF 파일 (예 : 스캔 한 문서에서 생성 된 파일)에서 텍스트를 쉽게 복사 할 수 없다는 것입니다. 고맙게도이 문제를 해결하기 위해 시간이 지남에 따라 소프트웨어 솔루션이 개발되어 텍스트를 수동으로 복사하고 다시 입력하는 데 소요되는 시간을 크게 절약 할 수 있습니다. 오늘 팁에서는 이미지 및 PDF 파일에서 텍스트를 캡처 할 수있는 OCR (광학 문자 인식) 알고리즘을 사용하는 Capture2Text라는 무료 소프트웨어 도구에 대해 설명하겠습니다.

설치 및 설정

시작하려면 프로젝트의 SourceForge 페이지로 이동하여 최신 버전의 Capture2Text를 다운로드하십시오. 소프트웨어는 zip 아카이브로 제공되며 당시에는 전용 설치 프로그램이 포함되어 있지 않습니다. 다운로드가 완료되면 아카이브의 압축을 풀고 Capture2Text.exe 파일을 시작하십시오. 소프트웨어가 시작되고 시스템 트레이에 아이콘이 표시됩니다.

먼저, 소프트웨어 환경 설정, 특히 캡처를 시작 및 중지하는 데 사용할 단축키 (또는 단축키)를 설정해야합니다.

필자의 경우“Windows + q”키를 사용하여 캡처를 시작하고“Enter”를 사용하여 캡처를 중지하기로했습니다. 이 옵션을 자신에게 가장 적합한 것으로 조정할 수 있습니다. "Windows + s"키는 종종 이미 화면 캡처에 사용됩니다 (예 : Microsoft One Note와 같은 프로그램).

다음 탭에서 입력 언어 (현재 7 개 언어가 지원됨) 및 정확성 향상을 위해 OCR 사전 처리 사용 여부 (권장)를 포함하여 OCR 옵션을 구성 할 수 있습니다. 마지막으로, 출력 탭의 다른 옵션 중에서 캡처 된 텍스트를 클립 보드에 저장할지 또는 별도의 팝업 창을 시작할지 여부를 선택할 수 있습니다.

소프트웨어 사용

소프트웨어가 설치 및 구성되면 시작 캡처 단축키 조합을 통해 소프트웨어를 사용할 수 있습니다. 마우스를 사용하여 이미지에서 캡처 할 텍스트가 포함 된 영역을 선택하십시오. 캡처를 중지하려면 캡처를 중지하도록 선택한 단축키를 누르십시오. 그런 다음 텍스트가 클립 보드, 출력 팝업 창 또는 둘 다에 복사됩니다. 아래에서 예를 볼 수 있습니다.

이미지로 도구를 빠르게 테스트 한 결과 정확성이 적당하다는 것을 알았습니다. 분명히 이것과 OCR과 같은 도구에는 일반적으로 제한이 있습니다. 예를 들어, 심하게 수정 된 텍스트 (매우 필기체, 이탤릭체 또는 현대식)는 제대로 작동하지 않을 수 있으며 때로는 전혀 작동하지 않을 수도 있습니다. 또한 경우에 따라 캡처 상자 크기를 약간 조정하거나 이미지 자체를 확대하여 재생하여보다 정확한 결과를 얻을 수 있습니다.

스캔 한 PDF 문서에서 텍스트를 캡처 할 때 정확도는 양호하며 캡처 된 출력에서 초기 수정의 품질에 따라 몇 가지 최종 수정이 여전히 필요합니다. 또한 특히 많은 양의 텍스트를 변환하라는 메시지가 표시 될 때 소프트웨어 처리에 몇 초가 더 걸릴 수 있습니다.

모든 도구를 말하면, 전반적으로이 도구는 특히 무료로 이용할 수 있기 때문에 도구가 잘 작동한다고 생각합니다. 도구를 사용해 보는 것이 좋습니다.

부록 11/16/2015 :

다른 방법으로는 Google 계정이있는 사용자의 경우 파일을 Google 드라이브에 업로드하여 Google OCR 기능을 사용할 수도 있습니다 (자세한 내용은 여기 참조). 또한 Google Chrome 사용자가 Copyfish라고하는 OCR 플러그인을 사용하여 확인할 수도 있습니다.