책의 일부분 텍스트가 필요해 해당 페이지를 pdf로 스캔했다. 예전에 구글 드라이브가 OCR기능을 제공한다는 이야기를 들은 기억이 나서 한 번 시도해봤다. 이것저것 해보다가 다행히 성공…^^
How to use Google Docs as a free OCR tool

구글드라이브OCR 1단계. 우선 pdf파일에서 스냅샷으로 원하는 내용을 클립보드로 복사
- 우선 필요한 부분을 스냅샷(사진기) 툴로 복사한다.

구글드라이브OCR 2단계. 그림판을 이용해 png, jpg 등 그림파일로 저장한다.
2. 그림판 등을 이용해 그림파일로 저장.

구글드라이브OCR 3단계. 그림파일을 구글드라이브에 업로드한다.
3. 구글 드라이브에 접속해 ‘NEW’ –> ‘File upload’

구글드라이브OCR 4단계. 업로드된 그림파일을 구글닥스로 연다.
4. 업로드된 파일을 우클릭해 ‘Open with’ –> ‘Google Docs’

구글드라이브OCR 5단계. 문서파일로 자동전환된 모습. 친절하게 그림파일과 텍스트를 위아래로 나열해서 잘못 인식된 걸 고칠 수 있게 해준다.
5. 오잉? 그냥 되네?
Comments
- 깔끔하게 스캔된 문서라 그런지 인식률 정말 좋다. 줄 끝에서 하이픈으로 쪼개진 단어도 자동으로 연결시켜준다.
- 그림에서 보는 것처럼 볼드체도 인식한다. 알파 베타 같은 Greek character도 인식 잘 한다.
- 한글은 안해봐서 모르겠다.
More from my site
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
한글은 안되겠죠?
글쎄요 저도 안 해봐서 ^^;