반응형
OCR을 이용해서 이미지를 텍스트로 읽기
OCR, Optical Character Recognition 이란 약자로 광학 문자 인식이고, 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것이다.
아래는 tesseract-ocr 오픈소스 참고
https://github.com/tesseract-ocr/tesseract
GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)
Tesseract Open Source OCR Engine (main repository) - GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)
github.com
맥에 tesseract OCR 설치
brew install tesseract
실행
tesseract [input] [output]
반응형