공유 블로그

Python OCR 사용하여 AWS(s3)를 통해 Nodejs에 보내기

Project/Python And NodeJS

2020. 11. 15. 17:59

코드는 깃허브에 있습니다.

https://github.com/h12sw06/AWS-s3_Python-to-Nodejs

h12sw06/AWS-s3_Python-to-Nodejs

Contribute to h12sw06/AWS-s3_Python-to-Nodejs development by creating an account on GitHub.

github.com

파이썬 tesseract 오픈소스 기반으로 하여 AWS(s3)를 연결하고

NodeJS에서 AWS(s3)에 올라간 문자코드를 받아서 출력해줍니다.

기본적인 뼈대만 잡았으니 여기서 살을 더 붙이는 건 알아서 하시면 되겠습니다.

#사용법

1. tesseract 설치

다운 받은곳 안에 '오픈 소스 설치 파일' tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe 설치 진행해줍니다.

----- 참고 : tesseract 설치 방법 -----

https://junyoung-jamong.github.io/computer/vision,/ocr/2019/01/30/Python%EC%97%90%EC%84%9C-Tesseract%EB%A5%BC-%EC%9D%B4%EC%9A%A9%ED%95%B4-OCR-%EC%88%98%ED%96%89%ED%95%98%EA%B8%B0.html

https://m.blog.naver.com/samsjang/220694855018

https://niceman.tistory.com/155

2. Python install

OCR.py 설치할 것들

1. python.exe -m pip install --upgrade pip --user

----- 참고 : AWS(s3) No module named httpsession 문제 발생 시 -----

https://jojoldu.tistory.com/426

pip install awscli --user --force-reinstall --upgrade --ignore-installed

2. pip install botocore

3. pip install pytesseract

4. pip install numpy

----- 참고 : 파이썬 64비트 일 경우 numpy 설치법 -----

https://tiboy.tistory.com/603

numpy 설치 파일들

https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy

5. pip install pyenchant

6. pip install boto3

7. pip install opencv-python

3. NodeJS

aws_OCR.js 설치할 것들

1. npm install -g @aws-amplify/cli

----- AWS IAM 설정 -----

amplify configure

amplify init

amplify push

4-1. aws_OCR.js 먼저 실행 후 OCR.py 실행

4-2. 픽픽(캡처 도구) 사용하여 'Image_To_Text'폴더 위치로 저장하고 image.png로 자동 저장

4-3. 픽픽에 영역 지정하여 사진 캡처

4-4. aws_OCR.js 캡처한 단어 또는 문장이 잘 출력되는지 확인

주의사항

중요!! : AWS(S3)를 연결했기 때문에 S3가 꼭 있어야 함

궁금하거나 질문 있으면 댓글!!

--- 추가내용 ---

버그 있어서 수정 했구요..

자동 설치 파일 만들었으니 0.사용법 확인하시면 되겠습니다..

수정날짜 : 2021/07/25

공유하기

kakaoTalk

naver

band

kakaostory

Copy URL

수정(새창)
관리자
카테고리
목차
맨 위로
맨 아래로

티스토리툴바