공유 블로그

코드는 깃허브에 있습니다.

https://github.com/h12sw06/AWS-s3_Python-to-Nodejs

 

h12sw06/AWS-s3_Python-to-Nodejs

Contribute to h12sw06/AWS-s3_Python-to-Nodejs development by creating an account on GitHub.

github.com

파이썬 tesseract 오픈소스 기반으로 하여 AWS(s3)를 연결하고

NodeJS에서 AWS(s3)에 올라간 문자코드를 받아서 출력해줍니다.

 

기본적인 뼈대만 잡았으니 여기서 살을 더 붙이는 건 알아서 하시면 되겠습니다.


#사용법

 

1. tesseract 설치

더보기

다운 받은곳 안에 '오픈 소스 설치 파일' tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe 설치 진행해줍니다.

 

----- 참고 : tesseract 설치 방법 -----

 

https://junyoung-jamong.github.io/computer/vision,/ocr/2019/01/30/Python%EC%97%90%EC%84%9C-Tesseract%EB%A5%BC-%EC%9D%B4%EC%9A%A9%ED%95%B4-OCR-%EC%88%98%ED%96%89%ED%95%98%EA%B8%B0.html


https://m.blog.naver.com/samsjang/220694855018


https://niceman.tistory.com/155


2. Python install

더보기

OCR.py 설치할 것들

 

1. python.exe -m pip install --upgrade pip --user

 

----- 참고 : AWS(s3) No module named httpsession 문제 발생 시 -----

https://jojoldu.tistory.com/426

pip install awscli --user --force-reinstall --upgrade --ignore-installed


2. pip install botocore

3. pip install pytesseract

4. pip install numpy

 

----- 참고 : 파이썬 64비트 일 경우 numpy 설치법 -----

https://tiboy.tistory.com/603


numpy 설치 파일들

https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 


5. pip install pyenchant

6. pip install boto3

7. pip install opencv-python


3. NodeJS

더보기

aws_OCR.js 설치할 것들

 

1. npm install -g @aws-amplify/cli

 

----- AWS IAM 설정 -----

amplify configure

amplify init

amplify push


4-1. aws_OCR.js 먼저 실행 후 OCR.py 실행

4-2. 픽픽(캡처 도구) 사용하여 'Image_To_Text'폴더 위치로 저장하고 image.png로 자동 저장

4-3. 픽픽에 영역 지정하여 사진 캡처

4-4. aws_OCR.js 캡처한 단어 또는 문장이 잘 출력되는지 확인


주의사항

중요!! : AWS(S3)를 연결했기 때문에 S3가 꼭 있어야 함

 

궁금하거나 질문 있으면 댓글!!

 

 

--- 추가내용 ---

더보기

버그 있어서 수정 했구요..

자동 설치 파일 만들었으니 0.사용법 확인하시면 되겠습니다..

수정날짜 : 2021/07/25

공유하기

facebook twitter kakaoTalk naver band kakaostory Copy URL