코드는 깃허브에 있습니다.
https://github.com/h12sw06/AWS-s3_Python-to-Nodejs
h12sw06/AWS-s3_Python-to-Nodejs
Contribute to h12sw06/AWS-s3_Python-to-Nodejs development by creating an account on GitHub.
github.com
파이썬 tesseract 오픈소스 기반으로 하여 AWS(s3)를 연결하고
NodeJS에서 AWS(s3)에 올라간 문자코드를 받아서 출력해줍니다.
기본적인 뼈대만 잡았으니 여기서 살을 더 붙이는 건 알아서 하시면 되겠습니다.
다운 받은곳 안에 '오픈 소스 설치 파일' tesseract-ocr-w64-setup-v5.0.0-alpha.20200328.exe 설치 진행해줍니다.
----- 참고 : tesseract 설치 방법 -----
https://junyoung-jamong.github.io/computer/vision,/ocr/2019/01/30/Python%EC%97%90%EC%84%9C-Tesseract%EB%A5%BC-%EC%9D%B4%EC%9A%A9%ED%95%B4-OCR-%EC%88%98%ED%96%89%ED%95%98%EA%B8%B0.html
https://m.blog.naver.com/samsjang/220694855018
https://niceman.tistory.com/155
OCR.py 설치할 것들
1. python.exe -m pip install --upgrade pip --user
----- 참고 : AWS(s3) No module named httpsession 문제 발생 시 -----
https://jojoldu.tistory.com/426
pip install awscli --user --force-reinstall --upgrade --ignore-installed
2. pip install botocore
3. pip install pytesseract
4. pip install numpy
----- 참고 : 파이썬 64비트 일 경우 numpy 설치법 -----
https://tiboy.tistory.com/603
numpy 설치 파일들
https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy
5. pip install pyenchant
6. pip install boto3
7. pip install opencv-python
aws_OCR.js 설치할 것들
1. npm install -g @aws-amplify/cli
----- AWS IAM 설정 -----
amplify configure
amplify init
amplify push
4-1. aws_OCR.js 먼저 실행 후 OCR.py 실행
4-2. 픽픽(캡처 도구) 사용하여 'Image_To_Text'폴더 위치로 저장하고 image.png로 자동 저장
4-3. 픽픽에 영역 지정하여 사진 캡처
4-4. aws_OCR.js 캡처한 단어 또는 문장이 잘 출력되는지 확인
중요!! : AWS(S3)를 연결했기 때문에 S3가 꼭 있어야 함
궁금하거나 질문 있으면 댓글!!
버그 있어서 수정 했구요..
자동 설치 파일 만들었으니 0.사용법 확인하시면 되겠습니다..
수정날짜 : 2021/07/25
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.