<1> gcloud 회원가입 후 밑 작업
https://console.cloud.google.com
Google Cloud Platform
하나의 계정으로 모든 Google 서비스를 Google Cloud Platform을 사용하려면 로그인하세요.
accounts.google.com
1.gcloud 회원가입
2.My First Project 들어가서 새프로젝트 생성
3.프로젝트 이름 : SpeechToText (자유) 으로 만들기
4.프로젝트를 SpeechToText로 변경
5.검색창에 Cloud Speech-to-text API 검색 후 선택
6.사용설정 혹은 사용 혹은 관리를 눌러줌
7.사용자 인증 정보에서 사용자 인증 정보 - 서비스 계정 선택
8.서비스 계정 이름 : speechtotext(자유), 소유자 : 프로젝트-소유자 하고 계속
9.키 만들기 json 형태 / 키만들기가 없다면 우선 완료하고 사용자 인증정보 서비스 계정에서 speechtotext를 다시 누르면 키추가 눌러서 만들기
<2>시작 전 python & pip 준비과정
python 설치
Welcome to Python.org
The official home of the Python Programming Language
www.python.org
1.Download선택후 밑에서 버전을 누르고 맨 밑으로 내려서 사양에 맞는 파일 설치
2.exe 실행후 Add Python 3.9 to PATH 체크박스 선택후 설치
3.윈도우 검색창에 시스템 환경 변수 편집 - 고급- 환경 변수(N)
4.user에 대한 사용자 변수에서 Path를 더블 클릭
5.C:\....생략...\Python\Python39\Scripts\ 전체 복사 후 닫기
6.시스템변수에서 Path에 밑에 두개 새로만들기
C:\....생략...\Python\Python39\Scripts\
C:\....생략...\Python\Python39\
pip설치
1.윈도우+r 누르고 cmd 입력 후 ctrl+shift+enter (관리자 권한으로 실행)
2.pip --version으로 설치 확인
3.curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
4.python get-pip.py
5.pip install -U pip
(업그레이드 명령문)
<3> GOOGLE_APPLICATION_CREDENTIALS 등록
1.cmd 창에서 set GOOGLE_APPLICATION_CREDENTIALS=C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json
-> 작성자의 위치로 json 파일을 오른마우스 클릭 후 속성에 들어가서 위치와 이름을 복사해 오면 된다.
이 명령문을 cmd 창을 껐다 키면 초기화 되므로 귀찮으면
1)시스템 환경 변수 - 시스템 변수 새로만들기
변수 이름 : GOOGLE_APPLICATION_CREDENTIALS
변수 값 : C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json
2)
코드 짤 때
import io
import os
os.environ['GOOGLE_APPLICATION_CREDENTIALS']=r"C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json"
이 코드를 맨 앞부분에 넣어주면 됨
<4>Cloud SDK 설치
1. https://cloud.google.com/sdk
Cloud SDK 명령줄 도구 | Cloud SDK: 명령줄 인터페이스 | Google Cloud
Cloud SDK는 Google Cloud에서의 개발을 위한 도구 모음으로 gcloud, gsutil, bq 명령줄 도구, 클라이언트 라이브러리, 로컬 에뮬레이터가 포함되어 있습니다.
cloud.google.com
2. 시작하기-Windows- 시작하기 전에 2번의 Google Cloud SDK 설치 프로그램을 눌러 다운로드
3.exe 실행 후 마지막 finish를 누르기 전에 모든 체크박스 선택 후 완료
4.Google Cloud SDK Shell 창이 뜸
처음 실행하는 사람
1.gcloud init
2.Y
3.팝업 창에 로그인 후 허용 후 닫기
4.Shell 창으로 돌아와서 선택지 중에 아까 생성한 프로젝트 이름을 선택
ex)speechtotext
이미 실행 해봤던 사람
1.create a nes configuration
2.이름 설정 ex)speechtotext
3.사용하는 이메일 선택
4.프로젝트 이름 선택
ex)speechtotext
<5>visual studio 설치
생략
<6>가상환경 설정
cmd 창
1.pip install virtualenv
2.pip install virtualenvwrapper-win
3.mkdir stt
4.cd stt
5.virtualenv env
6. .\env\Scripts\activate (파일명 첫글자 입력후 tab누르면 자동 입력)
가상환경 나가고 싶을 경우 'deactivate'만 입력하면 됨
7.pip install --upgrade google-cloud-storage
8.pip install google-cloud-speech
9.gcloud auth activate-service-account --key-file="C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json"
1)
10.pip install pyaudio
에러가 뜰경우 에러코드에서 win-amd64-3.9 처럼 버전을 확인 한다.
pyaudio
pypi.bartbroe.re
위 링크에서 맞는 버전을 다운로드 (링크 오류가 뜨면 링크를 확인해서 뒤에 /%EF%BB%BF 가 생성됐다면 지우고 다시 들어가기)
-본인은 PyAudio-0.2.11-cp39-cp39-win_amd64.whl 다운로드 함
12.다운로드한 파일을 가상환경 파일안에 집어 넣는다
-지금 과정에선 stt 파일
13.pip install PyAudio-0.2.11-cp39-cp39-win_amd64.whl
2)
10.pip install pipwin
11.pipwin install pyaudio
모든 준비 과정 끝!
얼굴로 나라찾기!
내얼굴은 어느나라사람과 비슷할까?
findface.netlify.app
위링크 stt 예제를 다운로드 한후
stt_test1.py 코드에서
from ---enums
from ---types
두줄 삭제 후 코드 내의 enums와 types을 전부 speech로 바꿔준다
귀찮다면 수정한 파일을 첨부파일로 올려두겠다
현 코드는 한국어로 되어있는데 영어로 바꾸고 싶다면 ko-KR 부분을 en-US로 바꾸면 된다.
cmd 창에서
python test.py
(stt_test1.py를 이용하는 경우 수정 후 이름을 test로 바꾸거나 cmd 창에 python stt_test1.py를 입력)
해주면 실행이 된다. 마이크가 연결된 상태이어야 한다
stt_test2.py 코드도 위와 같은 방법으로 수정한다.
그 이후에도 audio 채널이라던가 hz 등 오류가 몇개 더 뜨는데 수정해 놓은 것이 밑에 파일이니 비교해 보아도 좋다
폴더 내에 voice.wav 라는 음성 파일이 있어야 함
이름을 다르게 하고 싶다면 코드 내에 voice.wav 부분을 수정하면 되지만 확장자를 수정할 경우 그 확장자에 해당하는 코드를 추가 입력해야 함
인터넷에 000 to wav 를 입력하면 무료 변환하는 사이트가 많으므로 이용하여도 된다
마찬가지로 cmd 창에
python test2.py
하면 녹음된 음성이 글로 출력된다.
참고 : www.youtube.com/user/mrwjs0803
레이원TV RaywonTV
© 2021 Google LLC CEO: 선다 피차이 주소: 1600 Amphitheatre Parkway, Mountain View, CA 94043, USA. 전화: 080-822-1450(무료)
www.youtube.com