<1> gcloud 회원가입 후 밑 작업

 

https://console.cloud.google.com

 

Google Cloud Platform

하나의 계정으로 모든 Google 서비스를 Google Cloud Platform을 사용하려면 로그인하세요.

accounts.google.com

1.gcloud 회원가입

2.My First Project 들어가서 새프로젝트 생성

3.프로젝트 이름 : SpeechToText (자유) 으로 만들기

4.프로젝트를 SpeechToText로 변경

5.검색창에 Cloud Speech-to-text API 검색 후 선택

6.사용설정 혹은 사용 혹은 관리를 눌러줌

7.사용자 인증 정보에서 사용자 인증 정보 - 서비스 계정 선택

8.서비스 계정 이름 : speechtotext(자유), 소유자 : 프로젝트-소유자 하고 계속

9.키 만들기 json 형태 / 키만들기가 없다면 우선 완료하고 사용자 인증정보 서비스 계정에서 speechtotext를 다시 누르면 키추가 눌러서 만들기

 

 

 

 

 

<2>시작 전 python & pip 준비과정

 

python 설치

www.python.org/

 

Welcome to Python.org

The official home of the Python Programming Language

www.python.org

1.Download선택후 밑에서 버전을 누르고 맨 밑으로 내려서 사양에 맞는 파일 설치

2.exe 실행후 Add Python 3.9 to PATH 체크박스 선택후 설치

3.윈도우 검색창에 시스템 환경 변수 편집 - 고급- 환경 변수(N)

4.user에 대한 사용자 변수에서 Path를 더블 클릭

5.C:\....생략...\Python\Python39\Scripts\ 전체 복사 후 닫기

6.시스템변수에서 Path에 밑에 두개 새로만들기

C:\....생략...\Python\Python39\Scripts\

C:\....생략...\Python\Python39\

 

pip설치

1.윈도우+r 누르고 cmd 입력 후 ctrl+shift+enter (관리자 권한으로 실행)

2.pip --version으로 설치 확인

3.curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py

4.python get-pip.py

5.pip install -U pip

(업그레이드 명령문)

 

 

 

 

<3> GOOGLE_APPLICATION_CREDENTIALS 등록

1.cmd 창에서 set GOOGLE_APPLICATION_CREDENTIALS=C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json

-> 작성자의 위치로 json 파일을 오른마우스 클릭 후 속성에 들어가서 위치와 이름을 복사해 오면 된다.

 

이 명령문을 cmd 창을 껐다 키면 초기화 되므로 귀찮으면

 

1)시스템 환경 변수 - 시스템 변수 새로만들기

변수 이름 : GOOGLE_APPLICATION_CREDENTIALS

변수 값 : C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json

 

2)

코드 짤 때 

 

import io

import os

 

os.environ['GOOGLE_APPLICATION_CREDENTIALS']=r"C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json"

 

이 코드를 맨 앞부분에 넣어주면 됨

 

 

 

 

 

 

<4>Cloud SDK 설치

 

1. https://cloud.google.com/sdk 

 

Cloud SDK 명령줄 도구  |  Cloud SDK: 명령줄 인터페이스  |  Google Cloud

Cloud SDK는 Google Cloud에서의 개발을 위한 도구 모음으로 gcloud, gsutil, bq 명령줄 도구, 클라이언트 라이브러리, 로컬 에뮬레이터가 포함되어 있습니다.

cloud.google.com

2. 시작하기-Windows- 시작하기 전에 2번의 Google Cloud SDK 설치 프로그램을 눌러 다운로드

3.exe 실행 후 마지막 finish를 누르기 전에 모든 체크박스 선택 후 완료

4.Google Cloud SDK Shell 창이 뜸

 

처음 실행하는 사람

1.gcloud init

2.Y

3.팝업 창에 로그인 후 허용 후 닫기

4.Shell 창으로 돌아와서 선택지 중에 아까 생성한 프로젝트 이름을 선택

ex)speechtotext

 

이미 실행 해봤던 사람

1.create a nes configuration

2.이름 설정 ex)speechtotext

3.사용하는 이메일 선택

4.프로젝트 이름 선택

ex)speechtotext

 

 

 

<5>visual studio 설치

생략

 

 

 

<6>가상환경 설정

cmd 창

1.pip install virtualenv

2.pip install virtualenvwrapper-win

3.mkdir stt

4.cd stt

5.virtualenv env

6. .\env\Scripts\activate (파일명 첫글자 입력후 tab누르면 자동 입력)

가상환경 나가고 싶을 경우 'deactivate'만 입력하면 됨

7.pip install --upgrade google-cloud-storage

8.pip install google-cloud-speech

9.gcloud auth activate-service-account --key-file="C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json"

 

1)

10.pip install pyaudio

에러가 뜰경우 에러코드에서 win-amd64-3.9 처럼 버전을 확인 한다.

11.pypi.bartbroe.re/pyaudio/

 

pyaudio

 

pypi.bartbroe.re

 

위 링크에서 맞는 버전을 다운로드 (링크 오류가 뜨면 링크를 확인해서 뒤에 /%EF%BB%BF 가 생성됐다면 지우고 다시 들어가기)

-본인은 PyAudio-0.2.11-cp39-cp39-win_amd64.whl 다운로드 함

12.다운로드한 파일을 가상환경 파일안에 집어 넣는다

-지금 과정에선 stt 파일

13.pip install PyAudio-0.2.11-cp39-cp39-win_amd64.whl

 

 

2)

10.pip install pipwin

11.pipwin install pyaudio

 

 

 

 

모든 준비 과정 끝!

 

findface.netlify.app/

 

얼굴로 나라찾기!

내얼굴은 어느나라사람과 비슷할까?

findface.netlify.app

위링크 stt 예제를 다운로드 한후

stt_test1.py 코드에서

 

from ---enums

from ---types

두줄 삭제 후 코드 내의 enums와 types을 전부 speech로 바꿔준다

귀찮다면 수정한 파일을 첨부파일로 올려두겠다

test.py
0.01MB

현 코드는 한국어로 되어있는데 영어로 바꾸고 싶다면 ko-KR 부분을 en-US로 바꾸면 된다.

 

cmd 창에서 

python test.py

(stt_test1.py를 이용하는 경우 수정 후 이름을 test로 바꾸거나 cmd 창에 python stt_test1.py를 입력)

해주면 실행이 된다. 마이크가 연결된 상태이어야 한다

 

 

 

stt_test2.py 코드도 위와 같은 방법으로 수정한다.

그 이후에도 audio 채널이라던가 hz 등 오류가 몇개 더 뜨는데 수정해 놓은 것이 밑에 파일이니 비교해 보아도 좋다

test2.py
0.00MB

폴더 내에 voice.wav 라는 음성 파일이 있어야 함

이름을 다르게 하고 싶다면 코드 내에 voice.wav 부분을 수정하면 되지만 확장자를 수정할 경우 그 확장자에 해당하는 코드를 추가 입력해야 함

인터넷에 000 to wav 를 입력하면 무료 변환하는 사이트가 많으므로 이용하여도 된다

마찬가지로 cmd 창에

python test2.py

하면 녹음된 음성이 글로 출력된다.

 

 

 

 

참고 : www.youtube.com/user/mrwjs0803

 

레이원TV RaywonTV

© 2021 Google LLC CEO: 선다 피차이 주소: 1600 Amphitheatre Parkway, Mountain View, CA 94043, USA. 전화: 080-822-1450(무료)

www.youtube.com

 

Posted by 더블마노
,