Google기반 Speech To Text(STT) 설치부터 예제 실행까지

카테고리 없음 2021. 1. 14. 12:38

<1> gcloud 회원가입 후 밑 작업

https://console.cloud.google.com

Google Cloud Platform

하나의 계정으로 모든 Google 서비스를 Google Cloud Platform을 사용하려면 로그인하세요.

accounts.google.com

1.gcloud 회원가입

2.My First Project 들어가서 새프로젝트 생성

3.프로젝트 이름 : SpeechToText (자유) 으로 만들기

4.프로젝트를 SpeechToText로 변경

5.검색창에 Cloud Speech-to-text API 검색 후 선택

6.사용설정 혹은 사용 혹은 관리를 눌러줌

7.사용자 인증 정보에서 사용자 인증 정보 - 서비스 계정 선택

8.서비스 계정 이름 : speechtotext(자유), 소유자 : 프로젝트-소유자 하고 계속

9.키 만들기 json 형태 / 키만들기가 없다면 우선 완료하고 사용자 인증정보 서비스 계정에서 speechtotext를 다시 누르면 키추가 눌러서 만들기

<2>시작 전 python & pip 준비과정

python 설치

www.python.org/

Welcome to Python.org

The official home of the Python Programming Language

www.python.org

1.Download선택후 밑에서 버전을 누르고 맨 밑으로 내려서 사양에 맞는 파일 설치

2.exe 실행후 Add Python 3.9 to PATH 체크박스 선택후 설치

3.윈도우 검색창에 시스템 환경 변수 편집 - 고급- 환경 변수(N)

4.user에 대한 사용자 변수에서 Path를 더블 클릭

5.C:\....생략...\Python\Python39\Scripts\ 전체 복사 후 닫기

6.시스템변수에서 Path에 밑에 두개 새로만들기

C:\....생략...\Python\Python39\Scripts\

C:\....생략...\Python\Python39\

pip설치

1.윈도우+r 누르고 cmd 입력 후 ctrl+shift+enter (관리자 권한으로 실행)

2.pip --version으로 설치 확인

3.curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py

4.python get-pip.py

5.pip install -U pip

(업그레이드 명령문)

<3> GOOGLE_APPLICATION_CREDENTIALS 등록

1.cmd 창에서 set GOOGLE_APPLICATION_CREDENTIALS=C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json

-> 작성자의 위치로 json 파일을 오른마우스 클릭 후 속성에 들어가서 위치와 이름을 복사해 오면 된다.

이 명령문을 cmd 창을 껐다 키면 초기화 되므로 귀찮으면

1)시스템 환경 변수 - 시스템 변수 새로만들기

변수 이름 : GOOGLE_APPLICATION_CREDENTIALS

변수 값 : C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json

코드 짤 때

import io

import os

os.environ['GOOGLE_APPLICATION_CREDENTIALS']=r"C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json"

이 코드를 맨 앞부분에 넣어주면 됨

<4>Cloud SDK 설치

1. https://cloud.google.com/sdk

Cloud SDK 명령줄 도구 | Cloud SDK: 명령줄 인터페이스 | Google Cloud

Cloud SDK는 Google Cloud에서의 개발을 위한 도구 모음으로 gcloud, gsutil, bq 명령줄 도구, 클라이언트 라이브러리, 로컬 에뮬레이터가 포함되어 있습니다.

cloud.google.com

2. 시작하기-Windows- 시작하기 전에 2번의 Google Cloud SDK 설치 프로그램을 눌러 다운로드

3.exe 실행 후 마지막 finish를 누르기 전에 모든 체크박스 선택 후 완료

4.Google Cloud SDK Shell 창이 뜸

처음 실행하는 사람

1.gcloud init

2.Y

3.팝업 창에 로그인 후 허용 후 닫기

4.Shell 창으로 돌아와서 선택지 중에 아까 생성한 프로젝트 이름을 선택

ex)speechtotext

이미 실행 해봤던 사람

1.create a nes configuration

2.이름 설정 ex)speechtotext

3.사용하는 이메일 선택

4.프로젝트 이름 선택

ex)speechtotext

<5>visual studio 설치

생략

<6>가상환경 설정

cmd 창

1.pip install virtualenv

2.pip install virtualenvwrapper-win

3.mkdir stt

4.cd stt

5.virtualenv env

6. .\env\Scripts\activate (파일명 첫글자 입력후 tab누르면 자동 입력)

가상환경 나가고 싶을 경우 'deactivate'만 입력하면 됨

7.pip install --upgrade google-cloud-storage

8.pip install google-cloud-speech

9.gcloud auth activate-service-account --key-file="C:\Users\user\Downloads\speechtotext-301407-ab6a315fc229.json"

10.pip install pyaudio

에러가 뜰경우 에러코드에서 win-amd64-3.9 처럼 버전을 확인 한다.

11.pypi.bartbroe.re/pyaudio/

pyaudio

pypi.bartbroe.re

위 링크에서 맞는 버전을 다운로드 (링크 오류가 뜨면 링크를 확인해서 뒤에 /%EF%BB%BF 가 생성됐다면 지우고 다시 들어가기)

-본인은 PyAudio-0.2.11-cp39-cp39-win_amd64.whl 다운로드 함

12.다운로드한 파일을 가상환경 파일안에 집어 넣는다

-지금 과정에선 stt 파일

13.pip install PyAudio-0.2.11-cp39-cp39-win_amd64.whl

10.pip install pipwin

11.pipwin install pyaudio

모든 준비 과정 끝!

findface.netlify.app/

얼굴로 나라찾기!

내얼굴은 어느나라사람과 비슷할까?

findface.netlify.app

위링크 stt 예제를 다운로드 한후

stt_test1.py 코드에서

from ---enums

from ---types

두줄 삭제 후 코드 내의 enums와 types을 전부 speech로 바꿔준다

귀찮다면 수정한 파일을 첨부파일로 올려두겠다

test.py

0.01MB

현 코드는 한국어로 되어있는데 영어로 바꾸고 싶다면 ko-KR 부분을 en-US로 바꾸면 된다.

cmd 창에서

python test.py

(stt_test1.py를 이용하는 경우 수정 후 이름을 test로 바꾸거나 cmd 창에 python stt_test1.py를 입력)

해주면 실행이 된다. 마이크가 연결된 상태이어야 한다

stt_test2.py 코드도 위와 같은 방법으로 수정한다.

그 이후에도 audio 채널이라던가 hz 등 오류가 몇개 더 뜨는데 수정해 놓은 것이 밑에 파일이니 비교해 보아도 좋다

test2.py

0.00MB

폴더 내에 voice.wav 라는 음성 파일이 있어야 함

이름을 다르게 하고 싶다면 코드 내에 voice.wav 부분을 수정하면 되지만 확장자를 수정할 경우 그 확장자에 해당하는 코드를 추가 입력해야 함

인터넷에 000 to wav 를 입력하면 무료 변환하는 사이트가 많으므로 이용하여도 된다

마찬가지로 cmd 창에

python test2.py

하면 녹음된 음성이 글로 출력된다.

참고 : www.youtube.com/user/mrwjs0803

레이원TV RaywonTV

www.youtube.com

Posted by 더블마노

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

일상

Google기반 Speech To Text(STT) 설치부터 예제 실행까지

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31