Speech recognition 라이브러리 사용법
·
프로젝트/음성비서
오늘은 파이썬에서 STT를 사용하기에 가장 편리한 SpeechRecognition 라이브러리 각 api별로 호출하는 걸 살펴보겠다. 많은 api를 가지고 있고, 각 모델마다 파라미터가 다르다보니 헷갈려서 정리하게 되었다. GitHub - Uberi/speech_recognition: Speech recognition module for Python, supporting several engines and APIs, online and offline Speech recognition module for Python, supporting several engines and APIs, online and offline. - GitHub - Uberi/speech_recognition: Speech recogn..
Speech recognition 라이브러리 api 추가하기
·
프로젝트/음성비서
오늘은 프로젝트에서 사용하는 speech recognition의 api 추가적인 api들이나 세부적인 사항들을 업데이트해보려고 한다. 우선 그냥 라이브러리를 다운받으면 되는거 아닌가? 할텐데 그게 아니라, github issue에 다양한 개발자 분들이 추가해주신 내용들이 아직 정식버전에는 합쳐지지 않은 것 같아!! 직접 코드를 수정하여 추가하려고 한다!! 다양한 오류 수정, api 추가 , 옵션 추가 등이 issue에 많은데 반영이 아직 안된 것 같다 ~~ 우선 글 작성일은 2023.11.03일이며, 현재 기준으로 SpeechRecognitiond은 2022년2월에 마지막 업데이트로 3.10.0버전이 최신이고 지원되는 api는 상단에 있다. 1. Recognize_whisper에 device 옵션 추가 ..
Open ai - Whisper 설치
·
프로젝트/음성비서
오늘은 음성비서 프로젝트를 시작하는데, speech to text 관련하여 찾아보다가, open ai의 whisper을 한번 시도해보았다. whisper은 api가 있긴하지만 유료이기 때문에 github에서 로컬에 직접 설치하여 사용해봤다. whisper webui 등도 있다고하고, 보통 colab에 설치해서 자주 사용한다고 하는데, 나는 프로젝트를 진행해보느라 컴퓨터도 사양이 되길래 로컬에 직접 설치해봤다. 1. Whisper Github GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision - GitH..