프로젝트/음성비서

오늘은 파이썬에서 STT를 사용하기에 가장 편리한 SpeechRecognition 라이브러리 각 api별로 호출하는 걸 살펴보겠다. 많은 api를 가지고 있고, 각 모델마다 파라미터가 다르다보니 헷갈려서 정리하게 되었다. GitHub - Uberi/speech_recognition: Speech recognition module for Python, supporting several engines and APIs, online and offline Speech recognition module for Python, supporting several engines and APIs, online and offline. - GitHub - Uberi/speech_recognition: Speech recogn..
오늘은 프로젝트에서 사용하는 speech recognition의 api 추가적인 api들이나 세부적인 사항들을 업데이트해보려고 한다. 우선 그냥 라이브러리를 다운받으면 되는거 아닌가? 할텐데 그게 아니라, github issue에 다양한 개발자 분들이 추가해주신 내용들이 아직 정식버전에는 합쳐지지 않은 것 같아!! 직접 코드를 수정하여 추가하려고 한다!! 다양한 오류 수정, api 추가 , 옵션 추가 등이 issue에 많은데 반영이 아직 안된 것 같다 ~~ 우선 글 작성일은 2023.11.03일이며, 현재 기준으로 SpeechRecognitiond은 2022년2월에 마지막 업데이트로 3.10.0버전이 최신이고 지원되는 api는 상단에 있다. 1. Recognize_whisper에 device 옵션 추가 ..
SST API 추가 후보: - SIRI, CLOVA, Google Cloud speech, kakao, Open ai whisper, kakao cloud api 등 더보기 Clova - 유료 NAVER CLOUD PLATFORM cloud computing services for corporations, IaaS, PaaS, SaaS, with Global region and Security Technology Certification www.ncloud.com Kakao - 월1200초 무료 이후 유료 카카오클라우드 카카오클라우드 (kakaocloud) kakaocloud.com 웹 호스팅 -> 근데 이건 사실 막연한 생각. 사전 준비가 필요한 항목들이 너무 많아서 솔직히 구현은 힘들 것 같음 (카카..
시작하기전 이번에는 사소한 코드 변경, stt 모듈 병합 등 코드 리팩토링을 또 신나게 했다~ 뭔가 기능을 추가하면 추가할 수록 이전에는 괜찮아보였던 부분이 맘에 안들어서 계속해서 수정했다.. 아무튼 이번에는 이전에 말했던 speech recognition의 다른 api들을 사용할 수 있도록 추가했다. (단 api를 내가 발급받지 않아서, 기능만 넣어두고 라디오버튼은 막아놨다.) 아마 이제 당분간 버전 4에서 찔끔찔끔씩 올릴 것 같다. 이제 메인이 아니다보니, 조금씩 추가하고픈 기능이 있을 때만 추가할 것이다. 프로젝트 회고는 이전 버전 4.0.0의 마지막에 짧게 작성해 놓았다. Ver 4.0.1 Ver 4.0.1 특징 - 코드 리팩토링 - speech recognition api 추가 - 호출명령어 추..
시작하기전 이번에는 양심껏 0.0.1만 올렸습니다 ㅎㅎ. 이번에는 간단한 기능 한개만 추가했는데, 다른 글에 자세하게 설명되어 있어 딱히 설명할 것이 없다. Ver 3.0.1 Ver 3.0.1 특징 - 날씨 정보 카카오톡 친구에게 보내기 추가 - 코드 리팩토링 - 버그 수정 1. 날씨 정보 친구에게 카카오톡 보내기 저번 3.0.0에서 나에게 보내기를 구현했었고, 이번에는 나 뿐만 아니라 내가 지정한 사용자에게도 보낼 수 있도록 기능을 추가해봤다. 우선 이 방법 또한 미리 사전 세팅이 필요하며, 지정해놓은 사람한테만 보낼 수 있다. 카카오톡 api로 친구한테 메세지 보내기 0. 사전준비 카카오톡 access token 발급받기 카카오 플랫폼 서비스에서 카카오톡, 카카오스토리와 같은 카카오 서비스 및 카카오..
시작하기전 분명 이전 글에서 신기능을 추가하면 0.5를 올리고, 자잘한 수정이면 0.01을 올린다고 했는데 이번엔 1을 올렸다 ㅋㅋ..원래 버전은 자기 맘대로 하는건가? 규칙이 있는건가?.. 암튼 그냥 내 느낌상 코드도 많이 바꿨고 시간도 엄청 썼기 때문에 올려봤다. Ver 3.0.0 Ver 3.0.0 특징 - 날씨 정보 카카오톡 나에게 보내기 추가 - 대규모 코드 리팩토링 1. 코드 리팩토링 우선 코드가 너무 복잡하고 지저분한 것 같아서 모듈도 조금 더 나누고 폴더도 관리해봤다. 코드는 어차피 github에 올라와있지만, 꾸준하게 글을 봐주신 사람이 있다면?.. 알려드리기 위해 우선 저번시간에 전역변수를 정의하기 위한 파일 context_manager이란 파일을 variable_storage라는 이름으..
창빵맨
'프로젝트/음성비서' 카테고리의 글 목록