SST API 추가
후보: - SIRI, CLOVA, Google Cloud speech, kakao, Open ai whisper, kakao cloud api 등
Clova - 유료
Kakao - 월1200초 무료 이후 유료
웹 호스팅
-> 근데 이건 사실 막연한 생각. 사전 준비가 필요한 항목들이 너무 많아서 솔직히 구현은 힘들 것 같음 (카카오톡 보내기, api키 발급 등)
DB 관리
프로그램을 사용하면 대화내용, 발화자가 DB에 기록되는데 이걸 사용자가 다운받거나, 볼 수 있도록 수정하고 싶음.
코드 리팩토링
Class에 대한 개념이 아직 무지해서, Class로 좀 더 간단하게 할 수 있나 고민중.
stt 모델 디버깅
사실 이건 문제가 없을 수도 있는데, 우선 지니 일상대화 api의 경우 이전 대화를 기반으로 대답한다고하는데 전혀 그래보이지가 않음. 내가 뭔가 잘못했나 찾아볼 예정(사실 모르겠음 사용 예시도 없고) / etri의 api도 정확도가 준수하다고 하는데 내 프로젝트에 적용했을 때 아예 사용자의 말 자체를 거의 못알아들음. 왜그러지> 그냥 단순하게 호출해서 사용하는건디..
키워드 추가
비서라고 하기엔 사실 날씨 알려주기만 되어있음. 주식, 영화순위, 미니게임 등 일반적인 키워드 명령어 기능 추가
다른 자연어처리 api사용
일상대화 api가 많이 부족함. 이게 주된 목표인데, 다른 자연어처리 api들을 이용해서 의도분류, 개체명 인식, 긍부정 분류 등 다양한 것들을 사용하여 개선하고자 함.
혹은 다른 일상대화 api (후보는 chat gpt api -유료, Kogpt2, Kogpt) 를 찾아보고자 함.
(제일 큰 목표는 내가 모델을 파인튜닝해서 일상대화에 적용해보고 싶음)
웹 디자인 변경
이건 제일 마지막이 되겠지만 자비스 같은 템플릿을 적용하고싶음. 지금도 가능할 거 같긴한데 좀 더 기능들이 많아지고, 기초가 된 상태에서해야 나중에 수정할게 없을 듯.
'프로젝트 > 음성비서' 카테고리의 다른 글
Speech recognition 라이브러리 사용법 (1) | 2023.11.03 |
---|---|
Speech recognition 라이브러리 api 추가하기 (0) | 2023.11.03 |
Voice secretary 버전 4.0.1 (1) | 2023.11.03 |
Voice secretary 버전 3.0.1 (0) | 2023.11.03 |
Voice secretary 버전 3.0.0 (2) | 2023.11.02 |