프로젝트/음성비서

시작하기 전 이번에도 버전을 0.5 올렸다~~ 내 기준 0.5는 좀 시간도 많이 들이고, 메인 기능을 하나 추가한거!! 0.01 올리는건 그냥 음 사소한 코드 리팩토링? 정도로 보면 된다 ㅋㅋ 이번에도 프로젝트 회고를 해보자. Ver 2.0.0 Ver 2.0.0 특징 - Genie 일상대화 api 이용 -> 일상대화 구현 - 자잘한 오류 수정 1. Genielabs 일상채팅 API 내 음성 비서의 핵심이 될 API이다. 사실 그냥 API라서 갖다가 쓰기만 하면된다. 근데 은근 만줘져야할게 많았다. 우선 genielabs의 일상대화 api key를 발급받아야한다. 이것또한 블로그에 작성해놓았으니, 우선 아래 링크에서 api키를 발급받길 바란다.(사용하고 싶다면..) KT GenieLabs api 이용하기 ..
뭐 이건 genielabs에 들어가면 아주 자세하게 설명되어 있지만, 프로젝트에 사용되는 거라 간단하게 설명해보겠다. 우선 genie labs에 다양한 api들이 있는데, 전부 똑같은 절차로 발급받으면 된다. 1. [KT GenieLabs 회원가입 ] 우선 아래 링크에서 회원가입을 진행한다. KT GenieLabs 지니랩스에서 KT 융합기술원의 초거대 AI 믿음을 포함한 AI API를 자유롭게 활용하여 나만의 AI 서비스를 개발해보세요. genielabs.ai 2. API 신청 및 발급 상단의 API에서 신청하고자 하는 API에 맞게 이동한 후 클릭한다. (나는 NLP API의 일상채팅 API를 발급받아보도록 하겠다.) 그다음 위의 API 사용신청을 클릭하면 게시판으로 이동하게 되는데 절차에 맞게 신청하..
시작하기 전 오늘은 버전을 0.5나 올린!!!!!!!!! (사실 내맘대로임) Ver 1.5.0에 대한 리뷰이다~ 저번 버전과 동일하게 아래 버전을 누르면, github에서 코드를 볼 수 있다. 다시한번 말하지만, 코드에 대한 아주 자세한 설명이나, 개념에 대한 자세한 설명, 폴더 구조 등은 설명하지 않는다. 본 글들은 그냥 프로젝트 회고 느낌으로 작성하기 때문에 다만 github를 보고 코드에 대해서 물어볼 것이 있거나 추가해 으면 하는 기능, 오류가 있다면 언제든 환영입니다.!!!!!!!!!!!!!!!!!!!!!! Ver 1.5.0 Ver 1.5.0 특징 - STT 모델 추가 -> ETRI api, Openai Whisper 로컬 설치 - 코드 모듈화 1. STT 모델 저번 Ver 1.0.0에서 말했듯..
시작하기 전 오늘은 파이썬을 이용한 음성비서 프로젝트를 해보고자 하였다. 패스트캠퍼스 부트캠프를 수강하면서 프로젝트를 해보라고해서 시작하게 되었는데, 어느정도까지 만들어야하는지 혹은 어떤 기능이 들어가야하는지에 대한 설명이 없었어서, 내가 기획하여 진행했다. 내가 원하는 건 진정한 음성비서였는데, 프로젝트를 시작하기 전 대략적으로 음성비서에 대해서 찾아보니 대부분 어떤 특정 키워드를 말하면 그거에 대한 반응이 오도록 구현 하였다. (예를 들어, 날씨 라고 말하면 날씨를 알려주던지, 주식 이라고 말하면 정해진 주가를 알려주던지 등) 그러나 나는 음성 "비서"이기 때문에 뭔가 대화를 해보고 싶었다.(당연히 이렇게 짧게해서 될 건아니지만..) 아무튼 이런 마음을 가지고 시작하게 되었다. 대략 6일간의 기간이 ..
오늘은 음성비서 프로젝트에 gpt 모델을 곁들여보면 어떨까해서 KoGpt를 써보게 되었다. 설명은 다른 블로그들에 많으니, 단순하게 설치하는 과정만 나중에 보기위해 작성해보겠다. 0. KoGpt API 사용 사실 따로 프롬프트 튜닝등을 위한게 아니라면 API를 사용하는게 훠어어어얼씬 편하다. # -*- coding: utf-8 -*- from PyKakao import KoGPT api = KoGPT(service_key = "자신의 REST API") prompt = "의료 스타트업으로 구성된 원격의료산업협의회가 10월부터 열리는 국정감사 시기에 맞춰 국회와 정부에 비대면 진료법 근거 마련을 촉구하는 정책제안서를 제출한다. 코로나19 사태에 비대면 진료의 한시 허용으로 원격 진료, 의약품 배송 등 서비..
오늘은 음성비서 프로젝트를 시작하는데, speech to text 관련하여 찾아보다가, open ai의 whisper을 한번 시도해보았다. whisper은 api가 있긴하지만 유료이기 때문에 github에서 로컬에 직접 설치하여 사용해봤다. whisper webui 등도 있다고하고, 보통 colab에 설치해서 자주 사용한다고 하는데, 나는 프로젝트를 진행해보느라 컴퓨터도 사양이 되길래 로컬에 직접 설치해봤다. 1. Whisper Github GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision - GitH..
창빵맨
'프로젝트/음성비서' 카테고리의 글 목록 (2 Page)