Linux AIHub 데이터 다운로드

2024. 12. 6. 10:46·알쓸신잡

저번에는 Linux에서 `INNORIX-EX-Agent`를 설치하여서 윈도에서처럼 AIHub에 있는 데이터를 받아보았는데, 대용량 데이터셋 같은 경우에는 서버에서 바로 다운로드해야 되기 때문에 api를 이용해서 다운로드하려고 했다.

마침 AIHub에서 `aihubshell`이라는 편리한것이 있길래, 이미 설명이 잘되어있지만 정리겸 작성해보려고 한다.

 

1. aihubshell 다운로드

~$ curl -o "aihubshell" https://api.aihub.or.kr/api/aihubshell.do # 다운로드
chmod +x aihubshell                                               # 실행권한부여
sudo cp aihubshell /usr/bin                                       # 전역등록

2. 계정정보 등록

nano ~/.bashrc

export AIHUB_ID={id}                  # 추가
export AIHUB_PW='{password}'          # 추가(''로 감싸기)

source ~/.bashrc

3. 사용법

3-1. 도움말

aihubshell -help

3-2. AIHub 데이터셋 조회

aihubshell -mode l
aihubshell -mode l | grep {검색어}

3-3. AIHub 데이터셋 내 파일목록 조회

aihubshell -mode l -datasetkey {datasetkey}

 이 때 `datasetkey`는 `grep 명령어`으로 검색했을 때 나오는 숫자, 혹은 AIHub의 해당 데이터셋 페이지 주소창의 맨 뒤 숫자

3-4. 데이터셋 다운로드

aihubshell -mode d -datasetkey {datasetkey}                    # 데이터셋 전체 다운로드 
aihubshell -mode d -datasetkey {datasetkey} -filekey {filekey} # 일부 파일 다운로드

`filekey` 는 3-3에서의 파일목록 조회할 때 옆에 숫자로도 나오고, 웹페이지 내에서도 확인 가능

`filekey`는 `,`로 구분하여 한번에 여러 개 다운로드 가능

 

Docs

 

AI-Hub

AI 허브 오픈 API'aihubshell' 이용안내 AI 허브에서 제공하고 있는 인공지능 학습용 데이터를 API를 통해 다운로드 받을 수 있습니다. Linux 등 다양한 개발환경에서 데이터 다운로더인, aihubshell을 제공

www.aihub.or.kr

 

728x90

'알쓸신잡' 카테고리의 다른 글

HuggingFace-CLI usage  (0) 2024.12.24
vscode 디버깅 - justMycode  (0) 2024.12.18
Gradio 'every' parameter usage  (0) 2024.12.04
내부망 docker 설치  (0) 2024.11.27
yolo 가이드  (0) 2024.11.22
'알쓸신잡' 카테고리의 다른 글
  • HuggingFace-CLI usage
  • vscode 디버깅 - justMycode
  • Gradio 'every' parameter usage
  • 내부망 docker 설치
창빵맨
창빵맨
  • 창빵맨
    Let's be Developers
    창빵맨
    로그인/로그아웃
  • 전체
    오늘
    어제
    • 분류 전체보기 (481)
      • 알쓸신잡 (88)
      • ML & DL (85)
        • Computer v.. (22)
        • NLP (22)
        • 파이썬 머신러닝 완.. (3)
        • 개념정리 (38)
      • 리눅스 (21)
      • 프로젝트 (29)
        • 산불 발생 예측 (6)
        • 음성비서 (12)
        • pdf 병합 프로그.. (0)
        • 수위 예측 (5)
        • 가짜 뉴스 분류 (5)
        • 전력사용량 예측 (1)
      • 코딩테스트 (217)
        • 프로그래머스[Pyt.. (17)
        • 프로그래머스[Fai.. (3)
        • 백준[Python] (160)
        • 이것이취업을위한코딩.. (18)
        • 파이썬 알고리즘 (19)
      • 데이터분석실습 (25)
        • 데이터 과학 기반의.. (18)
        • 헬로 데이터 과학 (7)
      • 메모장 (0)
      • 잡담 (4)
  • Blog

    • 🏠 Home

    ✏️글쓰기
    💻 관리

    Personal

    GITHUB
    Instagram
  • 공지사항

  • 인기 글

  • 태그

    그리디
    나동빈
    이코테
    이것이취업을위한코딩테스트다
    DFS
    파이썬
    BFS
    이분탐색
    백준
    dp
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
상단으로

티스토리툴바