ML & DL/파이썬 머신러닝 완벽 가이드

데이터 셀렉션 및 필터링 (p.62) 넘파이의 경우에는 [ ]연산자를 이용해서 값을 추출하거나, 슬라이싱 , 인덱싱 등을 수행했었는데, 판다스의 경우 .iloc[]이나 .loc[]를 이용하여 동일한 작업을 수행한다. 그전에 우선 판다스의 [ ]연산자와 넘파이의 [ ] 연산자의 차이를 알아보자 우선 쉽게 이해하려면 판다스에서의 [ ] 연산자는 단순하게 column을 지정할 수 있는 연산자라고만 생각하면 편하다. 예를 들어 데이터프레임에서 특정 컬럼을 추출하고자 하는데, [ ] 안에 컬럼명이 아닌 숫자등을 적게 되면 오류가 난다. 그런데 또 숫자를 적으면 무조건 오류가 나는 것이 아니라, 단일 숫자값등을 적으면 오류가 나는데, 인덱싱을 나타내는 0:2 혹은 boolean 인덱싱을 나타내는 것들은 [ ] 안에..
데이터 핸들링 판다스 (p.39) 판다스는 파이썬에서 데이터 처리를 위해 사용되는 라이브러리. 핵심객체는 DataFrame으로, 여러개의 행과 열로 이뤄진 2차원 데이터를 담는 데이터 구조체이다. 판다스 시작- 파일을 DataFrame으로 로딩, 기본 API import pandas as pd 판다스는 다양한 포맷으로 된 파일을 DataFrame으로 로딩할 수 있는 편리한 api를 제공한다.(read_csv, read_table, read_fwf 등) 이 때 read_csv()와 read_table의 차이는 필드 구문 문자(Delimeter)을 csv에서는 ,를 기준으로 하고 table에서는 tab을 기준으로 한다는 것이다. 이 때 read_csv()의 경우 사실 sep라는 인자를 추가해주면 어떠한 형식..
넘파이-Numpy-Numerical python 머신러닝의 대부분 알고리즘-선형대수, 통계 기반. >넘파이는 배열 기반의 빠른 연산 및 다양한 데이터 핸들링 기능을 제공. 넘파이 ndarray 개요 (p.14) 넘파의의 기반 데이터 타입은 ndarray. 이 ndarray를 이용하여 다차원 배열을 쉽게 생성하고, 다양한 연산을 수행. 이러한 ndarray는 넘파이의 array()함수를 이용하여 생성함. 생성된 ndarray배열의 shape변수는 ndarray의 크기(행과 열의수)를 튜플 형태로 가지고있으며 이를 통해 ndarray배열의 차원을 확인할 수 있다. ndarray.shape는 ndarray의 차원과 크기를 튜플형태로 나타내준다. → 쉽게 생각하면, 리스트 한개로 구성되어 있으면 1차원, 리스트..
창빵맨
'ML & DL/파이썬 머신러닝 완벽 가이드' 카테고리의 글 목록