[AICE] Pandas 이해 및 활용

import pandas

DataFrame명 = pd.read_csv(파라미터)

파라미터

① filepath or buffer

② sep or delimiter (초기값은 ,(comma)

③ encoding (utf8, cp949...)

shape

columns

info

describe

dtype

데이터를 가져오는 두 가지 방법

loc (location): 행 이름/라벨

iloc (integer location): 행 번호

pandas는 대소문자 구별 DataFrame

pivot : pandas.pivot(index, columns, values)

df.pivot(index="a", columns='b', values='c')

a,b,c는 다 col이었음

pivot_table : pandas.pivot_table(index, columns, values, aggfunc)

aggrefunction 함수 활용 (집계까지 가능)

index or colummns가 2개 이상 중복 값인 경우도 가능 (pivot은 불가능)

stack : 컬럼 레벨에서 인덱스 레벨로 DF 변경 (위에서 아래로 길게 쌓기)

unstack : 인덱스 레벨에서 컬럼 레벨로 DF 변경 (옆으로 늘어 놓기)

concat : 데이터 속성이 동일한 데이터 set끼리 합치는 경우

단순히 DF을 합칠때 (월별, 연도별...)

ignore_index = False or True (False가 default)

axis = 0 or 1 (행, 열)

join = 'inner' or 'outer' (교집합, 합집합)

verify_integrity = False or True (False가 default로 index 중복되어도 error 발생X)

merge : 두 DF을 공통된 항목을 기준으로 합침

how = "inner(교), left, right, outer(합)" 중 선택

잡화기록