본문 바로가기
자격증/AICE🎓

[AICE] Pandas 이해 및 활용

by 무명오리 2023. 9. 13.

import pandas

 

DataFrame명 = pd.read_csv(파라미터)

 

파라미터

① filepath or buffer

② sep or delimiter (초기값은 ,(comma)

③ encoding (utf8, cp949...)

 

shape

columns

info

describe

dtype

 

데이터를 가져오는 두 가지 방법

loc (location): 행 이름/라벨 

iloc (integer location): 행 번호 


pandas는 대소문자 구별 DataFrame

 

pivot : pandas.pivot(index, columns, values)

df.pivot(index="a", columns='b', values='c')

a,b,c는 다 col이었음

 

pivot_table : pandas.pivot_table(index, columns, values, aggfunc)

aggrefunction 함수 활용 (집계까지 가능)

index or colummns가 2개 이상 중복 값인 경우도 가능 (pivot은 불가능)

 

stack :  컬럼 레벨에서 인덱스 레벨로 DF 변경 (위에서 아래로 길게 쌓기)

 

unstack : 인덱스 레벨에서 컬럼 레벨로 DF 변경 (옆으로 늘어 놓기)


concat : 데이터 속성이 동일한 데이터 set끼리 합치는 경우

단순히 DF을 합칠때 (월별, 연도별...)

ignore_index = False or True (False가 default)

axis = 0 or 1 (행, 열)

join = 'inner' or 'outer' (교집합, 합집합)

verify_integrity = False or True (False가 default로 index 중복되어도 error 발생X)

 

merge : 두 DF을 공통된 항목을 기준으로 합침

how = "inner(교), left, right, outer(합)" 중 선택

 

 

 

 

 

 

 

'자격증 > AICE🎓' 카테고리의 다른 글

[AICE] 머신러닝  (0) 2023.09.19
[AICE] 데이터 전처리  (0) 2023.09.17
[AICE] Matplotlib 활용  (0) 2023.09.15
[AICE] AI의 이해  (0) 2023.09.07
[AICE] 공부 시작  (0) 2023.08.28