import pandas
DataFrame명 = pd.read_csv(파라미터)
파라미터
① filepath or buffer
② sep or delimiter (초기값은 ,(comma)
③ encoding (utf8, cp949...)
shape
columns
info
describe
dtype
데이터를 가져오는 두 가지 방법
loc (location): 행 이름/라벨
iloc (integer location): 행 번호
pandas는 대소문자 구별 DataFrame
pivot : pandas.pivot(index, columns, values)
df.pivot(index="a", columns='b', values='c')
a,b,c는 다 col이었음
pivot_table : pandas.pivot_table(index, columns, values, aggfunc)
aggrefunction 함수 활용 (집계까지 가능)
index or colummns가 2개 이상 중복 값인 경우도 가능 (pivot은 불가능)
stack : 컬럼 레벨에서 인덱스 레벨로 DF 변경 (위에서 아래로 길게 쌓기)
unstack : 인덱스 레벨에서 컬럼 레벨로 DF 변경 (옆으로 늘어 놓기)
concat : 데이터 속성이 동일한 데이터 set끼리 합치는 경우
단순히 DF을 합칠때 (월별, 연도별...)
ignore_index = False or True (False가 default)
axis = 0 or 1 (행, 열)
join = 'inner' or 'outer' (교집합, 합집합)
verify_integrity = False or True (False가 default로 index 중복되어도 error 발생X)
merge : 두 DF을 공통된 항목을 기준으로 합침
how = "inner(교), left, right, outer(합)" 중 선택
'자격증 > AICE🎓' 카테고리의 다른 글
[AICE] 머신러닝 (0) | 2023.09.19 |
---|---|
[AICE] 데이터 전처리 (0) | 2023.09.17 |
[AICE] Matplotlib 활용 (0) | 2023.09.15 |
[AICE] AI의 이해 (0) | 2023.09.07 |
[AICE] 공부 시작 (0) | 2023.08.28 |