본문 바로가기

전체 글78

[AICE] 데이터 전처리 데이터 확인 : 육안 head(), tail() 통계적 특성 확인 : 수치 데이터, 수학적 특성 describe() : count(유효데이터수), mean(값평균), std(표준편차), min(최소값), 25%(1사분위값), 50%(2사분위값, 중위값), 75%(3사분위값), max(최대값) 확인 가능 (수치형 데이터만 불러옴) Table 정보 확인 : 컬럼 수, 데이터 타입 info() 결측치(missing value) 데이터분석시 좋은 성능의 AI 모델을 만들기 위해 반드시 처리해야! 0은 결측치인가? NO! 1. 실무자의 견해가 많이 반영되는 단계 2. 시간이 많이 투자되어야 함 3. 결측치를 제거하는 것은 가장 쉽게 처리할 수 있지만, 막대한 데이터 손실 동반 4. 단순 대체할 경우, 데이터에 편.. 2023. 9. 17.
[AICE] Matplotlib 활용 plt.figure() : 시각화 그림을 푯기할 영역 지정 plt.plot() : 시각화 차트 및 값 지정 plt.show() : 시각화 출력 plt.plot() : 선 그래프 - 시간따른 변화 plt.scatter(x, y) : 산점도 - 두 값 간의 상관관계 plt.hist() : 히스토그램 - 수치형 데이터 분포(빈도, 빈도밀도, 확률 등) plt.hist(df["col명"], bins="빈도") plt.boxplt(x) : 박스 그래프 - 수치적 자료(최소값, 제 1사분위값, 제 2사분위값, 제 3사분위값, 최대값) df.boxplot(by="group화 할 값" , column="박스 그래프로 나타낼 값") plt.bar(x, height) : 범주형 데이터의 수치 요약(일반적으로 가로, 세로,.. 2023. 9. 15.
갤럭시탭 듀얼 모니터로 사용하기 듀얼모니터에 한 번 빠지니 집에서도 쓰고 싶었다. 갤럭시 탭이 있으니 이걸 듀얼 모니터로 사용하기로 결정..! 물론 갤럭시 자체에서 듀얼 모니터 기능을 제공하고 있지만, 갤럭시 북에서만 제공...(갤럭시 노트도 그러더니.. 슬프다ㅠ) 서칭해보니 스페이스데스크가 무료이면서 유명한거 같아 노트북과 태블릿 두 군데에 다 설치해주었다. 누르자듀마자 모니터 복제로 잘되는걸 확인! 그러나 듀얼 모니터로 쓰기 위해서는 모니터 확장으로 설정 변경해줘야함! 이런 느낌으로 모니터가 확장된다! 나는 구글에서 검색해서 exe파일로 다운했는데 마이크로소프트 스토어에서도 다운가능하다 아무튼 잘되니까 좋아용! 2023. 9. 15.
[AICE] Pandas 이해 및 활용 import pandas DataFrame명 = pd.read_csv(파라미터) 파라미터 ① filepath or buffer ② sep or delimiter (초기값은 ,(comma) ③ encoding (utf8, cp949...) shape columns info describe dtype 데이터를 가져오는 두 가지 방법 loc (location): 행 이름/라벨 iloc (integer location): 행 번호 pandas는 대소문자 구별 DataFrame pivot : pandas.pivot(index, columns, values) df.pivot(index="a", columns='b', values='c') a,b,c는 다 col이었음 pivot_table : pandas.pivot_.. 2023. 9. 13.