본문 바로가기

자격증/AICE🎓11

[AICE] 딥러닝 딥러닝 데이터를 통해 패턴을 배움 딥러닝 모델의 매개변수(weight, bias)를 무작위로 부여한 후, 반복학습을 통해 모델의 출력값을 정답과 일치하도록 매개변수를 조금씩 조정 DNN (Deep Neural Network) 입력층과 출력층 사이에 여러 개의 은닉층(hidden layer)으로 이루어진 인공신경망 신경망 출력에 비선형 활성화 함수를 추가하여 복잡한 비선형 관계 모델링 가능 ※ dropout : 과적합 방지, train 학습 시에만 사용 import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Dropout model = Sequential() .. 2023. 9. 20.
[AICE] 머신러닝 linear Regression 모델 학습 목표: 최적 직선 구하기 직선별 손실함수 구하기(실제값-예측값)^2/N 손실함수 최소값 구하기(경사하강법으로) 지도학습(supervised learning) 정답 필수 데이터와 레이블(정답) 함께 제공 분류모델(Classification) - 레이블 값들이 이산적으로 나눠질 수 있는 문제에 사용 예측모델(Regression) - 레이블 값들이 연속적인 문제에 사용 비지도학습(un-supervised learning) 정답 없이 진행 데이터 자체에서 패턴을 찾아내야 할 때 사용 confusion matrix 모델의 대략적인 성능확인과 모델의 성능을 오차행렬을 기반으로 수치로 표현 맞느냐 틀렸느냐 → T/F P/N ← 예측한 값 성능지표 정밀도 : 모델이 True라.. 2023. 9. 19.
[AICE] 데이터 전처리 데이터 확인 : 육안 head(), tail() 통계적 특성 확인 : 수치 데이터, 수학적 특성 describe() : count(유효데이터수), mean(값평균), std(표준편차), min(최소값), 25%(1사분위값), 50%(2사분위값, 중위값), 75%(3사분위값), max(최대값) 확인 가능 (수치형 데이터만 불러옴) Table 정보 확인 : 컬럼 수, 데이터 타입 info() 결측치(missing value) 데이터분석시 좋은 성능의 AI 모델을 만들기 위해 반드시 처리해야! 0은 결측치인가? NO! 1. 실무자의 견해가 많이 반영되는 단계 2. 시간이 많이 투자되어야 함 3. 결측치를 제거하는 것은 가장 쉽게 처리할 수 있지만, 막대한 데이터 손실 동반 4. 단순 대체할 경우, 데이터에 편.. 2023. 9. 17.
[AICE] Matplotlib 활용 plt.figure() : 시각화 그림을 푯기할 영역 지정 plt.plot() : 시각화 차트 및 값 지정 plt.show() : 시각화 출력 plt.plot() : 선 그래프 - 시간따른 변화 plt.scatter(x, y) : 산점도 - 두 값 간의 상관관계 plt.hist() : 히스토그램 - 수치형 데이터 분포(빈도, 빈도밀도, 확률 등) plt.hist(df["col명"], bins="빈도") plt.boxplt(x) : 박스 그래프 - 수치적 자료(최소값, 제 1사분위값, 제 2사분위값, 제 3사분위값, 최대값) df.boxplot(by="group화 할 값" , column="박스 그래프로 나타낼 값") plt.bar(x, height) : 범주형 데이터의 수치 요약(일반적으로 가로, 세로,.. 2023. 9. 15.