Classification ์ธ๋ค์ผํ ๋ฆฌ์คํธํ 4/8 ๊ธ ๊ธ์์ผ! ๐ฑ๐ ์ค๋์ Regression์ ๋๋ธ๋ค~~ 4/11 ์์์ผ์ ๋จธ์ ๋ฌ๋ ํ๋ต ํ๊ฐ, 4/17 ์ผ์์ผ์ ์ํํ๊ฐ 4๊ฐ์ง ์ ์ถ์ด ์๋ค. ๊ฒฐ์ธก์น ์ฒ๋ฆฌ๋ ์ญ์ ํ๊ฑฐ๋, imputation(๋ณด๊ฐ, ๋์ฒด) - ํ๊ท ํ ๊ธฐ๋ฒ(๋ ๋ฆฝ๋ณ์๋ฅผ ๋ํ๊ฐ์ผ๋ก ๋์ฒด), ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ(์ข ์๋ณ์๊ฐ ๋์. KNN) KNN(K-Nearest Neighbors, K-์ต๊ทผ์ ์ด์) : hyperparameter๋ k(=1์ผ ๋ ์ด๋ ์ ๋์ ์ฑ๋ฅ ๋ณด์ฅ)์ ๊ฑฐ๋ฆฌ์ธก์ ๋ฐฉ์(์ฃผ๋ก ์ ํด๋ผ๋์ ์ฌ์ฉ) ๋ฐ๋์ ์ ๊ทํ๋ฅผ ์งํํด์ผ ํจ. ๋ชจ๋ ๋ฐ์ดํฐ์ ๋ํด ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํด์ผ ํ๋ฏ๋ก ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆด ์ ์์ 1. Logistic Regression + KNN - BMI data import numpy as np import pandas as pd fro.. ๋๋ณด๊ธฐ 4/5 ํ ํ์์ผ! Logistic Regression์ ํ์ฉํด ๋จธ์ ๋ฌ๋ ์งํ ์ ์ฃผ์์ฌํญ์ ์์๋ณธ๋ค. ์์ผ๋ก ์ฐ๋ฆฌ๋ Classification(์ดํญ๋ถ๋ฅ)์ Metrics๋ก Accuracy๋ฅผ ์ฌ์ฉํ ์์ ์ด๋ค. ๋ชจ๋ธ ํ๊ฐ ์ ๊ณ ๋ คํด์ผ ํ๋ ๊ฒ๋ค 1. learning rate(ํ์ต๋ฅ ) : loss ๊ฐ์ ๋ณด๋ฉด์ ํ์ต๋ฅ ์ ์กฐ์ ํด์ผ ํจ. ๋ณดํต 1์ ๋ง์ด๋์ค 4์น์ผ๋ก ์ก์ ํ์ต๋ฅ ์ด ๋๋ฌด ํฌ๋ค๋ฉด global minima(W')๋ฅผ ์ฐพ์ ์ ์๊ฒ ๋จ → OverShooting ๋ฐ์ ํ์ต๋ฅ ์ด ์์ฃผ ์๋ค๋ฉด local minima ์ฐพ๊ฒ ๋จ 2. Normalization(์ ๊ทํ) : MinMax Scaling - 0 ~ 1. ์ด์์น์ ๋ฏผ๊ฐํจ Standardization - ํ์คํ, Z-Score. ์๋์ ์ผ๋ก ์ด์์น์ ๋๊ฐํจ, ๋ชจ๋ ์นผ๋ผ์.. ๋๋ณด๊ธฐ 4/4 ์ ์์์ผ! ์ค๋์ ๊ธ์์ผ์ ์ค์ต ์์ ๋ก ์ฃผ์ด์ก๋ admission(๋ํ์ ํฉ๊ฒฉ ์ฌ๋ถ) ๋ฐ์ดํฐ์ ์ Sklearn, Tensorflow๋ก ๊ตฌํํ๊ณ , ์ง๋์ฃผ์ ๋ฐฐ์ด Logistic Regression์ ํ์ฉํด ํ๊ฐ์งํ(Metrics)๋ฅผ ์์๋ณธ๋ค. 1. Logistic Regression by Sklearn import numpy as np import pandas as pd import tensorflow as tf from sklearn import linear_model from sklearn.preprocessing import MinMaxScaler from scipy import stats import matplotlib.pyplot as plt import warnings warnings.filter.. ๋๋ณด๊ธฐ ์ด์ 1 ๋ค์