'regression' 태그의 글 목록

본문 바로가기

728x90

regression

4/8 금 금요일! 🐱‍🏍 오늘은 Regression을 끝낸다~~ 4/11 월요일은 머신러닝 필답 평가, 4/17 일요일은 수행평가 4가지 제출이 있다. 결측치 처리는 삭제하거나, imputation(보간, 대체) - 평균화 기법(독립변수를 대표값으로 대체), 머신러닝 기법(종속변수가 대상. KNN) KNN(K-Nearest Neighbors, K-최근접 이웃) : hyperparameter는 k(=1일 때 어느 정도의 성능 보장)와 거리측정 방식(주로 유클라디안 사용) 반드시 정규화를 진행해야 함. 모든 데이터에 대해 거리를 계산해야 하므로 시간이 오래 걸릴 수 있음 1. Logistic Regression + KNN - BMI data import numpy as np import pandas as pd fro.. 더보기

4/5 화 화요일! Logistic Regression을 활용해 머신러닝 진행 시 주의사항을 알아본다. 앞으로 우리는 Classification(이항분류)의 Metrics로 Accuracy를 사용할 예정이다. 모델 평가 전 고려해야 하는 것들 1. learning rate(학습률) : loss 값을 보면서 학습률을 조정해야 함. 보통 1의 마이너스 4승으로 잡음 학습률이 너무 크다면 global minima(W')를 찾을 수 없게 됨 → OverShooting 발생 학습률이 아주 작다면 local minima 찾게 됨 2. Normalization(정규화) : MinMax Scaling - 0 ~ 1. 이상치에 민감함 Standardization - 표준화, Z-Score. 상대적으로 이상치에 둔감함, 모든 칼럼에.. 더보기

4/4 월 월요일! 오늘은 금요일에 실습 예제로 주어졌던 admission(대학원 합격 여부) 데이터셋을 Sklearn, Tensorflow로 구현하고, 지난주에 배운 Logistic Regression을 활용해 평가지표(Metrics)를 알아본다. 1. Logistic Regression by Sklearn import numpy as np import pandas as pd import tensorflow as tf from sklearn import linear_model from sklearn.preprocessing import MinMaxScaler from scipy import stats import matplotlib.pyplot as plt import warnings warnings.filter.. 더보기

3/29 화 화요일! 오늘은 어제 배운 Simple Linear Regression(단순 선형 회귀)을 코드로 구현한다. 1. Training Data Set 준비 : Data pre-processing(데이터 전처리). 사용할 수 있는 형태로 준비 2. Linear Regression Model을 정의 : y = Wx+b(예측 모델). hypothesis(가설) 3. 최적의 W(weight, 가중치), b(bias, 편차)를 구하려면 loss function(손실함수)/cost function(비용함수) → MSE 4. Gradient Descent Algorithm(경사하강법) : loss function을 편미분(W, b) × learning rate 5. 반복학습 진행 1. Training Dat.. 더보기

3/28 월 월요일! 금요일에 이어 머신러닝 들어간다~ Weak AI의 머신러닝 기법들 : 지도 학습, 비지도 학습, 강화 학습 1. Regression(회귀) : 데이터에 영향을 주는 조건들의 영향력을 고려해서, 데이터에 대한 조건부 평균을 구하는 기법 * 평균을 구할 때 주의해야 할 점 : 평균을 구하는 데이터에 이상치가 있을 경우 대표값으로 사용하기 어려움. 정규분포여야 함! 고전적 선형 회귀 모델(Classical Linear Regression Model) 단순 선형 회귀(Simple Linear Regression) import numpy as np import pandas as pd import matplotlib.pyplot as plt df = pd.DataFrame({'공부시간(x)': [1,2,3.. 더보기

이전 1 다음

728x90

티스토리툴바