'머신러닝' 태그의 글 목록 (2 Page)

본문 바로가기

728x90

머신러닝

4/7 목 목요일! 오늘도 Multinomial Classification를 대표적인 예제(MNIST)를 통해 배운다~ 손으로 쓴 숫자들로 이루어진 대형 데이터베이스~ MNIST 이미지는 그 자체가 2차원이고 그런 게 여럿이기 때문에 3차원. 이미지를 1차원으로 ravel() 해야 함 https://www.kaggle.com/competitions/digit-recognizer/data?select=test.csv Digit Recognizer | Kaggle www.kaggle.com Tensorflow Ver. 1.15은 배운 이론을 코드로 이해하기에는 좋지만 코드가 너무 어렵다. 1. Multinomial Classification by Tensorflow Ver. 1.15 - MNIST import nump.. 더보기

4/6 수 수요일! 오늘은 Multinomial Classification을 배운다. Linear Regression(연속적인 숫자 값 예측)이 발전한 것이 Logistic Regression → Classification(분류를 판단하는 예측) - Binary Classification(이항분류) - Multinomial Classification(다항분류) Logistic Regression은 이진 분류에 특화됨 SKlearn이 제공하는 분류기인 Gradient Descent(경사하강법)가 발전한 형태인 SGD Classifier(Stochastic Gradient Descent, 확률적 경사하강법) 1. Binary Classification - 위스콘신 유방암 데이터 by Gradient Descent Cl.. 더보기

4/5 화 화요일! Logistic Regression을 활용해 머신러닝 진행 시 주의사항을 알아본다. 앞으로 우리는 Classification(이항분류)의 Metrics로 Accuracy를 사용할 예정이다. 모델 평가 전 고려해야 하는 것들 1. learning rate(학습률) : loss 값을 보면서 학습률을 조정해야 함. 보통 1의 마이너스 4승으로 잡음 학습률이 너무 크다면 global minima(W')를 찾을 수 없게 됨 → OverShooting 발생 학습률이 아주 작다면 local minima 찾게 됨 2. Normalization(정규화) : MinMax Scaling - 0 ~ 1. 이상치에 민감함 Standardization - 표준화, Z-Score. 상대적으로 이상치에 둔감함, 모든 칼럼에.. 더보기

7회 차 | 4/4 월 7회 차! 벌써 스터디 4주 차다~ 첫째 주는 타이타닉, 둘째 주는 MovieLens EDA · 시각화 · 기술통계, 셋째 주는 캐글 및 데이콘의 예제 혹은 각자 수집한 데이터셋으로 진행하는 머신러닝 프로젝트가 있었다. 이번 주는 지난번에 수정한 커리큘럼에 따라 멀캠 주간 수업에서 배운 인공신경망을 복습하고 프레임워크를 공부하는 것으로 가닥을 잡았었다. 하지만 아직 성능평가(Metrics)를 배우고 있어, 아직 딥러닝으로 진도가 나가지 않았다. 내일까지 제출해야 하는 수행평가도 있어, 이에 대한 각자의 진행 상황을 리뷰하는 것으로 대체했다. (데이터 분석, 반복문, 불린 인덱싱, 전처리, 정규화, 결측치 · 이상치 처리 등 스타일이 다 다르다. 참고해서 최적의 방법을 익히자) 운영진 회의를 거쳐 정한 커.. 더보기

4/4 월 월요일! 오늘은 금요일에 실습 예제로 주어졌던 admission(대학원 합격 여부) 데이터셋을 Sklearn, Tensorflow로 구현하고, 지난주에 배운 Logistic Regression을 활용해 평가지표(Metrics)를 알아본다. 1. Logistic Regression by Sklearn import numpy as np import pandas as pd import tensorflow as tf from sklearn import linear_model from sklearn.preprocessing import MinMaxScaler from scipy import stats import matplotlib.pyplot as plt import warnings warnings.filter.. 더보기

6회 차 | 4/1 금 6회 차! 스터디 출석부 보다 보니, 교육이 얼마 남지 않을 걸 실감한다. 6월 28일에 끝나는 교육 기간 중 AI와 융복합 프로젝트에 들어가는 기간을 제외하면, 수업은 16일 남았다. (머신러닝 교육 2일 + 딥러닝 교육 14일) 프로젝트 시작 전 남은 스터디 횟수도 6번.. 기간이 짧고 배울 양이 많고 심도 있는 내용이다 보니 배울 때 제대로 체내화 해야 한다!! 🐱‍🐉 오늘은 지난주 금요일에 각자 선정한 머신러닝 프로젝트를 발표했다. 스터디 인원 대부분이 데이콘 예제로 프로젝트를 진행하고 실제로 완성한 코드 제출도 하였더라! 👍 결측치가 있고, feature 별로 형태가 다르거나, 우리가 배운 회귀만 쓰는 것이 아닌 분류 등 다양한 모델을 학습하는데 쓰는 동료들. 나는 작고 소중하고 깔끔한 데이터 .. 더보기

4/1 금 금요일! 😎 어제 잠깐 소개한 Logistic Regression을 배운다~ Linear Regression(연속적인 숫자 값 예측)이 발전한 것이 Logistic Regression → Classification(분류를 판단하는 예측) - Binary Classification(이항분류) - Multinomial Classification(다항분류) 그래프를 볼 수 있는 유틸리티 모듈(mglearn)을 추가적으로 설치하자 conda activate maching_TF15 pip install mglearn conda install은 이미 설치되어 있는 모듈, 패키지에 대한 Dependency를 고려해서 최적인 버전을 설치, pip install은 그냥 깔아버림 Logistic Regression : L.. 더보기

3/31 목 목요일! 오늘은 우리가 주력으로 사용할 Tensorflow를 배운다! 🐱‍🏍 수행평가 또 나왔넹.. 데이터 핸들링 2 + 머신러닝(다중선형회귀) 1. 4/5 화요일까지 제출!! Ozone 데이터로 다중선형회귀를 3가지 방법(Python, Sklearn, Tensorflow)으로 구현, 예측치가 비슷하게 나와야 한다! 당연히 데이터 전처리(결치값, 이상치, 정규화)도~ 가장 많이 쓰이는 딥러닝 오픈소스 라이브러리는 Google의 Tensorflow와 Facebook의 PyTorch~ Sklearn은 데이터 양과 변수가 많아지면 속도가 굉장히 느려지기 때문에, Tensorflow를 이용한다. Tensorflow 2.0 ver.이 등장하면서 이전 버전과는 완전히 다르게 바뀌었다. 기존에 만들었던 가상환경(ma.. 더보기

이전 1 2 3 4 5 다음

728x90

티스토리툴바