'멀티캠퍼스' 태그의 글 목록 (3 Page)

본문 바로가기

728x90

멀티캠퍼스

7회 차 | 4/4 월 7회 차! 벌써 스터디 4주 차다~ 첫째 주는 타이타닉, 둘째 주는 MovieLens EDA · 시각화 · 기술통계, 셋째 주는 캐글 및 데이콘의 예제 혹은 각자 수집한 데이터셋으로 진행하는 머신러닝 프로젝트가 있었다. 이번 주는 지난번에 수정한 커리큘럼에 따라 멀캠 주간 수업에서 배운 인공신경망을 복습하고 프레임워크를 공부하는 것으로 가닥을 잡았었다. 하지만 아직 성능평가(Metrics)를 배우고 있어, 아직 딥러닝으로 진도가 나가지 않았다. 내일까지 제출해야 하는 수행평가도 있어, 이에 대한 각자의 진행 상황을 리뷰하는 것으로 대체했다. (데이터 분석, 반복문, 불린 인덱싱, 전처리, 정규화, 결측치 · 이상치 처리 등 스타일이 다 다르다. 참고해서 최적의 방법을 익히자) 운영진 회의를 거쳐 정한 커.. 더보기

4/4 월 월요일! 오늘은 금요일에 실습 예제로 주어졌던 admission(대학원 합격 여부) 데이터셋을 Sklearn, Tensorflow로 구현하고, 지난주에 배운 Logistic Regression을 활용해 평가지표(Metrics)를 알아본다. 1. Logistic Regression by Sklearn import numpy as np import pandas as pd import tensorflow as tf from sklearn import linear_model from sklearn.preprocessing import MinMaxScaler from scipy import stats import matplotlib.pyplot as plt import warnings warnings.filter.. 더보기

6회 차 | 4/1 금 6회 차! 스터디 출석부 보다 보니, 교육이 얼마 남지 않을 걸 실감한다. 6월 28일에 끝나는 교육 기간 중 AI와 융복합 프로젝트에 들어가는 기간을 제외하면, 수업은 16일 남았다. (머신러닝 교육 2일 + 딥러닝 교육 14일) 프로젝트 시작 전 남은 스터디 횟수도 6번.. 기간이 짧고 배울 양이 많고 심도 있는 내용이다 보니 배울 때 제대로 체내화 해야 한다!! 🐱‍🐉 오늘은 지난주 금요일에 각자 선정한 머신러닝 프로젝트를 발표했다. 스터디 인원 대부분이 데이콘 예제로 프로젝트를 진행하고 실제로 완성한 코드 제출도 하였더라! 👍 결측치가 있고, feature 별로 형태가 다르거나, 우리가 배운 회귀만 쓰는 것이 아닌 분류 등 다양한 모델을 학습하는데 쓰는 동료들. 나는 작고 소중하고 깔끔한 데이터 .. 더보기

4/1 금 금요일! 😎 어제 잠깐 소개한 Logistic Regression을 배운다~ Linear Regression(연속적인 숫자 값 예측)이 발전한 것이 Logistic Regression → Classification(분류를 판단하는 예측) - Binary Classification(이항분류) - Multinomial Classification(다항분류) 그래프를 볼 수 있는 유틸리티 모듈(mglearn)을 추가적으로 설치하자 conda activate maching_TF15 pip install mglearn conda install은 이미 설치되어 있는 모듈, 패키지에 대한 Dependency를 고려해서 최적인 버전을 설치, pip install은 그냥 깔아버림 Logistic Regression : L.. 더보기

3/31 목 목요일! 오늘은 우리가 주력으로 사용할 Tensorflow를 배운다! 🐱‍🏍 수행평가 또 나왔넹.. 데이터 핸들링 2 + 머신러닝(다중선형회귀) 1. 4/5 화요일까지 제출!! Ozone 데이터로 다중선형회귀를 3가지 방법(Python, Sklearn, Tensorflow)으로 구현, 예측치가 비슷하게 나와야 한다! 당연히 데이터 전처리(결치값, 이상치, 정규화)도~ 가장 많이 쓰이는 딥러닝 오픈소스 라이브러리는 Google의 Tensorflow와 Facebook의 PyTorch~ Sklearn은 데이터 양과 변수가 많아지면 속도가 굉장히 느려지기 때문에, Tensorflow를 이용한다. Tensorflow 2.0 ver.이 등장하면서 이전 버전과는 완전히 다르게 바뀌었다. 기존에 만들었던 가상환경(ma.. 더보기

3/30 수 수요일! 어제 사용한 Ozone data를 Python과 Sklearn으로 Simple Linear Regression(단순 선형 회귀)을 구현했을 때, 왜 모양이 다른지 알아보자~ 이유 1. Missing Value(결치값) 처리 - 삭제 : 전체 데이터가 100만 건 이상이며 결치값이 5% 이내일 때 - 대체 : 대표값으로 대체(평균, 중위, 최대, 최소, 최빈) 혹은 머신러닝 기법을 사용(더 좋은 방식! 결치값이 종속변수일 때) 이유 2. 이상치 처리 이상치는 값이 일반적인 다른 데이터에 비해 편차가 큰 데이터이기 때문에 평균, 분산에 큰 영향을 미침 → 데이터를 상당히 불안하게 만드는 요소 - 지대값 : 독립변수(원인)에 있는 이상치 - Outlier : 종속변수(결과)에 있는 이상치 1. 이상치.. 더보기

5회 차 | 3/29 화 5회 차! 지난주 금요일에 각자 선정한 머신러닝 프로젝트 주제의 진행상황(EDA, 데이터 핸들링, 시각화, 기술통계, 모델링)을 리뷰했다. 금요일은 전체 모임에서 10분씩 최종 리뷰! 기존에 골랐던 주식 종료 가격 예측은 대회가 마감되어 이곳저곳 코드 리뷰한 곳들을 뒤져도, 모델링에 필요한 데이터셋(stock_list.csv : 종목 번호 데이터, sample_submission.csv)을 구할 수가 없기에 부득이하게도 기존에 캐글 예제로 골랐던 보스턴 집값 예측으로 변경했다. 내가 일하고 싶은 분야도 자산운용의 로보어드바이저 부문이기 때문에, 나중에 꼭 주식 가격 예측을 구현해 볼 예정이다! https://dacon.io/competitions/official/235857/overview/descrip.. 더보기

3/29 화 화요일! 오늘은 어제 배운 Simple Linear Regression(단순 선형 회귀)을 코드로 구현한다. 1. Training Data Set 준비 : Data pre-processing(데이터 전처리). 사용할 수 있는 형태로 준비 2. Linear Regression Model을 정의 : y = Wx+b(예측 모델). hypothesis(가설) 3. 최적의 W(weight, 가중치), b(bias, 편차)를 구하려면 loss function(손실함수)/cost function(비용함수) → MSE 4. Gradient Descent Algorithm(경사하강법) : loss function을 편미분(W, b) × learning rate 5. 반복학습 진행 1. Training Dat.. 더보기

이전 1 2 3 4 5 6 ··· 8 다음

728x90

티스토리툴바