본문 바로가기

멀티캠퍼스 프로젝트형 AI 서비스 개발 5회차/스터디

4회 차 | 3/25 금

728x90

4회 차!

 

화요일에 이어 조별로 머신러닝 수행평가 리뷰를 진행했다~

 

인원이 단출해서 진행 시간이 알맞고 자세한 피드백을 받을 수 있지만,

적은 인원과 각자 실력 편차가 클 경우 리뷰가 편협할 수 있다는 것이 단점..

 

이번 주는 멀티캠퍼스 수행평가용으로 제공된 MovieLens 데이터 세트의 문제를 풀고 아래와 같이 공부했다.

 

1. 수행평가 문제들 모두 하나씩 관련된 내용으로 시각화 하기
: scatter, histogram, heatmap, boxplot 만들었다.

→ 도수분포표(계급, 도수 + 계급값, 상대도수, 누적 상대도수) 만들어보자!


2. 10개 이상의 데이터 핸들링해보기
: 문제만 풀었다.

→ 상관관계가 있을 법하거나 궁금한 것들에 대해 더 핸들링 하자!

ex) 평균 평점이 가장 높은 영화 장르 중 (no genres listed)인 것들의 제목 출력하기, 유저들 중 가장 많이 평가한 사람의 영화 장르별 평균 평점 구하기


3. 기술통계는 수업시간에 배운 것들 하나씩 해보기

: 평균, 중위값, 최빈값 구했다.

→ 편차, 분산, 표준편차, 범위, 사분위를 구해보자!

 

이번 주 금요일은 이후에 각자 진행할 머신러닝 프로젝트 주제를 서로 다르게 골랐고,

다음 주 화요일(3/29)은 진행상황(EDA, 데이터 핸들링, 시각화, 기술통계)을 리뷰하고,

다음 주 금요일(4/1)은 11명이 모여 10분씩 리뷰하기로 했다.

 

무비렌즈 태그 데이터
Credit Card Fraud Detection
Wine Quality Dataset
서울시 따릉이 자전거 이용 예측
해외 축구선수 이적료 예측
구내식당 식수인원 예측
전복 성별 예측
기후 및 미세먼지 데이터를 이용한 미세먼지 예측
영화 관객 수 예측
주식 종료 가격 예측
아파트 실거래가 예측

728x90

'멀티캠퍼스 프로젝트형 AI 서비스 개발 5회차 > 스터디' 카테고리의 다른 글

6회 차 | 4/1 금  (0) 2022.04.02
5회 차 | 3/29 화  (0) 2022.03.30
3회 차 | 3/22 화  (0) 2022.03.22
2회 차 | 3/18 금  (0) 2022.03.19
1회 차 | 3/14 월  (0) 2022.03.15