ZScore ์ธ๋ค์ผํ ๋ฆฌ์คํธํ 3/30 ์ ์์์ผ! ์ด์ ์ฌ์ฉํ Ozone data๋ฅผ Python๊ณผ Sklearn์ผ๋ก Simple Linear Regression(๋จ์ ์ ํ ํ๊ท)์ ๊ตฌํํ์ ๋, ์ ๋ชจ์์ด ๋ค๋ฅธ์ง ์์๋ณด์~ ์ด์ 1. Missing Value(๊ฒฐ์น๊ฐ) ์ฒ๋ฆฌ - ์ญ์ : ์ ์ฒด ๋ฐ์ดํฐ๊ฐ 100๋ง ๊ฑด ์ด์์ด๋ฉฐ ๊ฒฐ์น๊ฐ์ด 5% ์ด๋ด์ผ ๋ - ๋์ฒด : ๋ํ๊ฐ์ผ๋ก ๋์ฒด(ํ๊ท , ์ค์, ์ต๋, ์ต์, ์ต๋น) ํน์ ๋จธ์ ๋ฌ๋ ๊ธฐ๋ฒ์ ์ฌ์ฉ(๋ ์ข์ ๋ฐฉ์! ๊ฒฐ์น๊ฐ์ด ์ข ์๋ณ์์ผ ๋) ์ด์ 2. ์ด์์น ์ฒ๋ฆฌ ์ด์์น๋ ๊ฐ์ด ์ผ๋ฐ์ ์ธ ๋ค๋ฅธ ๋ฐ์ดํฐ์ ๋นํด ํธ์ฐจ๊ฐ ํฐ ๋ฐ์ดํฐ์ด๊ธฐ ๋๋ฌธ์ ํ๊ท , ๋ถ์ฐ์ ํฐ ์ํฅ์ ๋ฏธ์นจ → ๋ฐ์ดํฐ๋ฅผ ์๋นํ ๋ถ์ํ๊ฒ ๋ง๋๋ ์์ - ์ง๋๊ฐ : ๋ ๋ฆฝ๋ณ์(์์ธ)์ ์๋ ์ด์์น - Outlier : ์ข ์๋ณ์(๊ฒฐ๊ณผ)์ ์๋ ์ด์์น 1. ์ด์์น.. ๋๋ณด๊ธฐ ์ด์ 1 ๋ค์