3/23 ์
์์์ผ! ์ค๋์ ๊ธฐ์ ํต๊ณ๋ฅผ ๋ฐฐ์ด๋ค. 1์ฐจ์ ๋ฐ์ดํฐ์ ํน์ง ํ์
- ์์น์งํ → ๋ํ๊ฐ : ํ๊ท , ์ค์๊ฐ, ์ต๋/์ต์๊ฐ, ํธ์ฐจ, ๋ถ์ฐ, ํ์คํธ์ฐจ... - ์์์ ํํ → ๋์๋ถํฌํ, Histogram, Box plot * ์ต๋/์ต์๊ฐ์ ๋ํ๊ฐ์ผ๋ก ์ฌ์ฉํ๊ธฐ์ ๋ฌด๋ฆฌ๊ฐ ์์ 2์ฐจ์ ๋ฐ์ดํฐ์ ํน์ง ํ์
- ์์น์งํ → ๊ณต๋ถ์ฐ, ์๊ด๊ณ์ - ์์์ ํํ → Scatter ์ฐํฌ๋(dispersion) : ๋ฐ์ดํฐ๊ฐ ์ผ๋ง๋, ์ด๋ป๊ฒ ํผ์ ธ ์๋๊ฐ ๊ด์ ๋ฐ์ดํฐ๊ฐ ํฉ์ด์ง ์ ๋(๋ณ์ฐ์ฑ)๋ฅผ ์์น๋ก ํํํ๊ณ ์ถ๋ค๋ฉด → ๋ฒ์(range), ์ฌ๋ถ์ ๋ฒ์(IQR, Interquatile range), ํธ์ฐจ(deviation), ๋ถ์ฐ(variance), ํ์คํธ์ฐจ(standard deviation) 1์ฐจ์ ๋ฐ์ดํฐ์ ์์น์งํ → ํ๊ท , ์ค์..
๋๋ณด๊ธฐ
3/21 ์
์์์ผ! ์ค๋์ Pandas์ DataFrame(DataFrame ์ฐ๊ฒฐ · ๊ฒฐํฉ, Mapping, Grouping)์ ๋ง๋ฌด๋ฆฌ ์ง๊ณ , ๋ด์ผ๋ถํฐ ๋ฐ์ดํฐ์ ์๊ฐํ์ ๋ํด ๋ฐฐ์ด๋ค. 1. DataFrame ์ฐ๊ฒฐ : pd.concat(). default๋ ํ ๋ฐฉํฅ์ผ๋ก ์ฐ๊ฒฐ. ์ปฌ๋ผ ๋ช
์ด ๊ฐ์ ๊ฒ๋ค์ด ์๋ก ๊ฒฐํฉ๋จ import numpy as np import pandas as pd df1 = pd.DataFrame({'a':['a0', 'a1', 'a2', 'a3'], 'b':[1, 2, 3, 4], 'c':['c0', 'c1', 'c2', 'c3']}, index=[0, 1, 2, 3]) display(df1) df2 = pd.DataFrame({'b':[5, 6, 7, 8], 'c':['c0', 'c1', 'c2'..
๋๋ณด๊ธฐ