๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

728x90

matplotlib

9/20 ํ™”_์šฐ๋ถ„ํˆฌ VS Code ํ•œ๊ธ€ ์ž…๋ ฅ ์•ˆ๋จ, Qt platform plugin ๊ฒฝ๋กœ ์—๋Ÿฌ 1. ์šฐ๋ถ„ํˆฌ VS Code ํ•œ๊ธ€ ์ž…๋ ฅ ์•ˆ๋จ ์ฃผ๋ง๋ถ€ํ„ฐ์ธ๊ฐ€ ์ž…๋ ฅ๊ธฐ๋ž‘ ์–ธ์–ด ์ง€์› ์ชฝ์„ ๊ฑด๋“œ๋ ธ๋”๋‹ˆ VS Code์— ํ•œ๊ธ€ ์ž…๋ ฅ์ด ์•ˆ ๋๋‹ค.. ํ•จ์ˆ˜์— Doc String์ด๋ž‘ ์ฃผ์„ ์จ์•ผ ํ•˜๋Š”๋ฐ ๋ณต๋ถ™ ํ•ด์„œ ๋„ฃ๊ณ  ์ด ๋‚œ๋ฆฌ๋ฅผ.. ํ™˜์žฅ ํ˜€~ ๊ฒ€์ƒ‰ํ•ด๋ดค๋”๋‹ˆ ๊ธฐ์กด์— ๊น”์•˜๋˜ snap ํ˜•์‹์˜ VS Code์™€ Ubuntu์˜ ์ž…๋ ฅ๊ธฐ์ธ IBus๊ฐ€ ์ถฉ๋Œํ•ด์„œ ์ผ์–ด๋‚˜๋Š” ํ˜„์ƒ์ด๋ผ๊ณ  ํ•จ. ๋‚˜๋Š” ์„ค์น˜ํ•œ ์—ฌ๋Ÿฌ ์ž…๋ ฅ๊ธฐ(IBus, kime, uim, XIM) ์ค‘ kime๋ฅผ ์ผ์—ˆ๋Š”๋ฐ, ์ผ๋ถ€ ํ”„๋กœ๊ทธ๋žจ์—์„œ ํ•œ๊ธ€์ด ์•ˆ ๋จนํžˆ๊ฑฐ๋‚˜ ๋ฒ„ํผ๋ง์ด ์—„์ฒญ ์‹ฌํ•ด์ง€๋Š” ํ˜„์ƒ ๋•Œ๋ฌธ์— ์„ค์ •์„ ๋ง‰ ๋ฐ”๊ฟ”๋ณด๊ณ  ํ–ˆ๋”๋‹ˆ VS Code๋„ ๋จนํ†ต์ด ๋œ ๋ชจ์–‘.. ๊ธฐ์กด์— ๊น”์•˜๋˜ snap ํ˜•์‹์˜ VS Code๋ฅผ ์ง€์šฐ๊ณ  sudo snap remove code ๊ณต์‹ ์‚ฌ์ดํŠธ์—์„œ ์šฐ๋ถ„ํˆฌ ๋ฒ„์ „(.deb)์„ ์„ค์น˜.. ๋”๋ณด๊ธฐ
3/29 ํ™” ํ™”์š”์ผ! ์˜ค๋Š˜์€ ์–ด์ œ ๋ฐฐ์šด Simple Linear Regression(๋‹จ์ˆœ ์„ ํ˜• ํšŒ๊ท€)์„ ์ฝ”๋“œ๋กœ ๊ตฌํ˜„ํ•œ๋‹ค. 1. Training Data Set ์ค€๋น„ : Data pre-processing(๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ). ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ํ˜•ํƒœ๋กœ ์ค€๋น„ 2. Linear Regression Model์„ ์ •์˜ : y = Wx+b(์˜ˆ์ธก ๋ชจ๋ธ). hypothesis(๊ฐ€์„ค) 3. ์ตœ์ ์˜ W(weight, ๊ฐ€์ค‘์น˜), b(bias, ํŽธ์ฐจ)๋ฅผ ๊ตฌํ•˜๋ ค๋ฉด loss function(์†์‹คํ•จ์ˆ˜)/cost function(๋น„์šฉํ•จ์ˆ˜) → MSE 4. Gradient Descent Algorithm(๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•) : loss function์„ ํŽธ๋ฏธ๋ถ„(W, b) × learning rate 5. ๋ฐ˜๋ณตํ•™์Šต ์ง„ํ–‰ 1. Training Dat.. ๋”๋ณด๊ธฐ
3/23 ์ˆ˜ ์ˆ˜์š”์ผ! ์˜ค๋Š˜์€ ๊ธฐ์ˆ ํ†ต๊ณ„๋ฅผ ๋ฐฐ์šด๋‹ค. 1์ฐจ์› ๋ฐ์ดํ„ฐ์˜ ํŠน์ง• ํŒŒ์•… - ์ˆ˜์น˜์ง€ํ‘œ → ๋Œ€ํ‘œ๊ฐ’ : ํ‰๊ท , ์ค‘์œ„๊ฐ’, ์ตœ๋Œ€/์ตœ์†Œ๊ฐ’, ํŽธ์ฐจ, ๋ถ„์‚ฐ, ํ‘œ์ค€ํŽธ์ฐจ... - ์‹œ์ž‘์  ํ‘œํ˜„ → ๋„์ˆ˜๋ถ„ํฌํ‘œ, Histogram, Box plot * ์ตœ๋Œ€/์ตœ์†Œ๊ฐ’์€ ๋Œ€ํ‘œ๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ์— ๋ฌด๋ฆฌ๊ฐ€ ์žˆ์Œ 2์ฐจ์› ๋ฐ์ดํ„ฐ์˜ ํŠน์ง• ํŒŒ์•… - ์ˆ˜์น˜์ง€ํ‘œ → ๊ณต๋ถ„์‚ฐ, ์ƒ๊ด€๊ณ„์ˆ˜ - ์‹œ์ž‘์  ํ‘œํ˜„ → Scatter ์‚ฐํฌ๋„(dispersion) : ๋ฐ์ดํ„ฐ๊ฐ€ ์–ผ๋งˆ๋‚˜, ์–ด๋–ป๊ฒŒ ํผ์ ธ ์žˆ๋‚˜๊ฐ€ ๊ด€์  ๋ฐ์ดํ„ฐ๊ฐ€ ํฉ์–ด์ง„ ์ •๋„(๋ณ€์‚ฐ์„ฑ)๋ฅผ ์ˆ˜์น˜๋กœ ํ‘œํ˜„ํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด → ๋ฒ”์œ„(range), ์‚ฌ๋ถ„์œ„ ๋ฒ”์œ„(IQR, Interquatile range), ํŽธ์ฐจ(deviation), ๋ถ„์‚ฐ(variance), ํ‘œ์ค€ํŽธ์ฐจ(standard deviation) 1์ฐจ์› ๋ฐ์ดํ„ฐ์˜ ์ˆ˜์น˜์ง€ํ‘œ → ํ‰๊ท , ์ค‘์œ„.. ๋”๋ณด๊ธฐ
3/22 ํ™” ํ™”์š”์ผ! ๋ฐ์ดํ„ฐ๋ฅผ ์‹œ๊ฐํ™”ํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ธ Matplotlib์— ๋Œ€ํ•ด ๋ฐฐ์šด๋‹ค! Matplotlib ์•ˆ์— Pyplot์ด๋ผ๋Š” sub package๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. Line plot(์„  ๊ทธ๋ž˜ํ”„), Histogram(๋„์ˆ˜ํ‘œ), Scatter(์‚ฐ์ ๋„), Box plot, ๊ทธ ์™ธ Area plot, Bar chart(๋ง‰๋Œ€ ๊ทธ๋ž˜ํ”„) 1. Line plot(์„  ๊ทธ๋ž˜ํ”„) : ์—ฐ์†์ ์ธ ๊ฐ’์˜ ๊ฒฝํ–ฅ์„ ํŒŒ์•…ํ•  ๋•Œ ์ฃผ๋กœ ์‚ฌ์šฉ(์‹œ๊ณ„์—ด) import pandas as pd import matplotlib.pyplot as plt # 1. Line plot(์„  ๊ทธ๋ž˜ํ”„) plt.title('Line Plot') # plot์˜ ์ œ๋ชฉ์„ ์„ค์ • plt.plot([1, 5, 12, 25]) # x์ถ•์˜ ์ž๋ฃŒ ์œ„์น˜(x ์ถ• ๋ˆˆ๊ธˆ) -> tick์€.. ๋”๋ณด๊ธฐ

728x90