์ฝ์ฌ์ธ์ ์ฌ๋ ์ธ๋ค์ผํ ๋ฆฌ์คํธํ 11/2 ์ 1. ์ ์ฌ๋ - ์์นด๋ ์ ์ฌ๋(Jaccard Similarity): ์งํฉ ๊ธฐ๋ฐ A, B ๋ ๊ฐ์ ์งํฉ์ด ์๋ค๊ณ ํ ๋, ํฉ์งํฉ์์ ๊ต์งํฉ์ ๋น์จ์ ๊ตฌํ๋ ๊ฒ 0~1 ์ฌ์ด์ ๊ฐ์ ๊ฐ์ง (๋ ์งํฉ์ด ๋์ผํ๋ฉด 1, ๋ ์งํฉ์ ๊ต์งํฉ์ด ์๋ค๋ฉด 0 ๊ฐ์ ๊ฐ์ง) ๊ฐ์ด 1์ ๊ฐ๊น์ธ์๋ก ๋ ๋ฌธ์ฅ์ด ์ ์ฌํ ๋ฌธ์ฅ, 0์ ๊ฐ๊น์ธ์๋ก ์ ์ฌํ์ง ์์ ๋ฌธ์ฅ์ผ๋ก ๋ถ๋ฅ ๊ฐ ์์ดํ (๋จ์ด)๋ค์ Binary๊ฐ(0,1)์ผ๋ก ๋ณํํ์ฌ ๊ต์งํฉ/ํฉ์งํฉ์ ๊ตฌํจ - ์ฝ์ฌ์ธ ์ ์ฌ๋(Cosine Similarity): ๋ฒกํฐ(๊ฐ๋) ๊ธฐ๋ฐ ๋ ๋ฒกํฐ(๋ฐฉํฅ์ฑ)๊ฐ์ ์ฝ์ฌ์ธ ๊ฐ๋๋ฅผ ์ด์ฉํ์ฌ ๊ตฌํ๋ ๋ ๋ฒกํฐ์ ์ ์ฌ๋๋ฅผ ์๋ฏธ -1~1 ์ฌ์ด์ ๊ฐ์ ๊ฐ์ง ๊ฐ์ด 1์ ๊ฐ๊น์ธ์๋ก(๋ ๋ฒกํฐ์ ๋ฐฉํฅ์ด ๊ฐ์์๋ก) ์ ์ฌ์ฑ์ด ๋์ (๋ ๋ฒกํฐ๊ฐ ์๋ก 90°์ ๊ฐ์ ์ด๋ฃจ๋ฉด ์ฝ์ฌ์ธ ์ ์ฌ.. ๋๋ณด๊ธฐ ์ด์ 1 ๋ค์