kํ‰๊ท ์•Œ๊ณ ๋ฆฌ์ฆ˜ 1

[BigData] ๋น„์ง€๋„ ํ•™์Šต(Unsupervised Learning)

๋น„์ง€๋„ ํ•™์Šต(Unsupervised Learning) ? ์ •๋‹ต ๋ฐ์ดํ„ฐ์…‹์ด ์—†๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์‹œ์Šคํ…œ์ด ์Šค์Šค๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ• ์ฃผ๋กœ ๋ฐ์ดํ„ฐ๋“ค์˜ ํŠน์ง•์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฐ์ง‘ํ™”๋ฅผ ์ˆ˜ํ–‰ ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์ด ๋†’์„์ˆ˜๋ก ๋ฐ์ดํ„ฐ์— ๋” ๋งŽ์€ ๋…ธ์ด์ฆˆ๊ฐ€ ๋ฐœ์ƒํ•˜์—ฌ ๊ตฐ์ง‘ํ™”์— ์–ด๋ ค์›€์„ ๊ฒช์Œ(์ฐจ์›์˜ ์ €์ฃผ) k-ํ‰๊ท  ์•Œ๊ณ ๋ฆฌ์ฆ˜ (k-means) ์‚ฌ์ „์— ์ •ํ•œ k๊ฐœ์˜ ๊ตฐ์ง‘์œผ๋กœ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฐฉ๋ฒ• ๋น„์ง€๋„ ํ•™์Šต์˜ ์ผ์ข…์œผ๋กœ ๋ ˆ์ด๋ธ”์ด ๋‹ฌ๋ ค ์žˆ์ง€ ์•Š์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์„ ๋‹ฌ์•„์ฃผ๋Š” ์—ญํ• ์„ ์ˆ˜ํ–‰ ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ฃผ์–ด์ง„ ์ค‘์‹ฌ์ (Centroid)์„ ๊ธฐ์ค€์œผ๋กœ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๊ตฐ์ง‘์— ํ• ๋‹น ๊ตฐ์ง‘์ด ํ˜•์„ฑ๋˜๋ฉด ์ƒˆ๋กญ๊ฒŒ ํ˜•์„ฑ๋œ ๊ตฐ์ง‘์˜ ์ค‘์‹ฌ์ (Centroid)์„ ๊ธฐ์ค€์œผ๋กœ ๋‹ค์‹œ ๋ฐ์ดํ„ฐ์™€ ์ค‘์‹ฌ์  ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ •ํ•˜์—ฌ ์ƒˆ๋กœ์šด ๊ตฐ์ง‘์„ ํ˜•์„ฑ ํ•œ๊ณ„ : ๊ตฌ ๋ชจ์–‘์˜ ..