software engineering/๋น…๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ

[BigData] ๋น„์ง€๋„ ํ•™์Šต(Unsupervised Learning)

jjingle 2024. 1. 18. 13:21

๋น„์ง€๋„ ํ•™์Šต(Unsupervised Learning) ?

์ •๋‹ต ๋ฐ์ดํ„ฐ์…‹์ด ์—†๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์‹œ์Šคํ…œ์ด ์Šค์Šค๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ์ฃผ๋กœ ๋ฐ์ดํ„ฐ๋“ค์˜ ํŠน์ง•์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฐ์ง‘ํ™”๋ฅผ ์ˆ˜ํ–‰
  • ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์ด ๋†’์„์ˆ˜๋ก ๋ฐ์ดํ„ฐ์— ๋” ๋งŽ์€ ๋…ธ์ด์ฆˆ๊ฐ€ ๋ฐœ์ƒํ•˜์—ฌ ๊ตฐ์ง‘ํ™”์— ์–ด๋ ค์›€์„ ๊ฒช์Œ(์ฐจ์›์˜ ์ €์ฃผ)

 

k-ํ‰๊ท  ์•Œ๊ณ ๋ฆฌ์ฆ˜ (k-means)

  • ์‚ฌ์ „์— ์ •ํ•œ k๊ฐœ์˜ ๊ตฐ์ง‘์œผ๋กœ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ๋น„์ง€๋„ ํ•™์Šต์˜ ์ผ์ข…์œผ๋กœ ๋ ˆ์ด๋ธ”์ด ๋‹ฌ๋ ค ์žˆ์ง€ ์•Š์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์„ ๋‹ฌ์•„์ฃผ๋Š” ์—ญํ• ์„ ์ˆ˜ํ–‰
  • ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ฃผ์–ด์ง„ ์ค‘์‹ฌ์ (Centroid)์„ ๊ธฐ์ค€์œผ๋กœ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๊ตฐ์ง‘์— ํ• ๋‹น
  • ๊ตฐ์ง‘์ด ํ˜•์„ฑ๋˜๋ฉด ์ƒˆ๋กญ๊ฒŒ ํ˜•์„ฑ๋œ ๊ตฐ์ง‘์˜ ์ค‘์‹ฌ์ (Centroid)์„ ๊ธฐ์ค€์œผ๋กœ ๋‹ค์‹œ ๋ฐ์ดํ„ฐ์™€ ์ค‘์‹ฌ์  ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ •ํ•˜์—ฌ ์ƒˆ๋กœ์šด ๊ตฐ์ง‘์„ ํ˜•์„ฑ
  • ํ•œ๊ณ„ : ๊ตฌ ๋ชจ์–‘์˜ ๊ตฐ์ง‘๋งŒ์„ ๋ถ„์„ํ•  ์ˆ˜ ์žˆ์Œ

 

์ด๋ถ„๋ฒ• k-ํ‰๊ท  (Bisecting k-means)

  • ํ•˜ํ–ฅ์‹ ๊ตฐ์ง‘ํ™” ๋ฐฉ๋ฒ•
  • ์ตœ์ดˆ์— ํ•˜๋‚˜์˜ ๊ตฐ์ง‘์„ ํ˜•์„ฑํ•œ ๋’ค, ๋ฐ˜๋ณต์„ ์ˆ˜ํ–‰ํ•  ๋•Œ๋งˆ๋‹ค ๊ตฐ์ง‘์„ 2๊ฐœ์”ฉ ๋‚˜๋ˆ„์–ด ์ ์ฐจ์ ์œผ๋กœ ๊ตฐ์ง‘์„ ๋Š˜๋ ค๋‚˜๊ฐ
  • ์ตœ์ดˆ์˜ ๋‹จ์ผ ๊ทธ๋ฃน -> ์ƒ์œ„ ๊ทธ๋ฃน์˜ ๊ฐœ๋…
  • ๋” ์ž‘์€ ๊ทธ๋ฃน์œผ๋กœ ๋‚˜๋‰˜์–ด์ง„ ๊ทธ๋ฃน -> ํ•˜์œ„ ๊ทธ๋ฃน์˜ ๊ฐœ๋…
  • k-means๋Š” ๊ตฌ ๋ชจ์–‘์˜ ๊ตฐ์ง‘๋งŒ์„ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋Š” ๋ฐ˜๋ฉด, ์ด๋ถ„๋ฒ• k-ํ‰๊ท ์€ ๋น„๊ตฌ๋ชจ์–‘์˜ ๊ตฐ์ง‘ํ™”๋ฅผ ํ•  ์ˆ˜ ์žˆ์Œ
  • ์‚ฌ์šฉ์ž๊ฐ€ ์„ค์ •ํ•œ ๋ฐ˜๋ณต ํšŸ์ˆ˜๋งŒํผ ๋ฐ˜๋ณตํ•˜๊ฑฐ๋‚˜, ์›ํ•˜๋Š” k๊ฐ’์„ ์–ป์„ ๋•Œ ๊นŒ์ง€ ๋ฐ˜๋ณต

 

๊ฐ€์šฐ์‹œ์•ˆ ํ˜ผํ•ฉ ๋ชจ๋ธ (Gaussian Mixture Model)

  • Gaussian ๋ถ„ํฌ๊ฐ€ ์—ฌ๋Ÿฌ ๊ฐœ ํ˜ผํ•ฉ๋œ ์•Œ๊ณ ๋ฆฌ์ฆ˜
  • ํ˜„์‹ค์—์„œ ์กด์žฌํ•˜๋Š” ๋ณต์žกํ•œ ํ˜•ํƒœ์˜ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ k๊ฐœ์˜ ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋กœ ํ˜ผํ•ฉํ•˜์—ฌ ํ‘œํ˜„ํ•˜๊ณ ์ž ํ•˜๋Š” ๋ชจ๋ธ
  • ์ „์ฒด ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ์—์„œ ํ•˜์œ„ ๋ถ„ํฌ๊ฐ€ ์กด์žฌํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์—ฌ ๋ถ„์„
  • k๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ์ž„์˜๋กœ ์ง€์ •