software engineering/ํŒŒ์ด์ฌ ๋จธ์‹ ๋Ÿฌ๋‹

[Machine Learning] ์ค€์ง€๋„ํ•™์Šต (Semi-supervised learning)

jjingle 2024. 1. 19. 10:33

์ค€์ง€๋„ํ•™์Šต (Semi-supervised learning)

  • ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•œ ์ข…๋ฅ˜๋กœ ์ง€๋„ํ•™์Šต๊ณผ ๋น„์ง€๋„ํ•™์Šต์˜ ๋‘ ๊ฐ€์ง€๋ฅผ ์กฐํ•ฉํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ๋‘ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜๋ฅผ ์ด์šฉํ•˜์—ฌ ๋‹ค๋ฅธ ํ•˜๋‚˜์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๊ฒƒ์„ ๋ชฉ์ ์œผ๋กœ ํ•จ
    • ex) ๋ถ„๋ฅ˜ : unlabled ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ
    • ex) ํด๋Ÿฌ์Šคํ„ฐ๋ง : ํด๋ž˜์Šค ์ •๋ณด๋กœ๋ถ€ํ„ฐ ์–ป์€ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํด๋Ÿฌ์Šคํ„ฐ๋ง ์„ฑ๋Šฅ ํ–ฅ์ƒ
  • Semi-supervised learning์€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ์— ์ ์šฉ๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Œ
    • Classifier๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•œ labeled ๋ฐ์ดํ„ฐ๊ฐ€ ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ
    • Labeled ๋ฐ์ดํ„ฐ๋ฅผ ์–ป๊ธฐ ์œ„ํ•œ ๋น„์šฉ์ด ํฌ๊ฑฐ๋‚˜ ์–ด๋ ค์šด ๊ฒฝ์šฐ

 

์ค€์ง€๋„ํ•™์Šต ๊ฐ€์ •์‚ฌํ•ญ

    1. Smoothness  ๊ฐ€์ •
      • ๋‘ ๊ฐ’ x, x1 ์ด input space์—์„œ ๊ฐ€๊น๊ฒŒ ์žˆ์œผ๋ฉด ํ•ด๋‹นํ•˜๋Š” y,y1๋Š” ๊ฐ™์€ label์„ ๊ฐ€์ง
    2. Low-density ๊ฐ€์ •
      • Decision boundary๋Š” ๋ฐ์ดํ„ฐ์˜ ๋ฐ€๋„๊ฐ€ ๋‚ฎ์€(low-density) ์ง€์—ญ์„ ์ง€๋‚จ
      • ๋งŒ์•ฝ ๋ฐ€๋„๊ฐ€ ๋†’์€ ์ง€์—ญ์— decision boundary๊ฐ€ ์กด์žฌํ•œ๋‹ค๋ฉด ์„œ๋กœ ๊ฐ€๊นŒ์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋“ค์ด ์„œ๋กœ ๋‹ค๋ฅธ label๋กœ ์˜ˆ์ธก๋  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— smoothness  ๊ฐ€์ •์„ ์œ„๋ฐ˜
    3. Manifold ๊ฐ€์ •
      • ๋จธ์‹ ๋Ÿฌ๋‹ ๋ฌธ์ œ์—์„œ ๊ณ ์ฐจ์›์˜ ๋ฐ์ดํ„ฐ๋Š” ๋ณดํ†ต ์ €์ฐจ์›์˜ substructure์— ์ง‘์ค‘๋˜์–ด ์žˆ์Œ
      • ์ด substruncture๋ฅผ manifold ๋ผ๊ณ  ์นญํ•จ
      • ์ค€์ง€๋„ํ•™์Šต์—์„œ input space๋Š” ์ˆ˜๊ฐœ์˜ manifold๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๊ณ , ๊ฐ™์€ manifold์— ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋Š” ๊ฐ™์€ label์„ ๊ฐ€์ง„๋‹ค๊ณ  ๊ฐ€์ •ํ•จ

 

์ค€์ง€๋„ํ•™์Šต์˜ ์ข…๋ฅ˜

  • Inductive(๊ท€๋‚ฉ์ ) ๋ฐฉ๋ฒ•
    • ์ง€๋„ํ•™์Šต์ฒ˜๋Ÿผ ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ๋ฒ•
    • Unlabeled ๋ฐ์ดํ„ฐ๋Š” ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ณผ์ •์—์„œ ์„ฑ๋Šฅ์„ ๋†’์ด๋Š”๋ฐ ์“ฐ์ž„
  • Transductive(๋ณ€ํ™˜์ ) ๋ฐฉ๋ฒ•
    • ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹Œ ๋ฐ์ดํ„ฐ์˜ ์—ฐ๊ฒฐ์„ฑ์— ๊ธฐ๋ฐ˜ํ•œ ๋ฐฉ๋ฒ•
    • ex) ๋ฐ์ดํ„ฐ์˜ ๊ด€๊ณ„์„ฑ์„ ๊ทธ๋ž˜ํ”„๋กœ ์ •์˜ํ•˜๋ฉด ๋น„์Šทํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ทผ์ ‘ํ•˜์—ฌ ์—ฐ๊ฒฐ๋จ

 

์ค€์ง€๋„ํ•™์Šต์˜ ์˜ˆ์ œ

  • Wrapper method
    • Labeled ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•˜์—ฌ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์ง€๋„ํ•™์Šต ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ  ์ด ๋ชจ๋ธ์„ ์ด์šฉํ•˜์—ฌ unlabeled  ๋ฐ์ดํ„ฐ์˜ label์„ ์˜ˆ์ธก(pseudo-labeled ๋ฐ์ดํ„ฐ)
    • Pseudo-labeled ๋ฐ์ดํ„ฐ๊นŒ์ง€ ํฌํ•จํ•˜์—ฌ ์ƒˆ๋กœ์šด ์ง€๋„ํ•™์Šต ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ณผ์ •์„ ๋ฐ˜๋ณต
  • Unsupervised pre-processing
    • Unlabeled ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ƒˆ๋กœ์šด feature๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๋ฐฉ๋ฒ•
    • PCA๋‚˜ autoencoder๋ฅผ ์ด์šฉํ•˜์—ฌ unlabeled ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ƒˆ๋กœ์šด feature๋ฅผ ๋งŒ๋“ค๊ณ  ์ด๋ฅผ ์ง€๋„ํ•™์Šต ๋ชจ๋ธ ๋งŒ๋“œ๋Š”๋ฐ ํ™œ์šฉ