๋น„์ง€๋„ํ•™์Šต 3

[Machine Learning] ๋”ฅ๋Ÿฌ๋‹์˜ ๋น„์ง€๋„ํ•™์Šต

Autoencoder ์˜ ๊ตฌ์กฐ Input๊ณผ output์˜ ๊ฐ’์ด ๊ฐ™์•„์ง€๋„๋ก ํ•™์Šตํ•˜๋Š” ๋‰ด๋Ÿด๋„คํŠธ์›Œํฌ Autoencoder ์˜ ์œ ์šฉ์„ฑ๊ณผ ํ•™์Šต๋ฐฉ๋ฒ• output์„ input๊ณผ ์™„์ „ํžˆ ๋™์ผํ•˜๊ฒŒ ๋ณต์›ํ•˜๋Š” ๋‰ด๋Ÿด๋„คํŠธ์›Œํฌ๋Š” ์œ ์šฉํ•˜์ง€ ์•Š์Œ => ์˜คํžˆ๋ ค ์™„์ „ํžˆ ๋™์ผํ•˜๊ฒŒ ๋ณต์›๋˜์ง€ ์•Š๋„๋ก ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•จ Autoencoder์— ์ œํ•œ์กฐ๊ฑด์„ ๋‘์–ด input์— ๊ทผ์‚ฌํ•˜๊ฒŒ ๋ณต์›๋˜๋„๋ก ํ•™์Šต์‹œํ‚ด ์ด๋ฅผํ†ตํ•ด, autoencoder๊ฐ€ ๋ฐ์ดํ„ฐ์˜ ์ค‘์š”ํ•œ ์†์„ฑ(property)๋งŒ ํ•™์Šตํ•˜๋„๋ก ํ•จ ์ „ํ†ต์ ์œผ๋กœ๋Š” autoencoder๋ฅผ dimension reduction์„ ์œ„ํ•ด ์‚ฌ์šฉ ์••์ถ•๋œ code๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ €์ฐจ์›์—์„œ ํ‘œํ˜„ํ•œ ๋ฒกํ„ฐ PCA์˜ ์ฐจ์› ์ถ•์†Œ์™€ ์œ ์‚ฌํ•˜๋‚˜ ๋น„์„ ํ˜•์„ฑ์„ ๋ฐ˜์˜ํ•  ์ˆ˜ ์žˆ์–ด ๋” ์œ ์šฉํ•  ์ˆ˜ ์žˆ์Œ Multilayer Neural Network..

[Machine Learning] ๋น„์ง€๋„ ํ•™์Šต, Principal Components Analysis

์ง€๋„ ํ•™์Šต Y(output)๊ฐ€ ์กด์žฌ : dependent variable, response, target, label X(input)๊ฐ€ ์กด์žฌ : independent variable, predictor, feature Regression(ํšŒ๊ท€) ๋ฌธ์ œ์—์„œ๋Š” Y๋Š” ์—ฐ์† ๊ฐ’ : ์ œํ’ˆ ํŒ๋งค๋Ÿ‰, ์•ผ๊ตฌ์„ ์ˆ˜์˜ ์—ฐ๋ด‰ ๋“ฑ Classification(๋ถ„๋ฅ˜) ๋ฌธ์ œ์—์„œ๋Š” Y๋Š” ๋‹จ์†์ ์ธ ๊ฐ’ : spam/email, ๋ถ“๊ฝƒ ์ข…๋ฅ˜ ๋“ฑ N๊ฐœ์˜ training data๋กœ ํ•™์Šต ๊ธฐ๋ณธ์‚ฌํ•ญ ๋ณธ์ ์ด ์—†๋Š”(ํ•™์Šต์— ์‚ฌ์šฉํ•˜์ง€ ์•Š์•˜๋˜) test data์˜ output์„ ์ •ํ™•ํžˆ ์˜ˆ์ธก(prediction) ์–ด๋–ค input์ด output์— ์–ด๋–ป๊ฒŒ ์˜ํ–ฅ์„ ๋ฏธ์ณค๋Š”์ง€ ์ดํ•ดํ•˜๊ณ  ๋ถ„์„(inference) ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•ด๋ณด๊ณ  ๋ฐ˜๋ณต๊ณผ์ •์„ ๊ฑฐ์ณ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ด ๋น„์ง€๋„ ํ•™..

[BigData] ๋น„์ง€๋„ ํ•™์Šต(Unsupervised Learning)

๋น„์ง€๋„ ํ•™์Šต(Unsupervised Learning) ? ์ •๋‹ต ๋ฐ์ดํ„ฐ์…‹์ด ์—†๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์‹œ์Šคํ…œ์ด ์Šค์Šค๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๋ฐฉ๋ฒ• ์ฃผ๋กœ ๋ฐ์ดํ„ฐ๋“ค์˜ ํŠน์ง•์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฐ์ง‘ํ™”๋ฅผ ์ˆ˜ํ–‰ ๋ฐ์ดํ„ฐ์˜ ์ฐจ์›์ด ๋†’์„์ˆ˜๋ก ๋ฐ์ดํ„ฐ์— ๋” ๋งŽ์€ ๋…ธ์ด์ฆˆ๊ฐ€ ๋ฐœ์ƒํ•˜์—ฌ ๊ตฐ์ง‘ํ™”์— ์–ด๋ ค์›€์„ ๊ฒช์Œ(์ฐจ์›์˜ ์ €์ฃผ) k-ํ‰๊ท  ์•Œ๊ณ ๋ฆฌ์ฆ˜ (k-means) ์‚ฌ์ „์— ์ •ํ•œ k๊ฐœ์˜ ๊ตฐ์ง‘์œผ๋กœ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฐฉ๋ฒ• ๋น„์ง€๋„ ํ•™์Šต์˜ ์ผ์ข…์œผ๋กœ ๋ ˆ์ด๋ธ”์ด ๋‹ฌ๋ ค ์žˆ์ง€ ์•Š์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์„ ๋‹ฌ์•„์ฃผ๋Š” ์—ญํ• ์„ ์ˆ˜ํ–‰ ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ฃผ์–ด์ง„ ์ค‘์‹ฌ์ (Centroid)์„ ๊ธฐ์ค€์œผ๋กœ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๊ตฐ์ง‘์— ํ• ๋‹น ๊ตฐ์ง‘์ด ํ˜•์„ฑ๋˜๋ฉด ์ƒˆ๋กญ๊ฒŒ ํ˜•์„ฑ๋œ ๊ตฐ์ง‘์˜ ์ค‘์‹ฌ์ (Centroid)์„ ๊ธฐ์ค€์œผ๋กœ ๋‹ค์‹œ ๋ฐ์ดํ„ฐ์™€ ์ค‘์‹ฌ์  ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ •ํ•˜์—ฌ ์ƒˆ๋กœ์šด ๊ตฐ์ง‘์„ ํ˜•์„ฑ ํ•œ๊ณ„ : ๊ตฌ ๋ชจ์–‘์˜ ..