์ง๋ ํ์ต
- Y(output)๊ฐ ์กด์ฌ : dependent variable, response, target, label
- X(input)๊ฐ ์กด์ฌ : independent variable, predictor, feature
- Regression(ํ๊ท) ๋ฌธ์ ์์๋ Y๋ ์ฐ์ ๊ฐ : ์ ํ ํ๋งค๋, ์ผ๊ตฌ์ ์์ ์ฐ๋ด ๋ฑ
- Classification(๋ถ๋ฅ) ๋ฌธ์ ์์๋ Y๋ ๋จ์์ ์ธ ๊ฐ : spam/email, ๋ถ๊ฝ ์ข ๋ฅ ๋ฑ
- N๊ฐ์ training data๋ก ํ์ต
- ๊ธฐ๋ณธ์ฌํญ
- ๋ณธ์ ์ด ์๋(ํ์ต์ ์ฌ์ฉํ์ง ์์๋) test data์ output์ ์ ํํ ์์ธก(prediction)
- ์ด๋ค input์ด output์ ์ด๋ป๊ฒ ์ํฅ์ ๋ฏธ์ณค๋์ง ์ดํดํ๊ณ ๋ถ์(inference)
- ๋ชจ๋ธ์ ํ๊ฐํด๋ณด๊ณ ๋ฐ๋ณต๊ณผ์ ์ ๊ฑฐ์ณ ์ฑ๋ฅ์ ํฅ์์ํด
๋น์ง๋ ํ์ต
- Y(output)๊ฐ ์กด์ฌํ์ง ์์
- X(input)๋ง ์กด์ฌ
- ๋จธ์ ๋ฌ๋์ ๋ชฉํ๊ฐ ์ง๋ํ์ต์ ๋นํด ๋ถ๋ช ํํจ : ์ฐจ์ ์ถ์, ๊ตฐ์งํ(clustering)
- ํ์ต์ ๊ฒฐ๊ณผ์ ๋ํด ํ๊ฐํ๊ธฐ ์ด๋ ค์
- ์ง๋ํ์ต์ ์ ์ฒ๋ฆฌ(pre-processing) ๊ณผ์ ์ผ๋ก์ ์ ์ฉํจ
๋น์ง๋ ํ์ต์ ๋ชฉํ
: ๋ฐ์ดํฐ(observation, measurement)์์ ํฅ๋ฏธ๋ก์ด ํจํด์ ์ฐพ๋ ๊ฒ
- ๋ฐ์ดํฐ๊ฐ ๊ฐ์ง ์ ๋ณด๋ฅผ ์ ํํํ๋๋ก ์๊ฐํ(visualization)
- ๋ฐ์ดํฐ์์ subgroup์ ์๋ณ
- ๋ฐ์ดํฐ์ ์ฐจ์์ ์ถ์
๋ํ์ ์ธ ๋น์ง๋ ํ์ต ๋ฐฉ๋ฒ
- ์ฃผ์ฑ๋ถ ๋ถ์(PCA: Principal Components Analysis)
- ๋ฐ์ดํฐ ์๊ฐํ ๋๋ ์ง๋ํ์ต์ ์ํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(์ฐจ์ ์ถ์) ๋ฐฉ๋ฒ
- ๊ตฐ์งํ(clustering)
- ๋ฐ์ดํฐ์์ ์๋ ค์ง์ง ์์ subgroup์ ๋ฐํ๋ด๋ ๋ค์ํ ๋ฐฉ๋ฒ
๋น์ง๋ ํ์ต์ ํ์ฉ
- ์ง๋ํ์ต์ ์์ธก์ฒ๋ผ ๋ชฉํ๊ฐ ๋จ์ํ๊ณ ๋ช ํํ์ง ์๊ณ ์ฃผ๊ด์ ์ => but) ๋ค์ํ ๋ถ์ผ์์ ๊ทธ ์ค์์ฑ์ด ๋งค์ฐ ์ปค์ง๊ณ ์์
- Label์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ ๊ฒ์ด ๋ ์ฝ๊ณ labeling์ ๋ง์ ๋น์ฉ์ด ์์๋จ => ๋น์ง๋ํ์ต์ ์ค์์ฑ ํ๋
- ๋น์ง๋ํ์ต ์์ฒด๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ดํดํ๋๋ฐ ๋์์ด๋์ด ํ์์ ๋ฐ์ดํฐ๋ถ์(EDA:Exploratory Data Analysis)์ ํ์ฉ
Principal Components Analysis(PCA)
- ๋ฐ์ดํฐ์ ์ ์ฐจ์(low-dimensional) ํํ(representation)์ ๋ง๋ค์ด๋ด๋ ๋ฐฉ๋ฒ
- ์๋ feature์ linear combination(์ ํ๊ฒฐํฉ)์ ์ฐพ์๋
- ์ฐพ์๋ธ combination์ ์ต๋์ ๋ถ์ฐ(variance, ๋ณ๋๋)์ ๊ฐ์ง ๊ฒ๋ถํฐ ์์๋๋ก ๋์ด๋๋ฉฐ ์๋ก ์๊ด๊ด๊ณ๊ฐ ์์(uncorrelated)
- PCA์ ๋๊ฐ์ง ๋ชฉ์
- ๋ฐ์ดํฐ ์๊ฐํ๋ฅผ ์ํ ๋๊ตฌ
- ์ง๋ํ์ต์ ์ํ ์๋ก์ด feature์ ์์ฑ
'software engineering > ํ์ด์ฌ ๋จธ์ ๋ฌ๋' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Machine Learning] ๋ฅ๋ฌ๋์ ๋น์ง๋ํ์ต (1) | 2024.01.19 |
---|---|
[Machine Learning] ํด๋ฌ์คํฐ๋ง (Clustering) (0) | 2024.01.18 |
[Machine Learning] SVM (Support Vector Machines) (0) | 2024.01.12 |
[Machine Learning] Aggregating decision trees (1) | 2024.01.11 |
[Machine Learning] ํธ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ (Decision trees) (0) | 2024.01.11 |