- Subset selection (๋ถ๋ถ์งํฉ ์ ํ)
- p๊ฐ์ predictor ์ค response์ ๊ด๋ จ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐ๋๋ predictor ์๋ณ
- ์๋ณ๋ p๊ฐ ๋ณด๋ค ์ ์ ์์ predictor๋ง์ least squares ๋ฐฉ๋ฒ์ผ๋ก ์ ํฉ
- Shrinkage (์์ถ)
- p๊ฐ์ predictor๋ก ์ ํฉํ๋ coefficient ์ถ์ ๊ฐ์ด 0์ผ๋ก ์์์ง
- ์ ๊ทํ(regularization)๋ก๋ ๋ถ๋ฆผ
- ๋ชจ๋ธ์ variance๋ฅผ ์ค์ด๊ณ ๋ณ์๋ฅผ ์ ํํ๋ ํจ๊ณผ๋ฅผ ๊ฐ์ง
- Dimension Reduction (์ฐจ์ ์ถ์)
- p๊ฐ์ predictor๋ฅผ M์ฐจ์์ subspace์ ํฌ์ฌํ๋ ๋ฐฉ๋ฒ(M < p)
- M๊ฐ์ linear combination์ ๋ง๋ค์ด๋ด ์ ํํ๊ท์ predictor๋ก ์ฌ์ฉ
- ๋น์ง๋ ํ์ต ๋ฐฉ๋ฒ์ ํ๋
01. Stepwise selection
- Best subset์ ๊ณ์ฐ๋์ด ๋ง์ p๊ฐ ๋งค์ฐ ํด ๊ฒฝ์ฐ ๋ฌธ์ ๊ฐ ๋จ -> 2 p์ ๊ณฑ ๊ฐ์ ์กฐํฉ ์กด์ฌ
- p๊ฐ ํด ๊ฒฝ์ฐ ํต๊ณ์ ์ธ ๋ฌธ์ ๋ฅผ ๊ฐ์ง ์๋ ์์
- Search space(๊ฒ์ ์์ญ)์ด ๋์ ๊ฒฝ์ฐ(๋ค์ํ predictor์ ์กฐํฉ), training data์ ๊ณผ์ ํฉ๋๋ ๋ชจ๋ธ์ ์ฐพ์ ํ๋ฅ ์ด ๋์์ง
- ๊ณ์ฐ๋๊ณผ ๊ณผ์ ํฉ ๋ฌธ์ ์ ๋ํ ๋์์ผ๋ก stepwise ๋ฐฉ๋ฒ์ ์ฌ์ฉ
- stepwise ๋ฐฉ๋ฒ์ best subset๋ณด๋ค ํจ์ฌ ์ ์ ์์ ๋ชจ๋ธ์ ํ์
02. Forward stepwise selection
- predictor๊ฐ ์๋ ๋ชจ๋ธ์์ ์์ํ์ฌ ๋ชจ๋ predictor๊ฐ ๋ชจ๋ธ์ ์ฌ์ฉ๋ ๋๊น์ง ํ๋ฒ์ ํ๋์ฉ predictor๋ฅผ ์ถ๊ฐํ๋ ๋ฐฉ๋ฒ
- ๊ณ์ฐ๋ ์ธก๋ฉด์์ best subset ๋๋น ์ฅ์ ์ด ์์ -> ๊ทธ๋ฌ๋, best subset์ผ๋ก ์ฐพ์ best ๋ชจ๋ธ์ forward stepwise selection์ผ๋ก ์ฐพ๋๋ค๋ ๋ณด์ฅ์ ์์
03. Backward stepwise selection
- ๋ชจ๋ predictor๊ฐ ํฌํจ๋ ๋ชจ๋ธ์์ ์์ํ์ฌ ๊ฐ์ฅ ์ ์ฉํ์ง ์์ predictor๋ฅผ ํ๋ฒ์ ํ๋์ฉ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ
'software engineering > ํ์ด์ฌ ๋จธ์ ๋ฌ๋' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Machine Learning] ํด๋ฌ์คํฐ๋ง (Clustering) (0) | 2024.01.18 |
---|---|
[Machine Learning] ๋น์ง๋ ํ์ต, Principal Components Analysis (0) | 2024.01.18 |
[Machine Learning] SVM (Support Vector Machines) (0) | 2024.01.12 |
[Machine Learning] Aggregating decision trees (1) | 2024.01.11 |
[Machine Learning] ํธ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ (Decision trees) (0) | 2024.01.11 |