-
[Machine Learning] Learning Rate, Data Preprocessing, Overfitting and DataSet๐ณDev/Machine Learning 2022. 1. 12. 15:22
๋ชจ๋๋ฅผ ์ํ ๋ฅ๋ฌ๋ (๊น์ฑํ)
๋จธ์ ๋ฌ๋(Machine Learning) 9์ฅ - Learning rate, data preprocessing, overfitting
1. Learning Rate
Gradient Descent ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ์ธ๊ธฐ์ lr์ ๊ณฑํด์, ๋ค์ W๋ฅผ ๊ฒฐ์ ํ๋ค. lr์ด ๋๋ฌด ํฌ๋ฉด, ๋ฐ์ดํฐ๊ฐ ๋ฌด์ง์ํ๊ฒ ์ดํํ์ฌ ์ต์ ์ ์ ์๋ ดํ์ง ๋ชปํ๋ค. ์ด๋ฅผ ์ค๋ฒ์ํ ์ด๋ผ๊ณ ํ๋ค. lr์ด ๋๋ฌด ์์ผ๋ฉด, ํ์ต ์๊ฐ์ด ์ค๋ ๊ฑธ๋ ค ์ต์ ์ ์ ์๋ ดํ์ง ๋ชปํ๋ค.

2. Data Preprocessing
๋ง์ฝ ์ ๋ ฅ๊ฐ์ด ๋ ๊ฐ ์กด์ฌํ ๋, ๊ฐ์ ๋ํ ๋ฒ์์ ์ฐจ์ด๊ฐ ๋งค์ฐ ํฌ๋ฉด, ์๋์ ๊ฐ์ด ์๊ณก๋ ํํ์ ๊ทธ๋ํ๊ฐ ๋ํ๋๋ค. ๋ฐ๋ผ์ ํ ์ถ์ผ๋ก๋ ๊ฐ๊ฒฉ์ด ์ข๊ณ , ๋ค๋ฅธ ์ถ์ ๊ฐ๊ฒฉ์ด ๋์ด lr์ด ์กฐ๊ธ๋ง ์ปค๋ ์ต์ ์ ์ ์๋ ดํ์ง ๋ชปํ๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Preprocessing์ ์ด์ฉํ์ฌ ์ ๊ทํ๋ฅผ ์์ผ์ค๋ค.

3. Overfitting

๋จธ์ ๋ฌ๋์ด ํ์ต ๋ฐ์ดํฐ์ ๋๋ฌด ๋ฑ ๋ง์ผ๋ฉด, ์ค์ ๋ฐ์ดํฐ์์ ํ๋ฆด ์ ์๋ ํ๋ฅ ์ด ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ๋จผ์ ํ์ต ๋ฐ์ดํฐ์ ์์ ๋๋ฆฌ๊ฑฐ๋, regulation์ผ๋ก ์ผ๋ฐํ๋ฅผ ์ํค๋ ๋ฐฉ๋ฒ์ด ์๋ค. regulation์ Weight์ ๊ฐ์ ๋งค์ฐ ํฌ์ง ์๊ฒ ๋ง๋๋ ๋ฐฉ๋ฒ์ด๋ค. Weight๊ฐ ํฌ๋ฉด ๊ทธ๋ํ๊ฐ ๊ตฌ๋ถ๋ฌ์ง ํํ๋ฅผ ๊ฐ์ง๋ฉฐ, ์์ผ๋ฉด ์ ํ์ ์ธ ๋ชจ์ต์ ๋๋ค. ์ด๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด cost function ๋ค์ regulation์ ์ํ ์์ ์ถ๊ฐ์์ผ์ค๋ค. ๋ชจ๋ weight๊ฐ์ ์ ๊ณฑ์ ๋ํ๋ฉด, cost function์ ํตํด ์ต์ํ๋ ๊ฐ์ ์ฐพ๊ฒ ๋๊ณ , weight ๊ฐ์ด ์์ ๊ฐ์ ๊ฐ์ง๋๋ก ์ค๊ณ๋๋ค.

4. DataSet

์ ์ฒด DataSet์ 70ํผ์ผํธ๋ Training Set์ผ๋ก, 30ํผ์ผํธ๋ Testing Set์ผ๋ก ๋๋๋ค. ๊ทธ๋์ Traning Set์ผ๋ก ๋ชจ๋ธ์ ํ์ต์ํค๊ณ , Test Set์ผ๋ก๋ ๋จธ์ ์ ์ฑ๋ฅ์ ์ธก์ ํ๋ค. ๋ํ ๋ชจ๋ธ์ ํ์ต ์ํฌ ๋, lr์ ฮป๊ฐ์ ์กฐ์ ํ ์ ์๋ค. ๋ฐ๋ผ์ Training Set์ Validation์ผ๋ก ์ผ๋ถ ๋ ๋๋ ์ ์๋ค.
'๐ณDev > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Machine Learning] Basic Of Machine Learning (0) 2022.01.15 [Machine Learning] Regression & Classification (0) 2022.01.10 [๊ธฐ๊ณํ์ต] 12. Dimensionality Reduction (0) 2022.01.01 [๊ธฐ๊ณํ์ต] 11. Kernel Method(Support Vector Machines) (0) 2021.12.26 [๊ธฐ๊ณํ์ต] 10. Deep Neural Networks (0) 2021.12.25