[Machine Learning] Learning Rate, Data Preprocessing, Overfitting and DataSet
๋ชจ๋๋ฅผ ์ํ ๋ฅ๋ฌ๋ (๊น์ฑํ)
๋จธ์ ๋ฌ๋(Machine Learning) 9์ฅ - Learning rate, data preprocessing, overfitting
1. Learning Rate
Gradient Descent ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ์ธ๊ธฐ์ lr์ ๊ณฑํด์, ๋ค์ W๋ฅผ ๊ฒฐ์ ํ๋ค. lr์ด ๋๋ฌด ํฌ๋ฉด, ๋ฐ์ดํฐ๊ฐ ๋ฌด์ง์ํ๊ฒ ์ดํํ์ฌ ์ต์ ์ ์ ์๋ ดํ์ง ๋ชปํ๋ค. ์ด๋ฅผ ์ค๋ฒ์ํ ์ด๋ผ๊ณ ํ๋ค. lr์ด ๋๋ฌด ์์ผ๋ฉด, ํ์ต ์๊ฐ์ด ์ค๋ ๊ฑธ๋ ค ์ต์ ์ ์ ์๋ ดํ์ง ๋ชปํ๋ค.

2. Data Preprocessing
๋ง์ฝ ์ ๋ ฅ๊ฐ์ด ๋ ๊ฐ ์กด์ฌํ ๋, ๊ฐ์ ๋ํ ๋ฒ์์ ์ฐจ์ด๊ฐ ๋งค์ฐ ํฌ๋ฉด, ์๋์ ๊ฐ์ด ์๊ณก๋ ํํ์ ๊ทธ๋ํ๊ฐ ๋ํ๋๋ค. ๋ฐ๋ผ์ ํ ์ถ์ผ๋ก๋ ๊ฐ๊ฒฉ์ด ์ข๊ณ , ๋ค๋ฅธ ์ถ์ ๊ฐ๊ฒฉ์ด ๋์ด lr์ด ์กฐ๊ธ๋ง ์ปค๋ ์ต์ ์ ์ ์๋ ดํ์ง ๋ชปํ๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Preprocessing์ ์ด์ฉํ์ฌ ์ ๊ทํ๋ฅผ ์์ผ์ค๋ค.

3. Overfitting

๋จธ์ ๋ฌ๋์ด ํ์ต ๋ฐ์ดํฐ์ ๋๋ฌด ๋ฑ ๋ง์ผ๋ฉด, ์ค์ ๋ฐ์ดํฐ์์ ํ๋ฆด ์ ์๋ ํ๋ฅ ์ด ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ๋จผ์ ํ์ต ๋ฐ์ดํฐ์ ์์ ๋๋ฆฌ๊ฑฐ๋, regulation์ผ๋ก ์ผ๋ฐํ๋ฅผ ์ํค๋ ๋ฐฉ๋ฒ์ด ์๋ค. regulation์ Weight์ ๊ฐ์ ๋งค์ฐ ํฌ์ง ์๊ฒ ๋ง๋๋ ๋ฐฉ๋ฒ์ด๋ค. Weight๊ฐ ํฌ๋ฉด ๊ทธ๋ํ๊ฐ ๊ตฌ๋ถ๋ฌ์ง ํํ๋ฅผ ๊ฐ์ง๋ฉฐ, ์์ผ๋ฉด ์ ํ์ ์ธ ๋ชจ์ต์ ๋๋ค. ์ด๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด cost function ๋ค์ regulation์ ์ํ ์์ ์ถ๊ฐ์์ผ์ค๋ค. ๋ชจ๋ weight๊ฐ์ ์ ๊ณฑ์ ๋ํ๋ฉด, cost function์ ํตํด ์ต์ํ๋ ๊ฐ์ ์ฐพ๊ฒ ๋๊ณ , weight ๊ฐ์ด ์์ ๊ฐ์ ๊ฐ์ง๋๋ก ์ค๊ณ๋๋ค.

4. DataSet

์ ์ฒด DataSet์ 70ํผ์ผํธ๋ Training Set์ผ๋ก, 30ํผ์ผํธ๋ Testing Set์ผ๋ก ๋๋๋ค. ๊ทธ๋์ Traning Set์ผ๋ก ๋ชจ๋ธ์ ํ์ต์ํค๊ณ , Test Set์ผ๋ก๋ ๋จธ์ ์ ์ฑ๋ฅ์ ์ธก์ ํ๋ค. ๋ํ ๋ชจ๋ธ์ ํ์ต ์ํฌ ๋, lr์ ฮป๊ฐ์ ์กฐ์ ํ ์ ์๋ค. ๋ฐ๋ผ์ Training Set์ Validation์ผ๋ก ์ผ๋ถ ๋ ๋๋ ์ ์๋ค.