์ธ๊ณต์ง๋ฅ๊ฐ๋ก | Reinforcement Learning
์ธ๊ณต์ง๋ฅ ๋ถ์ผ์์ ๋จธ์ ๋ฌ๋(๊ธฐ๊ณํ์ต)์ ๋ค๋์ ๋ฐ์ดํฐ๋ฅผ ํ ๋๋ก ์ปดํจํฐ๊ฐ ํ์ต์ ํ๊ฒ ๋๋๋ฐ, ์ปดํจํฐ๊ฐ ํ๋ ์์
์ ํฌ๊ฒ ๋ ๊ฐ์ง๋ก ๋๋๋ค. ํํ(representation): ๋ฐ์ดํฐ ํํ, ์ผ๋ฐํ(generalization): ์ฃผ์ด์ง์ง ์์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ์ต ์ข
๋ฅ๋ ๋จธ์ ๋ฌ๋ ์ฒ์ ๋ฐฐ์ธ ๋...