μΈκ³΅μ§λ₯κ°λ‘ | Reinforcement Learning
μΈκ³΅μ§λ₯ λΆμΌμμ λ¨Έμ λ¬λ(κΈ°κ³νμ΅)μ λ€λμ λ°μ΄ν°λ₯Ό ν λλ‘ μ»΄ν¨ν°κ° νμ΅μ νκ² λλλ°, μ»΄ν¨ν°κ° νλ μμ
μ ν¬κ² λ κ°μ§λ‘ λλλ€. νν(representation): λ°μ΄ν° νν, μΌλ°ν(generalization): μ£Όμ΄μ§μ§ μμ λ°μ΄ν° μ²λ¦¬ νμ΅ μ’
λ₯λ λ¨Έμ λ¬λ μ²μ λ°°μΈ λ...