- Published on
π STUDY λ§λ€λ©΄μ λ°°μ°λ μμ±ν AI | μμ±ν AI & λ₯λ¬λ
μμ± λͺ¨λΈλ§
μ£Όμ΄μ§ λ°μ΄ν°μ κ³Ό μ μ¬ν μλ‘μ΄ λ°μ΄ν°λ₯Ό μμ±νλλ‘ λͺ¨λΈμ νλ ¨νλ λ¨Έμ λ¬λμ ν λΆμΌ μμ± λͺ¨λΈμ λ°λΌμ νλ₯ λΆν¬ λͺ¨λΈλ§νλ κ²μΌλ‘ λ³Ό μ μλ€.
- νλ³ λͺ¨λΈ: λ₯Ό μΆμ β‘οΈ μν Xκ° μ£Όμ΄μ‘μ λ λ μ΄λΈ yμ νλ₯ μ λͺ¨λΈλ§
- μμ± λͺ¨λΈ: β‘οΈ xλ₯Ό κ΄μΈ‘ν νλ₯ μ λͺ¨λΈλ§
μμ± λͺ¨λΈμ μ΅λν μ μ¬ν νλ₯ λΆν¬λ₯Ό μ½κ² μνλ§ν μ μμ΄μΌνκ³ μ΄λ»κ² high dimension featureλ€μ΄ νλ₯ λΆν¬λ‘ νννλμ§ μ΄ν΄ν μ μμ΄μΌν¨. μ΄ ννμ λ³΄ν΅ μ μ¬ κ³΅κ°(latent space, manifold)λ‘ μ μ°¨μμΌλ‘ λ§΅νμ΄ λ¨.
μμ± λͺ¨λΈμ λΆλ₯λ ν¬κ²
- λͺ
μμ λ°λμΈκ°? μ묡μ λ°λμΈκ°
- λͺ μμ λ°λ: λ°λ ν¨μλ₯Ό μμ±
- μ묡μ λ°λ: λ°μ΄ν°λ₯Ό μ§μ μμ±νλ νλ₯ κ³Όμ μλ§ μ§μ€ ex. GAN
- λͺ
μμ λ°λ β‘οΈ κ·Όμ¬ λ°λμΈκ° λ€λ£¨κΈ° μ¬μ΄ λ°λμΈκ°
- λ€λ£¨κΈ° μ¬μ΄ λ°λ: λ°λ ν¨μλ₯Ό μ§μ μ΅μ ν: Autoregression, Normalizing Flow
- κ·Όμ¬ λ°λ: λ°λ ν¨μμ κ·Όμ¬μΉ μ΅μ ν: VAE, Energy-based, Diffusion
λ₯λ¬λ
λ°μ΄ν° μ²λ¦¬ μ λμ μΈ΅μ μ¬λ¬ κ° μμ ꡬ쑰μ μ΄μ§ μμ λ°μ΄ν°μμ κ³ μμ€ ννμ νμ΅ν¨. μ΄ λ λ°μ΄ν°λ λΉμ ν λ°μ΄ν°λ‘ μ΄λ―Έμ§μ κ°μ΄ νλ‘ νν λͺ»νλ λ°μ΄ν°λ€μ΄λ€.
λ₯λ¬λ κ΄λ ¨ μμΈν λ΄μ©μ μλ ν¬μ€νΈμ μ 리νλ€
loss function: μμΈ‘κ°κ³Ό μ λ΅μ λΉκ΅ μμ μ¬μ©
optimizer: μμ€ν¨μμ κ·Έλ λμΈνΈλ₯Ό κΈ°λ°μΌλ‘ μ κ²½λ§ κ°μ€μΉλ₯Ό μ λ°μ΄νΈν λ
batch normalization: κ°μ€μΉκ° κΈ°νκΈμμ μΌλ‘ 컀μ§λ©΄, gradient exploding λ¬Έμ κ° λ°μνλ κ²½μ°κ° μμ(μμ€ν¨μκ° nan). μ΄λ₯Ό μΌμ ν λ²μ λ΄μμ μΆλ ₯νκΈ° μν΄ μ κ·ν κ³Όμ μ κ±°μΉμ§λ§ νλ ¨λ μλ‘ κ°μ€μΉ μ΄κΉκ°κ³Ό λ©μ΄μ§. μ΄λ₯Ό covariate shiftλΌκ³ ν¨. μ΄ λ λ°°μΉ μ κ·νκ° ν΄κ²°μ± .
dropout: κ³Όμ ν© ν΄κ²°μ± . μ λμ λλ€νκ² κ³¨λΌ ν΄λΉ μ λλ§ νμ΅νμ¬ μμ‘΄μ±μ μ€μ.
ν΄λΉ μ½λμ torch migrationμ μλ repositoryμ 첨λΆνμλ€.
Terminology
- sample: λ°μ΄ν° ν¬μΈνΈ νλ
- manifold: μ μ¬ κ³΅κ°
- sample space: μν νλκ° κ°μ§ μ μλ λͺ¨λ κ°μ μ§ν©
- probability density function: 0~1 μ¬μ΄μ μ«μλ‘ λ§€νλλ ν¨μ
- parametric modeling: λͺ¨μ λͺ¨λΈλ§, μμ μ μΈ νλ₯ μ μ°Ύλλ° μ¬μ©
- likelihood: c.f. log-likelihood
- maximum likelihood estimation: κ΄μΈ‘λ λ°μ΄ν°λ₯Ό κ°μ₯ μ€λͺ νλ λ°λ ν¨μμ νλΌλ―Έν° μ§ν©.
- Authors
- Name
- Amelia Young
- GitHub
- @ameliacode