07. Discrete Probability Distribution
λͺκ°μ§ μ€μν μ΄μ° νλ₯ λΆν¬λ€μ μμλ³΄κ² μ΅λλ€. λλΆλΆμ λ΄μ©μ΄ λ³λ‘ μ΄λ ΅μ§λ μμ΅λλ€.
κ° λΆν¬μ $\E(X), \V(X)$λ₯Ό μ¦λͺ νλ κ³Όμ μ λμ€μ νλ₯ λ§ μ§μ€μ μΌλ‘ λ€λ£°λ μκ°νκ³ μ§κΈμ λμ΄κ° κ³νμ λλ€.
λ² λ₯΄λμ΄ μν, μ΄νλΆν¬
λμ νλλ₯Ό λμ§λ κ²μ²λΌ, κ²°κ³Όκ° μ±κ³΅κ³Ό μ€ν¨ μ€ νλμ΄λ©° μ±κ³΅νλ₯ μ΄ μ ν΄μ Έμλ μνμ λ² λ₯΄λμ΄ μν (Bernoulli Trial) μ΄λΌ ν©λλ€.
- μ΄λ, νλ₯ μ§λν¨μλ μλͺ νκ² $f(x) = p^x (1-p)^{1-x}$ μ΄κ³ ($x = 0, 1$)
- $\E(X) = p, \V(X) = p(1-p)$ μμ΄ μ μλ €μ Έ μμ΅λλ€.
μ΄λ¬ν λ² λ₯΄λμ΄ μνμ $n$λ² λ°λ³΅νμμ λ, κ·Έ μ±κ³΅ νμλ₯Ό νλ₯ λ³μλ‘ λνλ΄μλ€κ³ νκ² μ΅λλ€.
μ΄λμ λΆν¬λ₯Ό μ΄νλΆν¬ (Binomial distribution) μ΄λΌ ν©λλ€.
- μνμ μ±κ³΅νλ₯ μ΄ $p$, λ°λ³΅νμκ° $n$μΌ λ μ΄λ₯Ό $X \sim B(n, p)$λ‘ μλλ€.
- νλ₯ μ§λν¨μλ $f(x) = \binom{n}{x} p^x (1-p)^{1-x}$ μμ΄ μ μλ €μ Έ μμΌλ©° ($x = 0, 1, \dots n$)
- μ΄ν μ 리λ‘λΆν°, $\E(X) = np, \V(X) = np(1-p)$ μμ μ μ μμ΅λλ€.
- λλ, $\E$ μ $\V$μ κΈ°λ³Έ μ±μ§ μ€ νλμΈ, λ λ¦½μΈ λ³μλ₯Ό λνμ λμ 곡μμ μ΄μ©ν΄μλ κ°μ μ¬μ€μ μ½κ² μ μ μμ΅λλ€.
κΈ°νλΆν¬, μμ΄νλΆν¬
μλ‘ λ 립μ΄κ³ , μ±κ³΅ νλ₯ μ΄ $p$μΈ λ² λ₯΄λμ΄ μνμμ, 첫 μ±κ³΅μ΄ κ΄μ°°λ λκΉμ§μ μν νμμ λΆν¬λ₯Ό κΈ°νλΆν¬ (Geometric distribution) μ΄λΌ ν©λλ€. λν, μ΄λ₯Ό $X \sim \text{Geo}(p)$ λ‘ μλλ€.
- $X = k$ μ΄κΈ° μν΄μλ $k-1$λ² μ°μμΌλ‘ μ€ν¨νκ³ $k$λ²μ§Έμ μ±κ³΅ν΄μΌ νλ―λ‘, νλ₯ μ§λν¨μλ $f(x) = (1-p)^{x-1}p$ μ λλ€.
- $\E(X) = 1/p$ μμ μ§κ΄μ μΌλ‘ λΉμ°ν΄ 보μ
λλ€. μ΄λ₯Ό μ¦λͺ
ν΄ λ³΄λ©΄β¦
- $\sum_{k = 0}^{\infty} k (1-p)^{k-1} p$ λ₯Ό κ³μ°νλ©΄ λκ³ ,
- μ΄λ κ² μκΈ΄ κΈμλ₯Ό Arithmetic-Geometric Progression λ±μΌλ‘ λΆλ₯΄λ©°, μ μλ €μ§ κ³΅μ μ μ μ©ν μ μμ΅λλ€. μ¬μ€ κ³ λ±νκ΅λ νλ²μ―€ ν΄λ³Έ, $S$ μ $(1-p)S$λ₯Ό λΉΌμ κ³μ°νλ 곡μμ λλ€.
- κ³μ°νλ©΄ $\E(X) = 1/p$λ₯Ό μ»μ΅λλ€.
- $\V(X)$μ κ³μ°μ μ’λ 볡μ‘νκΈ° λλ¬Έμ, μ¬κΈ°μλ μλ΅ν©λλ€. $\V(X) = \frac{1-p}{p^2}$ μ λλ€.
κΈ°νλΆν¬λ₯Ό λ³΄λ€ νμ₯νμ¬, $r$λ² μ±κ³΅ν λκΉμ§μ μννμμ λΆν¬λ₯Ό μμ΄νλΆν¬ λΌ ν©λλ€.
- κ±°μ κ·Έλλ‘ μκ°ν΄μ νμ₯ν μ μμ΅λλ€. $X = x$ μ΄κΈ° μν΄μλ, $x-1$λ² μ€ μ νν $r-1$λ² μ±κ³΅ν ν, $x$λ²μ§Έλ₯Ό μ±κ³΅ν΄μΌ νλ―λ‘
- νλ₯ μ§λν¨μλ $f(x) = \binom{x-1}{r-1} p^r (1-p)^{x-r}$ μ λλ€.
- λμμ μΌλ‘λ κΈ°νλΆν¬ $r$κ°μ ν©μΌλ‘ μκ°νλ κ²μ΄ λ§€μ° μμ°μ€λ½κ³ , μ΄μ λ°λΌ $\E(X) = r/p$, $\V(X) = r(1-p)/p^2$ μ μ»μ΅λλ€.
μ΄κΈ°νλΆν¬
μ΄νλΆν¬λ₯Ό νλ₯ μ΄ $p$μΈ λ² λ₯΄λμ΄ μνμ λ°λ³΅μ΄λΌκ³ μΌμ§λ§, μ€μ λ‘λ $p$ λΉμ¨λ§νΌμ 1μ΄ μλ μν©μμ 볡μμΆμΆμ νλ μν©μΌλ‘λ μκ°ν μ μμ΅λλ€. μ΄μλ λ¬λ¦¬, μ΄λ€ μ ν΄μ§ $N$κ°μ λμ μ€ $D$κ°κ° 1μ΄κ³ λλ¨Έμ§κ° 0μΌ λ, $n$κ°λ₯Ό (λΉλ³΅μμΌλ‘) λ½μμ 1μ΄ λͺκ°λ λμ€λμ§ μκ°νλ κ²λ κ°λ₯ν©λλ€. μ΄λ₯Ό μ΄κΈ°νλΆν¬ (Hypergeometric Distribution) λΌ νλ©°, κΈ°νΈλ‘λ $H(n; N, D)$ λ‘ μλλ€.
- $X \sim H(n; N, D)$ μΌ λ, νλ₯ μ§λν¨μλ κ°λ¨ν κ²½μ°μ μ λ¬Έμ λ‘ κ΅¬ν μ μμ΅λλ€. $f(x) = \binom{D}{x} \binom{N-D}{n-x} \binom{N}{n}^{-1}$. μ΄ $\binom{N}{n}$κ°μ κ°λ₯ν μ‘°ν© μ€, $x$κ°μ 1μ΄ λμ€λ κ²½μ°μ μλ₯Ό μΈλ κ²μ λλ€.
- $\E$ μ $\V$ λͺ¨λ (μ‘°κΈ κ³ ν΅μ€λ¬μ΄) κ³μ°μ ν΅ν΄ ꡬν μ μκ³ , λ€μκ³Ό κ°μ΅λλ€. \(\E(X) = \frac{nD}{N}, \quad \quad \V(X) = \frac{n(N-n)}{N-1}\frac{D(N-D)}{N^2}\)
- μ¬κΈ°μμ, $N$μ΄ λ§€μ° ν¬κ³ $n$μ΄ μλμ μΌλ‘ μμΌλ©° $D / N = p$ μ΄λ©΄ λΆν¬ μ μ²΄κ° $B(n, p)$ μ λΉμ·ν΄μ§λλ€. μ΄λ κ³μ°μ ν΅ν΄μλ μ¦λͺ ν μ μμ§λ§, κ°λ¨ν λ Όμ¦ν΄λ³΄λ©΄ λ§€μ° ν° μ§λ¨μμ κ·Ήν μΌλΆλ₯Ό μΆμΆν λλ 볡μμΆμΆ (μ΄νλΆν¬) μ΄λ, λΉλ³΅μμΆμΆ (μ΄κΈ°νλΆν¬) μ΄λ λΉμ·νλ€λ κ²μ΄λ―λ‘ ν©λ¦¬μ μΈ κ² κ°μ΅λλ€.