Back to : mathematical-statistics
Contents

λͺ‡κ°€μ§€ μ€‘μš”ν•œ 이산 ν™•λ₯  뢄포듀을 μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€. λŒ€λΆ€λΆ„μ˜ λ‚΄μš©μ΄ λ³„λ‘œ μ–΄λ ΅μ§€λŠ” μ•ŠμŠ΅λ‹ˆλ‹€.

각 λΆ„ν¬μ˜ $\E(X), \V(X)$λ₯Ό 증λͺ…ν•˜λŠ” 과정은 λ‚˜μ€‘μ— ν™•λ₯ λ§Œ μ§‘μ€‘μ μœΌλ‘œ λ‹€λ£°λ•Œ μƒκ°ν•˜κ³  μ§€κΈˆμ€ λ„˜μ–΄κ°ˆ κ³„νšμž…λ‹ˆλ‹€.

λ² λ₯΄λˆ„이 μ‹œν–‰, 이항뢄포

동전 ν•˜λ‚˜λ₯Ό λ˜μ§€λŠ” κ²ƒμ²˜λŸΌ, κ²°κ³Όκ°€ 성곡과 μ‹€νŒ¨ 쀑 ν•˜λ‚˜μ΄λ©° 성곡확λ₯ μ΄ μ •ν•΄μ ΈμžˆλŠ” μ‹œν–‰μ„ λ² λ₯΄λˆ„이 μ‹œν–‰ (Bernoulli Trial) 이라 ν•©λ‹ˆλ‹€.

  • μ΄λ•Œ, ν™•λ₯ μ§ˆλŸ‰ν•¨μˆ˜λŠ” 자λͺ…ν•˜κ²Œ $f(x) = p^x (1-p)^{1-x}$ 이고 ($x = 0, 1$)
  • $\E(X) = p, \V(X) = p(1-p)$ μž„μ΄ 잘 μ•Œλ €μ Έ μžˆμŠ΅λ‹ˆλ‹€.

μ΄λŸ¬ν•œ λ² λ₯΄λˆ„이 μ‹œν–‰μ„ $n$번 λ°˜λ³΅ν•˜μ˜€μ„ λ•Œ, κ·Έ 성곡 횟수λ₯Ό ν™•λ₯ λ³€μˆ˜λ‘œ λ‚˜νƒ€λ‚΄μ—ˆλ‹€κ³  ν•˜κ² μŠ΅λ‹ˆλ‹€.
μ΄λ•Œμ˜ 뢄포λ₯Ό 이항뢄포 (Binomial distribution) 이라 ν•©λ‹ˆλ‹€.

  • μ‹œν–‰μ˜ 성곡확λ₯ μ΄ $p$, λ°˜λ³΅νšŸμˆ˜κ°€ $n$일 λ•Œ 이λ₯Ό $X \sim B(n, p)$둜 μ”λ‹ˆλ‹€.
  • ν™•λ₯ μ§ˆλŸ‰ν•¨μˆ˜λŠ” $f(x) = \binom{n}{x} p^x (1-p)^{1-x}$ μž„μ΄ 잘 μ•Œλ €μ Έ 있으며 ($x = 0, 1, \dots n$)
  • 이항 μ •λ¦¬λ‘œλΆ€ν„°, $\E(X) = np, \V(X) = np(1-p)$ μž„μ„ μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€.
  • λ˜λŠ”, $\E$ 와 $\V$의 κΈ°λ³Έ μ„±μ§ˆ 쀑 ν•˜λ‚˜μΈ, 독립인 λ³€μˆ˜λ₯Ό λ”ν–ˆμ„ λ•Œμ˜ 곡식을 μ΄μš©ν•΄μ„œλ„ 같은 사싀을 μ‰½κ²Œ μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€.

κΈ°ν•˜λΆ„ν¬, μŒμ΄ν•­λΆ„ν¬

μ„œλ‘œ 독립이고, 성곡 ν™•λ₯ μ΄ $p$인 λ² λ₯΄λˆ„이 μ‹œν–‰μ—μ„œ, 첫 성곡이 관찰될 λ•ŒκΉŒμ§€μ˜ μ‹œν–‰ 횟수의 뢄포λ₯Ό κΈ°ν•˜λΆ„ν¬ (Geometric distribution) 이라 ν•©λ‹ˆλ‹€. λ˜ν•œ, 이λ₯Ό $X \sim \text{Geo}(p)$ 둜 μ”λ‹ˆλ‹€.

  • $X = k$ 이기 μœ„ν•΄μ„œλŠ” $k-1$번 μ—°μ†μœΌλ‘œ μ‹€νŒ¨ν•˜κ³  $k$λ²ˆμ§Έμ— 성곡해야 ν•˜λ―€λ‘œ, ν™•λ₯ μ§ˆλŸ‰ν•¨μˆ˜λŠ” $f(x) = (1-p)^{x-1}p$ μž…λ‹ˆλ‹€.
  • $\E(X) = 1/p$ μž„μ€ μ§κ΄€μ μœΌλ‘œ λ‹Ήμ—°ν•΄ λ³΄μž…λ‹ˆλ‹€. 이λ₯Ό 증λͺ…ν•΄ 보면…
    • $\sum_{k = 0}^{\infty} k (1-p)^{k-1} p$ λ₯Ό κ³„μ‚°ν•˜λ©΄ 되고,
    • μ΄λ ‡κ²Œ 생긴 κΈ‰μˆ˜λ₯Ό Arithmetic-Geometric Progression λ“±μœΌλ‘œ λΆ€λ₯΄λ©°, 잘 μ•Œλ €μ§„ 곡식 을 μ μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 사싀 κ³ λ“±ν•™κ΅λ•Œ ν•œλ²ˆμ―€ ν•΄λ³Έ, $S$ 에 $(1-p)S$λ₯Ό λΉΌμ„œ κ³„μ‚°ν•˜λŠ” κ³΅μ‹μž…λ‹ˆλ‹€.
    • κ³„μ‚°ν•˜λ©΄ $\E(X) = 1/p$λ₯Ό μ–»μŠ΅λ‹ˆλ‹€.
  • $\V(X)$의 계산은 쒀더 λ³΅μž‘ν•˜κΈ° λ•Œλ¬Έμ—, μ—¬κΈ°μ„œλŠ” μƒλž΅ν•©λ‹ˆλ‹€. $\V(X) = \frac{1-p}{p^2}$ μž…λ‹ˆλ‹€.

κΈ°ν•˜λΆ„ν¬λ₯Ό 보닀 ν™•μž₯ν•˜μ—¬, $r$번 성곡할 λ•ŒκΉŒμ§€μ˜ μ‹œν–‰νšŸμˆ˜μ˜ 뢄포λ₯Ό μŒμ΄ν•­λΆ„ν¬ 라 ν•©λ‹ˆλ‹€.

  • 거의 κ·ΈλŒ€λ‘œ μƒκ°ν•΄μ„œ ν™•μž₯ν•  수 μžˆμŠ΅λ‹ˆλ‹€. $X = x$ 이기 μœ„ν•΄μ„œλŠ”, $x-1$번 쀑 μ •ν™•νžˆ $r-1$번 μ„±κ³΅ν•œ ν›„, $x$번째λ₯Ό 성곡해야 ν•˜λ―€λ‘œ
  • ν™•λ₯ μ§ˆλŸ‰ν•¨μˆ˜λŠ” $f(x) = \binom{x-1}{r-1} p^r (1-p)^{x-r}$ μž…λ‹ˆλ‹€.
  • λŒ€μ˜μ μœΌλ‘œλŠ” κΈ°ν•˜λΆ„ν¬ $r$개의 ν•©μœΌλ‘œ μƒκ°ν•˜λŠ” 것이 맀우 μžμ—°μŠ€λŸ½κ³ , 이에 따라 $\E(X) = r/p$, $\V(X) = r(1-p)/p^2$ 을 μ–»μŠ΅λ‹ˆλ‹€.

μ΄ˆκΈ°ν•˜λΆ„ν¬

이항뢄포λ₯Ό ν™•λ₯ μ΄ $p$인 λ² λ₯΄λˆ„이 μ‹œν–‰μ˜ 반볡이라고 μΌμ§€λ§Œ, μ‹€μ œλ‘œλŠ” $p$ λΉ„μœ¨λ§ŒνΌμ˜ 1이 μžˆλŠ” μƒν™©μ—μ„œ λ³΅μ›μΆ”μΆœμ„ ν•˜λŠ” μƒν™©μœΌλ‘œλ„ 생각할 수 μžˆμŠ΅λ‹ˆλ‹€. μ΄μ™€λŠ” 달리, μ–΄λ–€ 정해진 $N$개의 λŒ€μƒ 쀑 $D$κ°œκ°€ 1이고 λ‚˜λ¨Έμ§€κ°€ 0일 λ•Œ, $n$개λ₯Ό (λΉ„λ³΅μ›μœΌλ‘œ) λ½‘μ•„μ„œ 1이 λͺ‡κ°œλ‚˜ λ‚˜μ˜€λŠ”μ§€ μƒκ°ν•˜λŠ” 것도 κ°€λŠ₯ν•©λ‹ˆλ‹€. 이λ₯Ό μ΄ˆκΈ°ν•˜λΆ„ν¬ (Hypergeometric Distribution) 라 ν•˜λ©°, κΈ°ν˜Έλ‘œλŠ” $H(n; N, D)$ 둜 μ”λ‹ˆλ‹€.

  • $X \sim H(n; N, D)$ 일 λ•Œ, ν™•λ₯ μ§ˆλŸ‰ν•¨μˆ˜λŠ” κ°„λ‹¨ν•œ 경우의 수 문제둜 ꡬ할 수 μžˆμŠ΅λ‹ˆλ‹€. $f(x) = \binom{D}{x} \binom{N-D}{n-x} \binom{N}{n}^{-1}$. 총 $\binom{N}{n}$개의 κ°€λŠ₯ν•œ μ‘°ν•© 쀑, $x$개의 1이 λ‚˜μ˜€λŠ” 경우의 수λ₯Ό μ„ΈλŠ” κ²ƒμž…λ‹ˆλ‹€.
  • $\E$ 와 $\V$ λͺ¨λ‘ (쑰금 κ³ ν†΅μŠ€λŸ¬μš΄) 계산을 톡해 ꡬ할 수 있고, λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€. \(\E(X) = \frac{nD}{N}, \quad \quad \V(X) = \frac{n(N-n)}{N-1}\frac{D(N-D)}{N^2}\)
  • μ—¬κΈ°μ—μ„œ, $N$이 맀우 크고 $n$이 μƒλŒ€μ μœΌλ‘œ μž‘μœΌλ©° $D / N = p$ 이면 뢄포 전체가 $B(n, p)$ 와 λΉ„μŠ·ν•΄μ§‘λ‹ˆλ‹€. μ΄λŠ” 계산을 ν†΅ν•΄μ„œλ„ 증λͺ…ν•  수 μžˆμ§€λ§Œ, κ°„λ‹¨νžˆ 논증해보면 맀우 큰 μ§‘λ‹¨μ—μ„œ 극히 일뢀λ₯Ό μΆ”μΆœν•  λ•ŒλŠ” λ³΅μ›μΆ”μΆœ (이항뢄포) μ΄λ‚˜, λΉ„λ³΅μ›μΆ”μΆœ (μ΄ˆκΈ°ν•˜λΆ„ν¬) μ΄λ‚˜ λΉ„μŠ·ν•˜λ‹€λŠ” κ²ƒμ΄λ―€λ‘œ 합리적인 것 κ°™μŠ΅λ‹ˆλ‹€.