04. Bivariate Random Variables
μ΄λ³μ νλ₯ 벑ν°
λλ‘λ νλ₯ λ³μκ° νλκ° μλλΌ μ¬λ¬ κ°μΌ μλ μμ΅λλ€. μ°μ μ 2κ°μΈ κ²½μ°λ₯Ό μκ°ν©λλ€.
μ μ : μ΄μ°¨μ νλ₯ λ³μμ κ²°ν© νλ₯ λ°λν¨μ
λ νλ₯ λ³μ $X, Y$μ μμμμ΄ κ°μ§ μ μλ μ§ν©μ λν΄, κ·Έ μμμμ κ°μ§ νλ₯ (νλ₯ λ°λ) μ κ°μ λμμν€λ ν¨μ $f$λ₯Ό μ΄μ°¨μ νλ₯ λ³μμ (κ²°ν©) νλ₯ λ°λν¨μλΌκ³ μ μνλ€.
μ΄λ, νλ₯ λ³μκ° μ€μμΌ λμ κ±°μ λκ°μ΄ λ€μμ μ±μ§μ΄ μ±λ¦½ν©λλ€.
- $f(x, y) \geq 0$
- $\displaystyle\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x, y) \dd{y} \dd{x} = 1$
- $\displaystyle\int_{a}^{b} \int_{c}^{d} f(x, y) \dd{y} \dd{x} = \P(a \leq X \leq b, c \leq Y \leq d)$
μ¬μ€μ, μ΄ μ λΆμ μλ°ν μ μλ μ΄μ°¨μ 무νμ μμμ μ μν΄μΌ νλ©° $\dd{(x, y)}$ λ₯Ό $\dd{y}\dd{x}$ λλ $\dd{x}\dd{y}$ ννλ‘ κ³μ°ν μ μλ€λ 보μ₯λ μλλ μμ΅λλ€. μ΄κ²μ΄ κ°λ₯νλ€λ κ²μ Fubini-Tonelli μ 리 μ μν΄ μ»λ κ²°κ³Όμ΄μ§λ§, μ°μ μ μ΄λΆλΆμ λμ΄κ°κ² μ΅λλ€. μμΌλ‘, Unless Otherwise Specified, μ λΆμ μμλ κ΅ν κ°λ₯ν¨μ λ―Ώμ κ²μ λλ€.
μ μ : μ£Όλ³νλ₯ λ°λν¨μ
κ²°ν© νλ₯ λ°λν¨μκ° $f(x, y)$ μΈ νλ₯ λ³μ $(X, Y)$ μ λν΄, μ£Όλ³νλ₯ λ°λν¨μ (marginal pdf) λ₯Ό λ€μκ³Ό κ°μ΄ μ μνλ€.
\(f_1(x) = \int_{-\infty}^{\infty} f(x, y) \dd{y} \quad \quad f_2(y) = \int_{-\infty}^{\infty} f(x, y) \dd{x}\)
곡λΆμ°κ³Ό μκ΄κ³μ
μ μ : 곡λΆμ°, μκ΄κ³μ
λ νλ₯ λ³μ $X, Y$μ νκ· μ΄ $\mu_1, \mu_2$ μ΄κ³ νμ€νΈμ°¨κ° $\sigma_1, \sigma_2$ μΌ λ, λ€μκ³Ό κ°μ΄ 곡λΆμ°μ μ μνλ€.
\(\Cov(X, Y) = \expect{(X - \mu_1)(Y - \mu_2)}\)
λν, λ€μκ³Ό κ°μ΄ μκ΄κ³μ (Correlation coefficient) λ₯Ό μ μνλ€.
\(\Corr(X, Y) = \frac{\Cov(X, Y)}{\sigma_1 \sigma_2}\)
곡λΆμ°μ λ κ°λ€μ΄ νκ· μΌλ‘λΆν° λ¬λΌμ§λ μ λμ λν΄ μ΄λ€ κ΄κ³κ° μλμ§λ₯Ό λνλ
λλ€. μλ₯Ό λ€μ΄, $X$κ° λμ²΄λ‘ νκ· λ³΄λ€ ν΄ λ $Y$λ λμ²΄λ‘ νκ· λ³΄λ€ ν¬λ€λ©΄ 곡λΆμ°κ°μ΄ μμμ΄κ³ , κ·Έ λ°λλΌλ©΄ μμμΈ μμ
λλ€. κ·Έλ¬λ μ΄ κ°μ μ λμ μΈ $X$μ μ€μΌμΌ - μ¦, 1λΆν° 10μ¬μ΄μΈμ§, 1λΆν° 100μ¬μ΄μΈμ§ - μ μν΄ ν¬κ² λ¬λΌμ§κΈ° λλ¬Έμ, μ΄λ₯Ό $X$μ $Y$μ체μ νμ€νΈμ°¨λ‘ λλμ΄ -1κ³Ό 1 μ¬μ΄μ κ°μ κ°λλ‘ normalizeν κ°μ΄ μκ΄κ³μκ° λ©λλ€.
κ·Έλ κΈ° λλ¬Έμ, μκ΄κ³μλ μλ‘κ°μ μ νμ μκ΄κ΄κ³ κ° μΌλ§λ κ°νμ§λ₯Ό νμΈν΄ μ£Όλ κ°μ
λλ€.
λ€μμ μ±μ§λ€μ κ·Έλ κ² λ³΄λ©΄ μ’ μμ°μ€λ½μ΅λλ€.
- $\Cov(X, Y) = \Cov(Y, X), \quad \Cov(X, X) = \V(X)$
- $\Cov(aX + b, cY + d) = ac \ \Cov(X, Y)$
- $\Cov(X, Y) = \E(XY) - \mu_1 \mu_2$
- $\rho = \Corr(X, Y)$ μ λν΄, $ 1 - \rho^2 = \variance{\displaystyle\frac{Y - \mu_2}{\sigma_2} - \rho \frac{X - \mu_1}{\sigma_1}}$
λ€λ₯Έ μ±μ§λ€μ λ³λ‘ μ¦λͺ κΉμ§λ νμνμ§ μκ³ , λ§μ§λ§ μ±μ§λ§ λ Όμ¦ν΄ 보μλ©΄:
- μ°λ³μ κ²°κ΅ μ κ³±νμ¬ κΈ°λκ°μ ννλ‘ μΈ μ μμ΅λλ€. νΉν μ°λ³ $\V$ μμ κΈ°λκ°μ΄ 0μ΄λ―λ‘, \(\variance{\frac{Y - \mu_2}{\sigma_2} - \rho \frac{X - \mu_1}{\sigma_1}} = \expect{\left(\frac{Y - \mu_2}{\sigma_2} - \rho \frac{X - \mu_1}{\sigma_1}\right)^2}\)
- μ΄μ , μ΄ μ κ³±μ μ 리νλ©΄ \(\expect{\left(\frac{Y - \mu_2}{\sigma_2}\right)^2 - 2 \rho \frac{Y - \mu_2}{\sigma_2}\frac{X - \mu_1}{\sigma_1} + \left(\rho\frac{X - \mu_1}{\sigma_1}\right)^2}\)
- κΈ°λκ°μ μ νμ±μ μν΄, μ΄λ λ€μ μ λ¦¬κ° κ°λ₯ν©λλ€. \(\rho^2\frac{\V(X)}{\sigma_1^2} + \frac{\V(Y)}{\sigma_2^2} - 2\rho\frac{\Cov(X, Y)}{\sigma_1\sigma_2}\)
- μ μλ₯Ό λμ νλ©΄ μνλ μμ μ»μ΅λλ€.