피어슨 상관계수( ρ ( X , Y ) \rho(X,Y) )는 -1과 1 사이의 값을 가진다. 그런데, 왜 항상 이 범위를 벗어나지 않을까? 이 글에서는 코시-슈바르츠 부등식을 활용해 이를 증명하고, 기하학적 의미까지 살펴보겠다. 1. 피어슨 상관계수 정의 피어슨 상관계수는 공분산을 각 변수의 표준편차 곱으로 나눈 값이다. ρ ( X , Y ) = Cov ( X , Y ) σ X σ Y \rho(X,Y) = \frac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y} 여기서 Cov ( X , Y ) \text{Cov}(X,Y) 는 공분산, σ X \sigma_X 와 σ Y \sigma_Y 는 각각 X와 Y의 표준편차다. 2. 코시-슈바르츠 부등식 활용 증명 코시-슈바르츠 부등식은 다음과 같다. ∣ u ⋅ v ∣ ≤ ∥ u ∥ ∥ v ∥ | \mathbf{u} \cdot \mathbf{v} | \leq \| \mathbf{u} \| \| \mathbf{v} \| 이제, X와 Y를 확률 변수로 보고, 각각의 편차 벡터를 정의하자. U = X − E [ X ] , V = Y − E [ Y ] U = X - E[X], \quad V = Y - E[Y] 이제, 이 벡터들의 내적을 계산하면 공분산과 연결된다. E [ U V ] = Cov ( X , Y ) E[UV] = \text{Cov}(X,Y) 또한, 각각의 벡터 크기는 표준편차와 같다. ∥ U ∥ = σ X , ∥ V ∥ = σ Y \| U \| = \sigma_X, \quad \| V \| = \sigma_Y 이를 코시-슈바르츠 부등식에 적용하면, ∣ Cov ( X , Y ) ∣ ≤ σ X σ Y |\text{Cov}(X,Y)| \leq \sigma_X \sigma_Y 이제 양변을 σ X σ Y \sigma_X \sigma_Y 로 나누면, − 1 ≤ Cov ( X , Y ) σ X σ Y ≤ 1 -1 \leq \frac{\text{Cov}(X,Y)}{\sigma_X \s...
댓글
댓글 쓰기