[수학] 표준편차의 곱(σX * σY)의 기하학적 의미: 공분산 정규화와 상관계수의 직관적 해석

1. 공분산 정규화의 필요성

공분산(Cov(X,Y)\text{Cov}(X, Y))은 두 변수 XXYY의 단위에 따라 값이 달라집니다. 예를 들어, XX가 키(cm), YY가 몸무게(kg)라면, 공분산의 단위도 cm·kg가 되어 직관적으로 해석하기 어렵습니다.

따라서 두 변수의 변동성을 고려하여 무차원 값으로 만들기 위해 공분산을 표준편차의 곱으로 나누는 것입니다.


2. 기하학적 해석

공분산은 두 변수의 편차 벡터 (XE[X],YE[Y])(X - E[X], Y - E[Y])의 **내적(inner product)**과 비슷한 개념입니다:

Cov(X,Y)=1n(XiE[X])(YiE[Y])\text{Cov}(X,Y) = \frac{1}{n} \sum (X_i - E[X])(Y_i - E[Y])

이 식은 두 벡터가 얼마나 같은 방향으로 움직이는지를 측정하는데, 문제는 벡터 크기(표준편차)가 다르면 비교가 어렵다는 점입니다.

그래서 각 벡터의 크기(σX,σY\sigma_X, \sigma_Y)로 나누면 단위 벡터처럼 정규화할 수 있습니다.


3. 표준편차의 곱과 벡터 내적

확률변수 X,YX, Y의 편차 벡터를 각각 U=XE[X]U = X - E[X], V=YE[Y]V = Y - E[Y] 라고 하면,

  • 표준편차는 벡터의 크기(노름)로 해석됩니다.

    σX=U,σY=V\sigma_X = \| U \|, \quad \sigma_Y = \| V \|
  • 공분산은 두 벡터의 내적을 기대값으로 나타낸 값입니다.

    Cov(X,Y)=E[UV]\text{Cov}(X, Y) = E[U V]
  • 따라서, 피어슨 상관계수 ρ\rho는 **코사인 유사도(Cosine Similarity)**와 동일한 형태로 표현됩니다.

    ρ(X,Y)=E[UV]UV=cos(θ)\rho(X, Y) = \frac{E[U V]}{\| U \| \cdot \| V \|} = \cos(\theta)

    여기서 θ\theta는 두 벡터 U,VU, V 사이의 각도입니다.

즉, 표준편차의 곱은 편차 벡터들의 크기를 조정하여 공분산을 -1과 1 사이의 범위로 정규화하는 역할을 합니다.


4. 기하학적 해석

표준편차의 곱을 기하학적으로 해석하면, 편차 벡터 U,VU, V가 형성하는 평행사변형의 면적과 관련이 있습니다.

  • σXσY\sigma_X \cdot \sigma_Y편차 벡터의 크기를 곱한 값이므로,
  • 이는 편차 벡터가 이루는 평행사변형의 면적의 상한(bound)을 결정합니다.
  • 공분산 Cov(X,Y)\text{Cov}(X, Y)이 최대일 때(완전한 양의 상관, ρ=1\rho = 1), 이 값과 동일해집니다.

즉, 표준편차의 곱은 두 변수의 변동성이 함께 변화할 수 있는 최대 한계를 제공하며, 공분산이 이를 넘지 않도록 제한하는 역할을 합니다.


5. 결론

  1. 표준편차의 곱 σXσY\sigma_X \cdot \sigma_Y각 변수의 개별적인 변동성을 반영하는 스케일 조정값입니다.
  2. 기하학적으로 편차 벡터들의 크기를 곱한 값이며, 공분산의 최대 절대값을 결정하는 기준이 됩니다.
  3. 피어슨 상관계수 ρ\rho가 -1에서 1 사이의 값을 가지도록 공분산을 정규화하는 역할을 합니다.

이제 표준편차의 곱이 왜 중요한지, 그리고 어떻게 기하학적으로 해석될 수 있는지 명확하게 이해되었을 것입니다! 😊

댓글

이 블로그의 인기 게시물

공압 속도 제어: 미터인 vs 미터아웃

[PLC] PLC 아날로그 입출력 기본

[아두이노] 가변저항(Potential Divider)과 전압분배(Voltage Divider)

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

Industrial Control with Relay: 파워릴레이와 범용릴레이

제너 다이오드에 저항을 연결하는 이유

NPN, PNP 트랜지스터 차이점

[전기 기초] 전력공식 P=VI 유도

[PLC] 프로그래밍 - SFC Conversion 기법 (1)

PLC 출력 형태