[수학] 표준편차의 곱(σX * σY)의 기하학적 의미: 공분산 정규화와 상관계수의 직관적 해석
1. 공분산 정규화의 필요성
공분산(
따라서 두 변수의 변동성을 고려하여 무차원 값으로 만들기 위해 공분산을 표준편차의 곱으로 나누는 것입니다.
2. 기하학적 해석
공분산은 두 변수의 편차 벡터
이 식은 두 벡터가 얼마나 같은 방향으로 움직이는지를 측정하는데, 문제는 벡터 크기(표준편차)가 다르면 비교가 어렵다는 점입니다.
그래서 각 벡터의 크기(
3. 표준편차의 곱과 벡터 내적
확률변수
-
표준편차는 벡터의 크기(노름)로 해석됩니다.
-
공분산은 두 벡터의 내적을 기대값으로 나타낸 값입니다.
-
따라서, 피어슨 상관계수
는 **코사인 유사도(Cosine Similarity)**와 동일한 형태로 표현됩니다.여기서
는 두 벡터 사이의 각도입니다.
즉, 표준편차의 곱은 편차 벡터들의 크기를 조정하여 공분산을 -1과 1 사이의 범위로 정규화하는 역할을 합니다.
4. 기하학적 해석
표준편차의 곱을 기하학적으로 해석하면, 편차 벡터
는 편차 벡터의 크기를 곱한 값이므로,- 이는 편차 벡터가 이루는 평행사변형의 면적의 상한(bound)을 결정합니다.
- 공분산
이 최대일 때(완전한 양의 상관, ), 이 값과 동일해집니다.
즉, 표준편차의 곱은 두 변수의 변동성이 함께 변화할 수 있는 최대 한계를 제공하며, 공분산이 이를 넘지 않도록 제한하는 역할을 합니다.
5. 결론
- 표준편차의 곱
는 각 변수의 개별적인 변동성을 반영하는 스케일 조정값입니다. - 기하학적으로 편차 벡터들의 크기를 곱한 값이며, 공분산의 최대 절대값을 결정하는 기준이 됩니다.
- 피어슨 상관계수
가 -1에서 1 사이의 값을 가지도록 공분산을 정규화하는 역할을 합니다.
이제 표준편차의 곱이 왜 중요한지, 그리고 어떻게 기하학적으로 해석될 수 있는지 명확하게 이해되었을 것입니다! 😊
댓글
댓글 쓰기