[퀀트] 포트폴리오 분산 수식 유도과정

 

포트폴리오 분산은 왜 이렇게 생겼을까?

— 정의에서 출발하는 완전한 유도

많은 금융·퀀트 책에서 포트폴리오 분산은 갑자기 다음과 같이 등장한다.

σp2=wTΣw\sigma_p^2 = w^T \Sigma w

하지만 이 식은 기억해야 할 공식이 아니라,
아주 기본적인 분산의 정의에서 기계적으로 따라 나온 결과다.

이번 글의 목표는 단 하나다.

“이 식이 어디서 나왔는지, 단 한 줄도 점프하지 않고 이해하기”


1️⃣ 출발점: 분산의 정의

모든 것은 이 정의 하나에서 시작한다.

Var(X)=E[(XE[X])2]\mathrm{Var}(X) = \mathbb{E}\left[(X - \mathbb{E}[X])^2\right]

이 식이 말하는 것은 단순하다.

“X가 자기 평균에서 얼마나 흔들리는지를 제곱해서 평균 낸 값”

여기서:

  • XX : 확률변수 (예: 자산 수익률)

  • E[X]\mathbb{E}[X] : 그 확률변수의 평균(기대값)


2️⃣ 자산 수익률은 왜 확률변수인가?

자산의 미래 수익률은 확정된 숫자가 아니다.

  • 오를 수도 있고

  • 내릴 수도 있고

  • 그 크기도 매번 다르다

그래서 우리는 자산 수익률을 이렇게 둔다.

X=자산 X의 수익률 (확률변수)X = \text{자산 X의 수익률 (확률변수)}

그리고 과거 데이터로 평균을 추정한다.

E[X]1Tt=1Trt\mathbb{E}[X] \approx \frac{1}{T}\sum_{t=1}^{T} r_t

3️⃣ 포트폴리오 수익률 정의

이제 자산 2개짜리 포트폴리오를 보자.

  • 자산 X 비중: w1w_1

  • 자산 Y 비중: w2w_2

포트폴리오 수익률은 정의상

Rp=w1X+w2YR_p = w_1 X + w_2 Y

👉 이건 모델이 아니라 정의다
(“돈을 이렇게 나눠 담았으면 수익률도 이렇게 섞인다”)


4️⃣ 포트폴리오 분산 정의에 그대로 대입

이제 분산 정의를 그대로 쓴다.

Var(Rp)=E[(RpE[Rp])2]\mathrm{Var}(R_p) = \mathbb{E}\left[(R_p - \mathbb{E}[R_p])^2\right]

기대값의 선형성 때문에

E[Rp]=w1E[X]+w2E[Y]\mathbb{E}[R_p] = w_1 \mathbb{E}[X] + w_2 \mathbb{E}[Y]

따라서

RpE[Rp]=w1(XE[X])+w2(YE[Y])R_p - \mathbb{E}[R_p] = w_1 (X - \mathbb{E}[X]) + w_2 (Y - \mathbb{E}[Y])

5️⃣ 여기서 핵심: 제곱을 전개한다

(w1A+w2B)2(w_1 A + w_2 B)^2

이건 고등학교 때 배운 그대로다.

=w12A2+w22B2+2w1w2AB= w_1^2 A^2 + w_2^2 B^2 + 2w_1 w_2 AB

여기서

  • A=XE[X]A = X - \mathbb{E}[X]

  • B=YE[Y]B = Y - \mathbb{E}[Y]


6️⃣ 기대값을 하나씩 적용

Var(Rp)=E[w12A2]+E[w22B2]+2w1w2E[AB]\mathrm{Var}(R_p) = \mathbb{E}[w_1^2 A^2] + \mathbb{E}[w_2^2 B^2] + 2w_1w_2\mathbb{E}[AB]

상수는 밖으로 뺀다.

=w12E[A2]+w22E[B2]+2w1w2E[AB]= w_1^2 \mathbb{E}[A^2] + w_2^2 \mathbb{E}[B^2] + 2w_1w_2 \mathbb{E}[AB]

7️⃣ 여기서 등장하는 개념들

🔹 분산

E[(XE[X])2]=Var(X)\mathbb{E}[(X - \mathbb{E}[X])^2] = \mathrm{Var}(X)

🔹 공분산

E[(XE[X])(YE[Y])]=Cov(X,Y)\mathbb{E}[(X - \mathbb{E}[X])(Y - \mathbb{E}[Y])] = \mathrm{Cov}(X,Y)

8️⃣ 최종 결과 (자연스럽게!)

Var(Rp)=w12Var(X)+w22Var(Y)+2w1w2Cov(X,Y)\boxed{ \mathrm{Var}(R_p) = w_1^2 \mathrm{Var}(X) + w_2^2 \mathrm{Var}(Y) + 2w_1 w_2 \mathrm{Cov}(X,Y) }

👉 어떤 가정도 없다
👉 확률분포도 필요 없다
👉 분산의 정의 + 대수 전개뿐


9️⃣ “분산은 모든 쌍의 상호작용이다”의 의미

이 식이 말하는 것:

  • 각 자산 혼자 흔들리는 정도wi2Var(Xi)w_i^2 \mathrm{Var}(X_i)

  • 자산들이 같이 흔들리는 정도wiwjCov(Xi,Xj)w_i w_j \mathrm{Cov}(X_i, X_j)

👉 그래서 분산은

“모든 자산 쌍의 상호작용을 전부 더한 것”

이다.


왜 행렬식이 되는가?

자산이 2개면 위 식을 손으로 쓸 수 있다.
하지만 자산이 10개, 100개면?

👉 이중합(double sum) 이 필요해진다.

ijwiwjCov(Xi,Xj)\sum_i \sum_j w_i w_j \mathrm{Cov}(X_i, X_j)

이걸 가장 깔끔하게 표현한 것이

σp2=wTΣw\boxed{\sigma_p^2 = w^T \Sigma w}

이다.

댓글

이 블로그의 인기 게시물

[PLC] PLC 아날로그 입출력 기본

[주식] 한국거래소(KRX) 데이터 API 입문 가이드

전력(kW) 계산하기 (직류, 교류 단상, 교류 삼상)

NPN, PNP 트랜지스터 차이점

공압 속도 제어: 미터인 vs 미터아웃

[PLC] PLC 센서 결선방법: NPN, PNP, SOURCING, SINK

[PLC] 센서 NPN, PNP 출력 타입별 결선방법 (OMRON E2E-X 시리즈 3선식 배선)

사각형의 넓이 공식의 증명

[전기 기초] 전력공식 P=VI 유도

커패시터에 저장된 에너지 계산