[투자] 기술적 분석(TA) + 머신러닝: 학습시킬 특성은 생각보다 적다?

7월 04, 2025

🎯 기술적 분석(TA) + 머신러닝: 학습시킬 특성은 생각보다 적다?

"기술적 분석(TA)을 머신러닝과 결합하면 시장 예측이 가능하지 않을까?"
하지만 막상 들여다보면, 학습시킬 **원천 특성(feature)**이 의외로 많지 않다는 사실을 깨닫게 됩니다.
왜 그런지, 그리고 어떻게 극복할 수 있는지 알아보겠습니다.

📉 왜 TA의 학습 특성은 적을까?

1. 원천 데이터가 단순하다

대부분의 TA 지표는 결국 아래의 두 가지 원시 데이터에서 출발합니다:

가격 (시가, 고가, 저가, 종가)
거래량 (시간당 혹은 일간 체결 수량)

👉 실제로는 종가와 거래량만 가지고 계산하는 지표들이 대부분이죠.

2. 지표 간 상관관계가 높다

TA 지표들은 이름은 다르지만 비슷한 계산 방식을 공유합니다.

RSI, Stochastic, CCI → 전부 과매수/과매도 판단
MACD, EMA, DMI → 전부 추세 방향성 계산

즉, 수십 개의 지표를 써도 **정보의 본질은 겹치며 중복성(Redundancy)**이 매우 큽니다.

3. 의미 있는 지표는 소수뿐이다

백테스트나 머신러닝 실험을 해보면,
수백 개의 지표 조합 중 실제로 out-of-sample 예측력(실전 성능)을 가지는 조합은 극히 일부입니다.

📌 많은 지표들이 **과최적화(overfitting)**나 **데이터 마이닝 편향(data-mining bias)**에 빠지기 쉽습니다.

🧠 그럼 어떻게 대응할까?

1. 파생 Feature로 다차원 확장하자

단순한 가격/거래량 데이터를 다양한 방식으로 가공해서 새로운 특성을 만들 수 있습니다.

파생 특성	의미
20일 EMA의 기울기	추세 방향의 변화율
최근 10봉의 z-score	평균 대비 극단 위치 여부
현재가와 VWAP의 거리	수급 우위 판단
캔들 길이 분산	변동성 변화 탐지

👉 이렇게 원시 데이터를 다양한 시각과 수학적 구조로 확장하면, 의미 있는 feature 수를 늘릴 수 있습니다.

2. 다른 정보원 결합하기

TA만으로 부족하다면, 외부 요인을 결합하세요:

🧠 심리 지표: 뉴스 감성, 트위터 언급량
📊 시장 구조: 호가 잔량, 틱 데이터
💡 거시 지표: 금리, 유동성, 글로벌 이벤트

→ 원천 데이터가 적다면, 정보의 범위 자체를 확장하는 것이 해답이 될 수 있습니다.

3. 시간 흐름 패턴까지 학습하자

단순히 현재 시점의 RSI가 30이라고 매수할까요?
더 중요한 건 최근 며칠간 RSI, OBV, 거래량의 변화 흐름입니다.

🧠 이를 위해 LSTM, Temporal CNN, Transformer 같은 시계열 모델을 활용하면 시간적 패턴을 학습할 수 있습니다.

📌 요약

현실	대응 전략
TA 지표는 원천 정보가 적다	파생 특성으로 확장하자
지표들 간 중복성이 높다	상관관계 낮은 조합을 추리자
예측력이 약한 지표가 많다	외부 정보 결합 + 시간 구조 학습으로 보완하자

✨ 마무리 생각

기술적 분석은 단순하지만 강력한 구조를 가지고 있습니다.
이 단순함을 머신러닝과 결합해 깊이 있게 확장하면, 단순한 지표도 강력한 예측 도구로 바뀔 수 있습니다.

“적은 정보를 어떻게 잘 가공하고, 잘 결합하고, 잘 해석할 것인가”

이것이 바로 TA + ML 전략의 핵심입니다.

이 블로그의 인기 게시물

이 블로그 검색

Programming for Real-World