[투자] 기술적 분석(TA) + 머신러닝: 학습시킬 특성은 생각보다 적다?
🎯 기술적 분석(TA) + 머신러닝: 학습시킬 특성은 생각보다 적다?
"기술적 분석(TA)을 머신러닝과 결합하면 시장 예측이 가능하지 않을까?"
하지만 막상 들여다보면, 학습시킬 **원천 특성(feature)**이 의외로 많지 않다는 사실을 깨닫게 됩니다.
왜 그런지, 그리고 어떻게 극복할 수 있는지 알아보겠습니다.
📉 왜 TA의 학습 특성은 적을까?
1. 원천 데이터가 단순하다
대부분의 TA 지표는 결국 아래의 두 가지 원시 데이터에서 출발합니다:
-
가격 (시가, 고가, 저가, 종가)
-
거래량 (시간당 혹은 일간 체결 수량)
👉 실제로는 종가와 거래량만 가지고 계산하는 지표들이 대부분이죠.
2. 지표 간 상관관계가 높다
TA 지표들은 이름은 다르지만 비슷한 계산 방식을 공유합니다.
-
RSI, Stochastic, CCI → 전부 과매수/과매도 판단
-
MACD, EMA, DMI → 전부 추세 방향성 계산
즉, 수십 개의 지표를 써도 **정보의 본질은 겹치며 중복성(Redundancy)**이 매우 큽니다.
3. 의미 있는 지표는 소수뿐이다
백테스트나 머신러닝 실험을 해보면,
수백 개의 지표 조합 중 실제로 out-of-sample 예측력(실전 성능)을 가지는 조합은 극히 일부입니다.
📌 많은 지표들이 **과최적화(overfitting)**나 **데이터 마이닝 편향(data-mining bias)**에 빠지기 쉽습니다.
🧠 그럼 어떻게 대응할까?
1. 파생 Feature로 다차원 확장하자
단순한 가격/거래량 데이터를 다양한 방식으로 가공해서 새로운 특성을 만들 수 있습니다.
파생 특성 | 의미 |
---|---|
20일 EMA의 기울기 | 추세 방향의 변화율 |
최근 10봉의 z-score | 평균 대비 극단 위치 여부 |
현재가와 VWAP의 거리 | 수급 우위 판단 |
캔들 길이 분산 | 변동성 변화 탐지 |
👉 이렇게 원시 데이터를 다양한 시각과 수학적 구조로 확장하면, 의미 있는 feature 수를 늘릴 수 있습니다.
2. 다른 정보원 결합하기
TA만으로 부족하다면, 외부 요인을 결합하세요:
-
🧠 심리 지표: 뉴스 감성, 트위터 언급량
-
📊 시장 구조: 호가 잔량, 틱 데이터
-
💡 거시 지표: 금리, 유동성, 글로벌 이벤트
→ 원천 데이터가 적다면, 정보의 범위 자체를 확장하는 것이 해답이 될 수 있습니다.
3. 시간 흐름 패턴까지 학습하자
단순히 현재 시점의 RSI가 30이라고 매수할까요?
더 중요한 건 최근 며칠간 RSI, OBV, 거래량의 변화 흐름입니다.
🧠 이를 위해 LSTM, Temporal CNN, Transformer 같은 시계열 모델을 활용하면 시간적 패턴을 학습할 수 있습니다.
📌 요약
현실 | 대응 전략 |
---|---|
TA 지표는 원천 정보가 적다 | 파생 특성으로 확장하자 |
지표들 간 중복성이 높다 | 상관관계 낮은 조합을 추리자 |
예측력이 약한 지표가 많다 | 외부 정보 결합 + 시간 구조 학습으로 보완하자 |
✨ 마무리 생각
기술적 분석은 단순하지만 강력한 구조를 가지고 있습니다.
이 단순함을 머신러닝과 결합해 깊이 있게 확장하면, 단순한 지표도 강력한 예측 도구로 바뀔 수 있습니다.
“적은 정보를 어떻게 잘 가공하고, 잘 결합하고, 잘 해석할 것인가”
이것이 바로 TA + ML 전략의 핵심입니다.
댓글
댓글 쓰기