티스토리 뷰

주식

🧠 AI 팩터 예측 모델 구축 – Transformer로 다음 분기 수익률 예측하기

octo54 2025. 10. 28. 11:59

🧠 AI 팩터 예측 모델 구축 – Transformer로 다음 분기 수익률 예측하기

지금까지 만든 퀀트 시스템은 데이터를 “활용”하는 수준이었죠.
하지만 진짜 퀀트의 힘은 데이터를 **“예측”**하는 데 있습니다.

이번 글에서는 최신 딥러닝 모델인 Transformer를 이용해
다음 분기의 팩터 수익률을 예측하는 AI 모델을 직접 만들어봅니다.

🎯 목표

yfinance로 팩터 시계열 데이터 수집

Transformer Encoder 기반 예측 모델 구성

과거 팩터 데이터를 입력 → 미래 1개월 수익률 예측

학습 후 MSE, MAE, R² 등 지표 평가

🧱 1️⃣ 데이터 준비

우선 각 팩터(모멘텀, 가치, 퀄리티, 저변동성 등)에 대해
과거 3년간의 월별 수익률 데이터를 만듭니다.

import yfinance as yf
import pandas as pd

tickers = ["005930.KS", "000660.KS", "035420.KS", "068270.KQ"]
df_list = []

for t in tickers:
    data = yf.download(t, period="3y", interval="1mo")
    data["ticker"] = t
    data["return"] = data["Close"].pct_change()
    df_list.append(data)

df = pd.concat(df_list)
df = df.dropna()
df.to_csv("factor_returns.csv", index=False)
print(df.head())

💡 이렇게 하면 월별 종목 수익률이 계산되어 “팩터 시계열 입력”으로 사용할 수 있습니다.

🧩 2️⃣ Transformer 모델 개념

Transformer는 시계열 데이터를 다루는 데 매우 강력합니다.
기존 LSTM과 달리 병렬 연산이 가능하고,
“Self-Attention”으로 어떤 시점이 중요한지 스스로 학습합니다.

입력: 과거 12개월 팩터 수익률 → 출력: 다음 1개월 예측

⚙️ 3️⃣ 모델 구현 (PyTorch)

import torch
import torch.nn as nn
import numpy as np

class FactorTransformer(nn.Module):
    def __init__(self, input_dim=4, hidden_dim=64, n_heads=4, n_layers=2, dropout=0.1):
        super().__init__()
        self.encoder_layer = nn.TransformerEncoderLayer(
            d_model=hidden_dim, nhead=n_heads, dropout=dropout
        )
        self.transformer = nn.TransformerEncoder(self.encoder_layer, num_layers=n_layers)
        self.input_fc = nn.Linear(input_dim, hidden_dim)
        self.output_fc = nn.Linear(hidden_dim, 1)

    def forward(self, x):
        x = self.input_fc(x)
        x = self.transformer(x)
        x = x.mean(dim=1)
        out = self.output_fc(x)
        return out

🧮 4️⃣ 데이터 전처리

12개월 단위 윈도우로 데이터를 나누어 입력(X), 예측(y)을 만듭니다.

import torch
from sklearn.preprocessing import StandardScaler

df = pd.read_csv("factor_returns.csv")
pivot = df.pivot_table(index="Date", columns="ticker", values="return").fillna(0)

scaler = StandardScaler()
X_data = []
y_data = []
window = 12

values = scaler.fit_transform(pivot.values)
for i in range(len(values) - window):
    X_data.append(values[i:i+window])
    y_data.append(values[i+window])

X = torch.tensor(np.array(X_data), dtype=torch.float32)
y = torch.tensor(np.array(y_data), dtype=torch.float32)

🧠 5️⃣ 학습 루프

model = FactorTransformer(input_dim=X.shape[2])
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
criterion = nn.MSELoss()

for epoch in range(100):
    model.train()
    optimizer.zero_grad()
    pred = model(X)
    loss = criterion(pred, y.mean(dim=1, keepdim=True))
    loss.backward()
    optimizer.step()
    if epoch % 10 == 0:
        print(f"Epoch {epoch}, Loss: {loss.item():.6f}")

📈 6️⃣ 예측 결과 확인

model.eval()
preds = model(X).detach().numpy().flatten()
actual = y.mean(dim=1).numpy().flatten()

import matplotlib.pyplot as plt
plt.figure(figsize=(10,5))
plt.plot(preds, label="Predicted Return")
plt.plot(actual, label="Actual Return")
plt.legend()
plt.title("Next-Month Return Prediction (Transformer)")
plt.show()

Transformer 모델이 학습하면서 “시장 패턴”을 점차 따라가기 시작하면
예측곡선이 실제 수익률의 변동 흐름을 점점 닮게 됩니다.

🧮 7️⃣ 평가 지표

from sklearn.metrics import mean_squared_error, r2_score

print("MSE:", mean_squared_error(actual, preds))
print("R²:", r2_score(actual, preds))

💡 MSE가 낮고 R²가 0.7 이상이면 꽤 안정적으로 패턴을 잡고 있는 것입니다.

⚡ 8️⃣ Flask + Streamlit 연동

모델 예측을 API로 제공합니다.

# Flask API snippet
@app.route("/predict_next")
def predict_next():
    pred = model(X[-1:].to(torch.float32)).item()
    return jsonify({"next_month_expected_return": float(pred)})

Streamlit에서는 이 API를 호출해
📊 “예상 수익률” 영역에 실시간으로 표시할 수 있습니다.

pred = requests.get(f"{API_URL}/predict_next").json()
st.metric("📈 Next Month Predicted Return", f"{pred['next_month_expected_return']:.2%}")

🧠 9️⃣ 모델 개선 아이디어

개선 방향 설명

🧩 Multi-Factor Input	모멘텀, 밸류, 퀄리티, 변동성 각각을 Feature로 추가
🧮 Multi-Step Forecast	1개월 → 3개월 Ahead 예측
🧠 Transfer Learning	글로벌 ETF/인덱스 데이터를 사전학습 후 Fine-tune
🧾 Model Ensemble	Transformer + LSTM + XGBoost 결합
☁️ 배포	TorchScript or ONNX로 변환 → Flask 서버에 탑재

📌 정리

단계 내용

1	yfinance로 팩터 시계열 데이터 생성
2	Transformer 모델 정의
3	입력/출력 윈도우 구성
4	학습 및 시각화
5	Flask + Streamlit 통합
6	예측값 실시간 모니터링 가능

이제 퀀트 시스템은 단순히 과거를 추적하는 게 아니라,
다음 달 시장의 흐름을 미리 예측해 움직이는 수준에 도달했습니다.

📘 다음 글 예고

다음 편에서는 **“Transformer + Reinforcement Learning을 결합한 동적 포트폴리오 조정 시스템”**을 다룹니다.
즉, AI가 스스로 학습해 포트폴리오 비중을 매월 재구성하는 “자율 운용형 퀀트 매니저”를 구현합니다.

Transformer,딥러닝퀀트,AI투자모델,파이토치,시계열예측,퀀트AI,팩터예측,데이터투자,파이썬딥러닝,포트폴리오예측

'주식' 카테고리의 다른 글

🧩 MLOps 기반 퀀트 AI 파이프라인 구축 – MLflow + Docker + Streamlit Monitoring (0)	2025.10.30
🤖 강화학습으로 만드는 자율 운용형 퀀트 포트폴리오 AI (0)	2025.10.29
📈 Streamlit + Flask로 만드는 실시간 퀀트 투자 대시보드 (실전 운영 UI 완성편) (0)	2025.10.27
🧯 실전 운영 모드 – 오류 감지, 슬랙 알림, 백업 전략 (운영 자동화 Ops 완전체) (0)	2025.10.23
🧭 퀀트 자동매매 서버 구축 – Flask + Scheduler + DB로 완전 자동화 시스템 만들기 (0)	2025.10.22

※ 이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/02 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

글 보관함

TwentyTwentyOne

티스토리 뷰