📌 JAX로 시계열 모델 해석하기 - SHAP 기반 Explainable AI for Time Series

Programming/JAX

📌 JAX로 시계열 모델 해석하기 - SHAP 기반 Explainable AI for Time Series

octo54 2025. 6. 4. 10:53

📌 JAX로 시계열 모델 해석하기 - SHAP 기반 Explainable AI for Time Series

🧠 왜 시계열 모델도 설명 가능해야 할까?

딥러닝 기반 시계열 모델은 예측 성능은 높지만, **"왜 그렇게 예측했는가?"**라는 질문에 답하기 어렵습니다.
특히 의료/금융/제조/스마트시티 분야에서 모델의 판단 근거는 중요합니다.

**SHAP (SHapley Additive exPlanations)**는 각 입력 시점(feature)이 예측 결과에 얼마나 기여했는지를 수치로 정량화합니다.

🎯 1. 목표

JAX 기반 시계열 분류/예측 모델의 입력에 대해
**어떤 시점(timestep)**이 예측에 가장 크게 영향을 미쳤는지 분석
SHAP 유사 로직을 JAX+Flax로 구현

🔧 2. SHAP 원리 요약

SHAP은 게임이론의 Shapley value를 활용하여
각 특성(feature)의 **기여도(Contribution)**를 정량화합니다.
시계열에서는 시간축(예: t₁, t₂, ..., tₙ)의 각 포인트가 기여도 단위가 됩니다.

💾 3. 예제 데이터 (센서 시계열 분류)

# X_test: shape (samples, 100, 3)
# y_test: shape (samples,)
# 모델: TimeSeriesTransformerClassifier

sample = X_test[0:1]  # 하나의 샘플 선택

🧠 4. Perturbation 기반 SHAP 유사 구현

def shap_values_approx(model, params, sample, baseline=None, n_iter=100, key=None):
    seq_len, num_feat = sample.shape[1], sample.shape[2]
    if baseline is None:
        baseline = jnp.zeros_like(sample)

    shap_vals = jnp.zeros((seq_len, num_feat))

    for i in range(n_iter):
        key, subkey = jax.random.split(key)
        mask = jax.random.bernoulli(subkey, p=0.5, shape=(seq_len, num_feat))
        masked_input = jnp.where(mask, sample[0], baseline[0])
        pred_full = model.apply(params, sample)
        pred_masked = model.apply(params, masked_input[None, ...])

        diff = (pred_full - pred_masked)[0]
        shap_vals += mask * diff[None, None, :num_feat]  # Broadcasting 지원

    shap_vals /= n_iter
    return shap_vals.squeeze()

📊 5. SHAP 값 시각화

import matplotlib.pyplot as plt

shap_matrix = shap_values_approx(model, state.params, sample, key=jax.random.PRNGKey(42))
shap_sum = shap_matrix.sum(axis=1)  # 각 시점별 중요도

plt.figure(figsize=(12, 4))
plt.plot(shap_sum, label="SHAP Importance per timestep")
plt.xlabel("Timestep")
plt.ylabel("Importance")
plt.title("SHAP-based Time-Series Feature Importance")
plt.legend()
plt.show()

✅ 6. 활용 시나리오

분야 해석 예시

헬스케어	심박/호흡 변화 중 어느 시점이 질병 분류에 중요했는가
스마트팩토리	설비 이상 예측에서 가장 중요한 진동 변화 구간
금융	주가 예측에서 가장 영향을 끼친 시세 변화 시점

📌 다음 글 예고: JAX로 시계열 Autoencoder 구현 - 이상 탐지를 위한 재구성 오차 기반 모델

다음 글에서는 시계열을 압축→복원하는 Autoencoder를 JAX로 구현하여
**이상 탐지 (Anomaly Detection)**에 활용하는 방법을 소개합니다.

JAX, Explainable AI, SHAP, 시계열 해석, 모델 설명, Time Series Interpretation, Flax, 시계열 분류, Feature Importance, AI 해석 가능성, Transformer 해석, Python SHAP, Game Theory, Shapley Value, AI Transparency, Time Series XAI