📌 JAX로 멀티시계열 모델 구현 - 다중 센서 예측 및 이상 탐지

Programming/JAX

📌 JAX로 멀티시계열 모델 구현 - 다중 센서 예측 및 이상 탐지

octo54 2025. 5. 27. 10:53

📌 JAX로 멀티시계열 모델 구현 - 다중 센서 예측 및 이상 탐지

🚀 멀티시계열(Multivariate Time Series)이란?

멀티시계열은 여러 개의 시계열 데이터(예: 여러 센서, 지표 등)가 동시에 존재하는 시계열을 의미합니다.
단일 시계열 모델은 하나의 변수만 예측하지만,
멀티시계열 모델은 변수들 간의 **상호작용과 공변성(covariance)**을 함께 학습합니다.

💡 1. 주요 활용 사례

스마트 팩토리 센서 이상 탐지
금융 자산군의 동시 예측
IoT 디바이스의 시스템 전체 상태 모니터링

📊 2. 데이터 준비 - 예: 공장 센서 3종 데이터

import pandas as pd
import jax.numpy as jnp
from sklearn.preprocessing import MinMaxScaler

df = pd.read_csv("factory_multisensor.csv")  # 컬럼: ['temp', 'vibration', 'pressure']
features = ['temp', 'vibration', 'pressure']
data = df[features].values

# 정규화
scaler = MinMaxScaler()
data_scaled = scaler.fit_transform(data)

# 윈도우 생성
def create_multivariate_windows(data, window=30):
    X, y = [], []
    for i in range(len(data) - window):
        X.append(data[i:i+window])          # shape: (window, n_features)
        y.append(data[i+window])            # shape: (n_features,)
    return jnp.array(X), jnp.array(y)

x_data, y_data = create_multivariate_windows(data_scaled)

🧠 3. 멀티시계열 RNN 모델 구현 (Flax)

📐 RNN 기반 멀티시계열 모델

from flax import linen as nn

class MultivariateRNN(nn.Module):
    hidden_size: int
    output_size: int  # 예측할 변수 수 (e.g., 3)

    @nn.compact
    def __call__(self, x):
        batch_size, seq_len, feature_dim = x.shape
        h = jnp.zeros((batch_size, self.hidden_size))

        rnn_cell = nn.recurrent.LSTMCell()
        carry = rnn_cell.initialize_carry(jax.random.PRNGKey(0), (batch_size,), self.hidden_size)

        for t in range(seq_len):
            carry, h = rnn_cell(carry, x[:, t, :])

        output = nn.Dense(self.output_size)(h)
        return output

⚙️ 4. 모델 초기화 및 옵티마이저 설정

from flax.training import train_state
import optax
import jax

model = MultivariateRNN(hidden_size=64, output_size=3)
key = jax.random.PRNGKey(42)

params = model.init(key, jnp.ones((1, 30, 3)))  # batch=1, window=30, feature=3
tx = optax.adam(1e-3)

state = train_state.TrainState.create(apply_fn=model.apply, params=params, tx=tx)

📉 5. 손실 함수 및 학습 루프

@jax.jit
def mse_loss(params, x, y):
    pred = model.apply(params, x)
    return jnp.mean((pred - y) ** 2)

@jax.jit
def train_step(state, x, y):
    loss, grads = jax.value_and_grad(mse_loss)(state.params, x, y)
    state = state.apply_gradients(grads=grads)
    return state, loss

🏃 6. 모델 학습

batch_size = 64
epochs = 20

for epoch in range(epochs):
    for i in range(0, len(x_data), batch_size):
        x_batch = x_data[i:i+batch_size]
        y_batch = y_data[i:i+batch_size]
        state, loss = train_step(state, x_batch, y_batch)
    print(f"Epoch {epoch+1}, Loss: {loss:.5f}")

✅ 7. 이상 탐지 (재구성/예측 기반)

def compute_prediction_errors(model, params, x_data, y_data):
    preds = model.apply(params, x_data)
    errors = jnp.mean((preds - y_data) ** 2, axis=1)
    return errors

# 예측 오차 기반 이상치 탐지
errors = compute_prediction_errors(model, state.params, x_data, y_data)
threshold = jnp.mean(errors) + 3 * jnp.std(errors)
anomalies = errors > threshold

📈 8. 결과 시각화

import matplotlib.pyplot as plt

plt.figure(figsize=(15, 5))
plt.plot(errors, label='Prediction Error')
plt.axhline(threshold, color='red', linestyle='--', label='Anomaly Threshold')
plt.title("멀티시계열 이상 탐지 - 예측 오차 기반")
plt.legend()
plt.show()

🧠 추가 고도화 아이디어

✅ Transformer 기반 모델로 확장 (Multivariate Transformer)
✅ 예측 + 재구성 융합 이상 탐지 모델
✅ Dynamic Thresholding 도입
✅ Variational Autoencoder (MV-VAE) 기반 압축

📌 다음 글 예고: JAX로 Probabilistic Time Series Forecasting - 예측 불확실성 모델링하기

다음 글에서는 **예측값의 확률 분포(Confidence Interval)**를 추정할 수 있는
베이지안 시계열 모델을 JAX로 구현합니다.

JAX, 멀티시계열, Time Series, 이상 탐지, Multivariate, RNN, LSTM, Flax, 고속 연산, 딥러닝, 시계열 예측, 고성능 컴퓨팅, Anomaly Detection, 센서 데이터, 공정 데이터, JAX 모델, JAX 예제, Python