SmartCrypto — Stratégies crypto quantitatives 2018

TCN vs LSTM — le duel des architectures

Shaojie Bai, J. Zico Kolter & Vladlen Koltun

Deep Learning Architecture

? Le problème

Quand on pense « modéliser une séquence temporelle », le réflexe est d'utiliser des réseaux récurrents (Long Short-Term Memory, Gated Recurrent Unit). Mais est-ce réellement la meilleure architecture ? Ou existe-t-il une alternative plus simple, plus rapide et tout aussi — voire plus — performante ?

M La méthode

Des chercheurs de Carnegie Mellon et Intel Labs ont organisé un face-à-face rigoureux entre les Temporal Convolutional Networks (TCN) et les réseaux récurrents classiques (Long Short-Term Memory, Gated Recurrent Unit) sur un ensemble vaste et diversifié de tâches standards de modélisation de séquences. Ils ont comparé les architectures « génériques », pour savoir laquelle offre le meilleur point de départ général.

! L'idée clé

Les réseaux convolutionnels temporels (TCN) surpassent les Long Short-Term Memory (LSTM) sur la majorité des tâches de modélisation de séquences — ils sont plus précis, plus rapides, et capturent des dépendances plus longues. L'association automatique « séquence = LSTM » doit être abandonnée.

# Résultats

Le TCN a surpassé les Long Short-Term Memory (LSTM) et Gated Recurrent Unit (GRU) sur la grande majorité des benchmarks, tout en démontrant une mémoire effective significativement plus longue. Sur le test de mémoire séquentielle, le TCN maintient 100% de précision quelle que soit la longueur de la séquence.

Comment byzance utilise cette recherche

Nos modèles de prédiction utilisent des architectures TCN plutôt que les Long Short-Term Memory (LSTM) classiques. Le bénéfice : des prédictions plus précises (surtout quand des patterns de long terme comptent) et des temps de calcul réduits — ce qui nous permet de réagir plus vite aux changements de marché.

Référence

Bai, S., Kolter, J. Z., & Koltun, V. (2018). An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling. arXiv preprint arXiv:1803.01271.

Lire l'article original →

Ces recherches alimentent vos portefeuilles

Chaque algorithme de byzance est fondé sur des décennies de recherche académique. Essayez gratuitement pendant 30 jours.

Essayer gratuitement