TCN vs LSTM — le duel des architectures
Shaojie Bai, J. Zico Kolter & Vladlen Koltun
? Le problème
Quand on pense « modéliser une séquence temporelle », le réflexe est d'utiliser des réseaux récurrents (Long Short-Term Memory, Gated Recurrent Unit). Mais est-ce réellement la meilleure architecture ? Ou existe-t-il une alternative plus simple, plus rapide et tout aussi — voire plus — performante ?
M La méthode
Des chercheurs de Carnegie Mellon et Intel Labs ont organisé un face-à-face rigoureux entre les Temporal Convolutional Networks (TCN) et les réseaux récurrents classiques (Long Short-Term Memory, Gated Recurrent Unit) sur un ensemble vaste et diversifié de tâches standards de modélisation de séquences. Ils ont comparé les architectures « génériques », pour savoir laquelle offre le meilleur point de départ général.
! L'idée clé
Les réseaux convolutionnels temporels (TCN) surpassent les Long Short-Term Memory (LSTM) sur la majorité des tâches de modélisation de séquences — ils sont plus précis, plus rapides, et capturent des dépendances plus longues. L'association automatique « séquence = LSTM » doit être abandonnée.
# Résultats
Le TCN a surpassé les Long Short-Term Memory (LSTM) et Gated Recurrent Unit (GRU) sur la grande majorité des benchmarks, tout en démontrant une mémoire effective significativement plus longue. Sur le test de mémoire séquentielle, le TCN maintient 100% de précision quelle que soit la longueur de la séquence.
Comment byzance utilise cette recherche
Nos modèles de prédiction utilisent des architectures TCN plutôt que les Long Short-Term Memory (LSTM) classiques. Le bénéfice : des prédictions plus précises (surtout quand des patterns de long terme comptent) et des temps de calcul réduits — ce qui nous permet de réagir plus vite aux changements de marché.
Référence
Bai, S., Kolter, J. Z., & Koltun, V. (2018). An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling. arXiv preprint arXiv:1803.01271.
Lire l'article original →Ces recherches alimentent vos portefeuilles
Chaque algorithme de byzance est fondé sur des décennies de recherche académique. Essayez gratuitement pendant 30 jours.
Essayer gratuitement