1. Accueil
  2. Laboratoire
  3. Présentation
  4. Actualités
  5. « Le Monde » – Un composant optique parvient à entraîner efficacement un réseau de neurones

04/06/2026Article scientifiquePhotonique, Information & Complexité

« Le Monde » – Un composant optique parvient à entraîner efficacement un réseau de neurones

Nouvelle publication : Sylvain Gigan est le co-auteur

Lire l’article dans Le Monde : https://www.lemonde.fr/sciences/article/2026/06/04/un-composant-optique-parvient-a-entrainer-efficacement-un-reseau-de-neurones_6697085_1650684.html

Entraîner les réseaux de neurones géants grâce à la lumière : une percée au-delà du silicium pour briser le mur de la mémoire.

Une équipe internationale menée par le Laboratoire Kastler Brossel (Sorbonne Université, ENS-PSL, CNRS, Collège de France) et l’entreprise LightOn a mis au point une méthode d’apprentissage optique inédite. Publiée dans la revue PNAS, cette approche exploite la propagation de la lumière dans des milieux désordonnés pour contourner les limites de mémoire des processeurs électroniques actuels. Elle rend ainsi possible l’entraînement de modèles d’Intelligence Artificielle de très grande taille de manière drastiquement plus rapide et économe en énergie.
 
Contexte et Problématique : Le goulot d’étranglement de la rétropropagation 
Aujourd’hui, l’entraînement des intelligences artificielles repose quasi exclusivement sur l’algorithme de rétropropagation du gradient (backpropagation). Si cette méthode est mathématiquement optimale, elle souffre d’un défaut matériel majeur : elle nécessite de stocker en mémoire l’intégralité des signaux d’activation de la phase « aller » pour calculer les corrections lors de la phase « retour ». Pour les modèles de fondation modernes (comme les LLMs), ce besoin en mémoire croît de façon exponentielle et sature rapidement la RAM des processeurs graphiques (GPU), forçant les ingénieurs à recourir à des compromis logiciels ralentissant considérablement les calculs (techniques d’offloading).


La Découverte : L’Alignement par Retour Direct Optique (ODFA) 
Pour lever ce verrou, les chercheurs ont remplacé la rétropropagation par un algorithme alternatif appelé Direct Feedback Alignment (DFA). Plutôt que de faire remonter l’erreur couche par couche, le DFA projette directement le signal d’erreur global vers chaque couche cachée via une matrice de projection aléatoire. L’innovation majeure de cette publication est la réalisation physique et optique de cette projection aléatoire (Optical DFA). Au lieu de calculer informatiquement cette multiplication matricielle coûteuse, les chercheurs utilisent un coprocesseur optique (OPU). Un faisceau laser encodant le signal d’erreur traverse un milieu optique diffusant (opaque). La physique fondamentale des ondes fait le reste : les interférences multiples génèrent instantanément une projection aléatoire de très haute dimension. L’opération est effectuée à la vitesse de la lumière et avec une consommation énergétique quasi nulle.


Résultats et Perspectives : Un passage à l’échelle inédit 
Les résultats publiés démontrent que l’approche ODFA permet de conserver d’excellentes performances d’apprentissage tout en offrant un passage à l’échelle (scalability) que l’électronique ne permet plus.

  • Capacité de traitement : L’OPU permet d’entraîner des couches de neurones de dimensions massives (jusqu’à 45000*45000  paramètres), un régime où les GPU tombent systématiquement en panne de mémoire.
  • Vitesse : Dans ces régimes de très haute dimension, le temps d’exécution de la projection optique reste constant, rendant l’entraînement jusqu’à 50 fois plus rapide qu’une simulation purement électronique. Cette percée démontre que le calcul photonique en milieu complexe n’est pas seulement un accélérateur de vitesse, mais une véritable solution structurelle pour concevoir des architectures d’apprentissage machine fondamentalement différentes et plus durables.


Prochaines étapes et applications : Vers une IA « frugale » et décentralisée 
Si cette preuve de concept marque un tournant scientifique, la prochaine étape pour l’équipe consistera à étendre cette architecture optique aux modèles d’IA les plus complexes du moment, tels que les transformeurs (l’architecture au cœur des grands modèles de langage). Sur le plan matériel, l’enjeu sera d’accélérer les interfaces de conversion entre l’électronique et la lumière (modulateurs et caméras) pour maximiser les gains de vitesse. À plus long terme, cette technologie ouvre la voie à une « Green AI » (IA verte). En réduisant drastiquement le besoin en mémoire et en énergie pour la phase critique de l’entraînement, la photonique permettrait non seulement de freiner l’empreinte carbone exponentielle des centres de données, mais aussi d’envisager un apprentissage massif, décentralisé et continu directement sur des systèmes aux ressources limitées (Edge AI), là où le silicium seul échoue aujourd’hui.


Référence de la publication 
Z. Wang, K. Müller, et al. Streamlined optical training of large-scale modern deep learning architectures with direct feedback alignment. Soumis et accepté à Proceedings of the National Academy of Sciences (PNAS). Preprint : arXiv:2409.12965.
https://www.pnas.org/doi/10.1073/pnas.2532022123

À lire aussi