AI is maths : quand le modèle connaît déjà la physique

L’intelligence artificielle est souvent décrite comme l’apprentissage d’un modèle à partir de données. Il s’agit d’une grande famille d’approches, mais non d’une définition universelle de l’intelligence. En météorologie, en océanographie, dans les systèmes énergétiques, les procédés industriels et de nombreux autres domaines physiques, nous disposons déjà d’équations, de lois de conservation, de conditions aux limites et de décennies de connaissances scientifiques. Le véritable défi consiste souvent à combiner ces connaissances à des observations rares, bruitées et incomplètes.

Il ne s’agit pas d’un argument contre l’apprentissage automatique, mais d’un appel à choisir ce qui doit réellement être appris.

01 Une prévision peut respecter toutes les équations et pourtant partir d’un monde erroné

Un modèle dynamique décrit l’évolution d’un système à partir d’un état initial. Si cet état initial est erroné, le modèle peut résoudre parfaitement ses équations tout en produisant une trajectoire incorrecte. Dans les systèmes non linéaires comme l’atmosphère ou l’océan, de faibles erreurs dans l’état de départ peuvent croître rapidement.

Les observations ne résolvent pas le problème à elles seules. Satellites, bouées, radars et capteurs ne mesurent que certaines variables, en certains lieux et à certains moments, avec une part d’incertitude. L’état complet du modèle peut contenir des millions de valeurs ; le vecteur d’observation est généralement bien plus petit.

ModèleCohérent, mais imparfaitement initialisé

Les équations encodent la structure et la cohérence physique, mais l’état initial et les paramètres peuvent être incertains.

DonnéesRéelles, mais partielles et bruitées

Les mesures ancrent le modèle dans la réalité, mais elles ne décrivent ni toutes les variables ni chaque point de l’espace et du temps.

Problème inverseReconstruire ce qui ne peut pas être observé directement

Inférer la condition initiale, les paramètres ou la trajectoire cachés qui expliquent le mieux les observations tout en respectant le modèle.

L’assimilation de données est le domaine mathématique situé à cette interface. Elle ne demande ni aux données de remplacer le modèle ni au modèle d’ignorer les données. Elle recherche l’état qui rend les deux aussi compatibles que possible.

02 Assimilation de données : faire écouter les observations au modèle sans lui faire oublier la physique

Une manière utile de comprendre l’assimilation consiste à la voir comme une négociation contrôlée. Le modèle apporte la dynamique : quelles évolutions sont physiquement possibles. Les observations apportent la correction : où la trajectoire simulée s’écarte de la réalité. Les hypothèses statistiques et la régularisation déterminent le degré de confiance accordé à chaque source.

Un petit laboratoire d’assimilation

Cette illustration volontairement simple combine une trajectoire de modèle avec des observations. L’analyse en bleu-vert évolue lorsque la confiance supposée dans les observations change. L’assimilation de données réelle utilise des structures de covariance, des contraintes dynamiques et des méthodes d’optimisation plus riches.

Confiance relative dans les observations : 55%

faire davantage confiance au modèlefaire davantage confiance aux observations

modèle observation analyse assimilée

L’essentiel n’est pas la moyenne pondérée de cette démonstration simplifiée, mais le principe : l’analyse est construite à partir des connaissances et des observations. Une bonne méthode d’assimilation doit respecter l’évolution temporelle du modèle, tenir compte de l’erreur d’observation et rester calculable à l’échelle du système.

03 L’optimisation relie ce que nous savons à ce que nous observons

L’assimilation variationnelle transforme la reconstruction en problème d’optimisation. Une fonction de coût mesure l’écart entre la trajectoire du modèle et les observations, puis ajoute une information a priori ou une régularisation. L’état initial et les paramètres inconnus sont ajustés jusqu’à réduire ce coût.

Objectif conceptuel de 4D-Var

J(x₀, θ) = observation mismatch + background mismatch + parameter regularisation

Les détails mathématiques déterminent la pondération des erreurs et la propagation de l’incertitude. L’idée centrale est une recherche sous contraintes de la trajectoire la plus cohérente à la fois avec les équations et avec les mesures.

Modèle direct

Simuler le système à partir de l’estimation actuelle de l’état initial.

Information adjointe ou de sensibilité

Déterminer comment la modification des inconnues fait évoluer l’écart.

Étape d’optimisation

Mettre à jour l’estimation, relancer le calcul et poursuivre jusqu’à obtenir une solution acceptable.

C’est pourquoi l’optimisation continue, les problèmes inverses et l’assimilation de données ont toute leur place ensemble dans un cursus d’IA. La machine ne se contente pas d’ajuster une courbe. Elle résout un problème structuré sous contraintes, avec un budget de calcul et une définition de ce qui constitue une réponse admissible.

04 Back and Forth Nudging : corriger, inverser, recommencer

Jacques Blum et Didier Auroux ont introduit l’algorithme Back and Forth Nudging en 2005. Le nudging standard ajoute un terme de rétroaction aux équations du modèle afin de rapprocher l’état simulé des observations. Leur idée déterminante fut d’appliquer la correction à la fois vers l’avant et vers l’arrière sur une même fenêtre d’assimilation.

1Intégrer vers l’avant

Partir de l’estimation actuelle et intégrer le modèle physique en rapprochant sa trajectoire des observations par nudging.

2Intégrer vers l’arrière

Utiliser l’état final corrigé pour intégrer en sens inverse sur la même fenêtre, avec un terme de rétroaction de signe approprié.

3Mettre à jour et recommencer

L’état reconstruit au début devient la nouvelle estimation initiale. Répéter jusqu’à stabilisation de la trajectoire reconstruite.

Le premier article a démontré la convergence pour un système linéaire. Il a également montré l’intérêt pratique de la méthode : sa formulation centrale ne nécessite ni linéarisation du modèle, ni construction d’un adjoint, ni processus de minimisation distinct comme dans 4D-Var. Des travaux ultérieurs ont développé la théorie et testé l’approche sur des systèmes de Lorenz, des équations de transport, des modèles d’eau peu profonde et des modèles océaniques.

Famille de méthodes	Mécanisme central	Atout	Défi d’ingénierie
4D-Var	Minimiser un coût sur une fenêtre temporelle.	Formulation variationnelle structurée globalement.	Le développement de l’adjoint et les intégrations répétées du modèle peuvent être exigeants.
Filtres de Kalman / d’ensemble	Alterner prévision et correction statistique.	Traitement explicite de l’évolution de l’incertitude.	La propagation des covariances ou de grands ensembles peut être coûteuse.
BFN / DBFN	Alterner observateurs vers l’avant et vers l’arrière.	Rétroaction directe, mise en œuvre comparativement légère et convergence rapide dans les configurations étudiées.	La stabilité vers l’arrière, le choix des gains et l’adéquation du modèle exigent toujours une attention mathématique.

L’extension Diffusive Back and Forth Nudging a été conçue pour certains modèles diffusifs. Lors d’expériences sur un modèle d’eau peu profonde bidimensionnel et un modèle océanique tridimensionnel aux équations primitives, elle a stabilisé l’intégration vers l’arrière et réduit l’impact des observations bruitées. Il s’agit d’un résultat de recherche, non de l’affirmation qu’un algorithme remplace toutes les autres méthodes.

La position scientifique mûrement établie : les méthodes sont choisies selon la structure du modèle, le système d’observation, l’incertitude et les contraintes de calcul. « Utiliser l’IA » ne constitue pas encore une spécification de méthode.

05 Deux parcours de recherche, une même culture des mathématiques appliquées

Cette collaboration est particulièrement féconde parce qu’elle s’inscrit dans des parcours de recherche bien plus vastes. Le même langage mathématique — équations aux dérivées partielles, contrôle, optimisation, analyse numérique et problèmes inverses — circule de la physique des plasmas à la circulation océanique, au traitement d’images, à la prévision météorologique et à la modélisation industrielle.

Professeur · analyse numérique, contrôle et assimilation de données

Pr Jacques Blum

Après l’École normale supérieure et un doctorat sous la direction de Jacques-Louis Lions, puis des recherches au CNRS et des postes de professeur à Grenoble, à l’École Polytechnique et à Nice, Jacques Blum a construit sa carrière autour de la simulation, de l’identification et du contrôle optimal de systèmes physiques gouvernés par des équations aux dérivées partielles.

Ses travaux couvrent l’équilibre des plasmas de tokamak, la reconstruction en temps réel, la circulation océanique et l’assimilation de données. La version 2017 de son CV témoigne déjà d’un parcours de recherche et d’enseignement d’une ampleur remarquable. À DSTI, il est membre du Conseil scientifique et a contribué à définir l’approche de l’école en matière d’accompagnement mathématique de l’ensemble des étudiants.

1984Médaille de bronze du CNRS

1990Prix Blaise-Pascal

1998Prix Seymour Cray

2017Grand Prix de la Ville de Nice

Page universitaire Biographie Corps enseignant de DSTI

Professeur · directeur de la Maison de la Modélisation, de la Simulation et des Interactions

Pr Didier Auroux

Didier Auroux a été formé à l’École normale supérieure de Lyon, a réalisé une thèse sur l’assimilation de données pour des problèmes environnementaux, puis une habilitation sur les algorithmes rapides pour le traitement d’images et l’assimilation de données. Ses recherches réunissent géophysique, observateurs, contrôle optimal, problèmes inverses, analyse numérique et calcul scientifique.

Il dirige aujourd’hui la Maison de la Modélisation, de la Simulation et des Interactions, une structure qui soutient la recherche par la modélisation, la simulation, le calcul haute performance et la science des données.

Page universitaire Publications MSI Corps enseignant de DSTI

06 L’excellence prend tout son sens lorsque les étudiants peuvent l’atteindre

À DSTI, faire intervenir des mathématiciens de premier plan ne sert pas à embellir une liste d’enseignants. Il s’agit de permettre aux étudiants de rencontrer les habitudes de pensée qui fondent une modélisation rigoureuse : définir l’état, expliciter les hypothèses, formuler l’objectif, identifier ce qui est observable et comprendre les conséquences numériques.

Warm UpFundamentals of Mathematics

Jacques Blum enseigne les fondements mathématiques pendant le Warm Up de chaque MSc data de DSTI, auprès de promotions dont la préparation mathématique antérieure peut être très diverse.

Tous les MSc dataMathematics for Data Science

Jacques Blum et Didier Auroux enseignent ensemble le langage mathématique nécessaire pour raisonner en science des données, au-delà de la simple utilisation de ses outils.

MSc Data Science & AIContinuous Optimisation

Les étudiants apprennent comment objectifs, gradients, contraintes et algorithmes transforment un problème mathématique en solution calculable.

Dans l’ensemble du cursusSupport Sessions

Jacques a proposé la création des Support Sessions de DSTI, dans l’esprit des recitation classes pratiquées dans les universités de l’Ivy League et les grandes universités californiennes. Didier anime régulièrement des sessions de soutien pour les modules à forte composante mathématique. Le niveau attendu est élevé, et un enseignement structuré supplémentaire aide les étudiants à l’atteindre.

MSc Data Science & AIInverse Problems & Data Assimilation

Leur domaine de recherche entre directement dans le cursus : reconstruire des états et paramètres cachés à partir de modèles et d’observations incomplètes. Découvrir le programme.

BSc Computer Science & EngineeringMathematics Harmonisation

Didier enseigne Mathematics Harmonisation avec Dr Christine Malot, afin d’aider les étudiants à établir un socle mathématique commun avant d’aborder des travaux quantitatifs plus avancés. Découvrir le programme.

BSc Computer Science & EngineeringEnergy – Climate – Sustainable IT

Jacques enseigne la composante physique, reliant le calcul aux systèmes physiques, aux limites énergétiques et aux enjeux environnementaux qu’il influence. Découvrir le programme.

Jacques et Didier tiennent particulièrement à enseigner à l’ensemble des étudiants, y compris à ceux qui se trouvent loin de leur propre niveau de recherche. C’est essentiel. La confiance en mathématiques ne se construit pas en abaissant le plafond intellectuel, mais en aménageant une voie fiable pour l’atteindre.

07 La position de DSTI : l’intelligence hybride plutôt que l’uniformité dictée par les modes

Ne contraignez pas l’apprenant à redécouvrir ce que le domaine sait déjà.

Lorsque des lois physiques, contraintes, taxonomies ou relations fiables existent, représentez-les. Réservez l’apprentissage à partir des données à l’incertitude résiduelle, aux paramètres inconnus, aux échelles non résolues et aux motifs que le modèle explicite ne peut fournir. L’intelligence réside dans la combinaison.

01Respecter la structure connue

Les lois de conservation, les équations différentielles, les contraintes causales et les connaissances du domaine sont de l’information. Les écarter n’est pas neutre : c’est un choix de conception.

02Apprendre la partie inconnue

Les données sont précieuses lorsque les paramètres sont incertains, les modèles incomplets, les effets sous-maille non résolus ou les motifs impossibles à spécifier analytiquement.

03Optimiser l’interface

Le travail difficile consiste à décider comment interagissent l’erreur du modèle, l’erreur d’observation et les composantes apprises, puis à valider le système obtenu.

Systèmes physiques

Assimilation de données

Combiner un modèle dynamique aux observations afin que l’état reconstruit respecte à la fois les données disponibles et les lois qui gouvernent l’évolution.

Systèmes de connaissances

Web sémantique

Représenter explicitement les entités et relations connues plutôt que de demander à chaque système en aval de les inférer de nouveau à partir de données non structurées.

L’analogie exprime un principe d’ingénierie, non l’affirmation que les mathématiques sont identiques. Dans les deux cas, connaissances explicites et apprentissage sont complémentaires. L’enseignement des technologies du Web sémantique par Pr Fabien Gandon et les travaux de Jacques Blum et Didier Auroux sur l’assimilation de données convergent vers la même discipline pédagogique : savoir ce que l’on sait, apprendre ce que l’on ignore et rendre la frontière vérifiable.

Cela change aussi la manière d’enseigner l’efficacité. Une méthode plus petite et structurée peut parfois être préférable à un grand apprenant générique : moins de mouvements de données, moins d’entraînement, une cohérence physique plus forte et une explication plus claire des échecs. Parfois, le modèle appris est la bonne réponse. Parfois, il n’est qu’une composante d’un système mathématique plus vaste.

08 Le parcours de recherche derrière les enseignements

Cet article s’appuie sur une suite de publications qui retrace les travaux depuis l’introduction d’un algorithme et la preuve de sa convergence jusqu’aux comparaisons numériques, aux développements théoriques et aux applications géophysiques.

Back and forth nudging algorithm for data assimilation problems

Didier Auroux & Jacques Blum · C. R. Acad. Sci. Paris, 2005

La note fondatrice introduit BFN et démontre sa convergence pour un système linéaire d’équations différentielles ordinaires.

DOI

A nudging-based data assimilation method: the Back and Forth Nudging algorithm

Didier Auroux & Jacques Blum · Nonlinear Processes in Geophysics, 2008

Un développement plus complet et une étude numérique de la méthode pour l’assimilation de données océanographiques.

Lire l’article

Diffusive Back and Forth Nudging algorithm for data assimilation

Didier Auroux, Jacques Blum & Maëlle Nodet · C. R. Mathématique, 2011

Une extension conçue pour gérer la diffusion lors de l’intégration vers l’arrière.

DOI

Data Assimilation for Geophysical Fluids: The Diffusive Back and Forth Nudging

Didier Auroux, Jacques Blum & Giovanni Ruggiero · Mathematical Paradigms of Climate Science, 2016

Des essais sur des modèles d’eau peu profonde et des modèles océaniques complets, notamment sur le comportement de la méthode en présence de bruit d’observation.

Chapitre de livre

Ce que les étudiants doivent retenir

L’IA ne se réduit pas à une seule catégorie de modèles. Elle consiste à construire avec rigueur des systèmes qui infèrent, optimisent et agissent dans l’incertitude. Parfois, les données doivent apprendre le modèle. Parfois, elles doivent le corriger. Savoir distinguer ces situations fait partie du métier d’ingénieur qui comprend les fondements scientifiques.