L’intelligence artificielle est souvent décrite comme l’apprentissage d’un modèle à partir de données. Il s’agit d’une grande famille d’approches, mais non d’une définition universelle de l’intelligence. En météorologie, en océanographie, dans les systèmes énergétiques, les procédés industriels et de nombreux autres domaines physiques, nous disposons déjà d’équations, de lois de conservation, de conditions aux limites et de décennies de connaissances scientifiques. Le véritable défi consiste souvent à combiner ces connaissances à des observations rares, bruitées et incomplètes.
01 Une prévision peut respecter toutes les équations et pourtant partir d’un monde erroné
Un modèle dynamique décrit l’évolution d’un système à partir d’un état initial. Si cet état initial est erroné, le modèle peut résoudre parfaitement ses équations tout en produisant une trajectoire incorrecte. Dans les systèmes non linéaires comme l’atmosphère ou l’océan, de faibles erreurs dans l’état de départ peuvent croître rapidement.
Les observations ne résolvent pas le problème à elles seules. Satellites, bouées, radars et capteurs ne mesurent que certaines variables, en certains lieux et à certains moments, avec une part d’incertitude. L’état complet du modèle peut contenir des millions de valeurs ; le vecteur d’observation est généralement bien plus petit.
Les équations encodent la structure et la cohérence physique, mais l’état initial et les paramètres peuvent être incertains.
Les mesures ancrent le modèle dans la réalité, mais elles ne décrivent ni toutes les variables ni chaque point de l’espace et du temps.
Inférer la condition initiale, les paramètres ou la trajectoire cachés qui expliquent le mieux les observations tout en respectant le modèle.
L’assimilation de données est le domaine mathématique situé à cette interface. Elle ne demande ni aux données de remplacer le modèle ni au modèle d’ignorer les données. Elle recherche l’état qui rend les deux aussi compatibles que possible.
02 Assimilation de données : faire écouter les observations au modèle sans lui faire oublier la physique
Une manière utile de comprendre l’assimilation consiste à la voir comme une négociation contrôlée. Le modèle apporte la dynamique : quelles évolutions sont physiquement possibles. Les observations apportent la correction : où la trajectoire simulée s’écarte de la réalité. Les hypothèses statistiques et la régularisation déterminent le degré de confiance accordé à chaque source.
Un petit laboratoire d’assimilation
Cette illustration volontairement simple combine une trajectoire de modèle avec des observations. L’analyse en bleu-vert évolue lorsque la confiance supposée dans les observations change. L’assimilation de données réelle utilise des structures de covariance, des contraintes dynamiques et des méthodes d’optimisation plus riches.
L’essentiel n’est pas la moyenne pondérée de cette démonstration simplifiée, mais le principe : l’analyse est construite à partir des connaissances et des observations. Une bonne méthode d’assimilation doit respecter l’évolution temporelle du modèle, tenir compte de l’erreur d’observation et rester calculable à l’échelle du système.
03 L’optimisation relie ce que nous savons à ce que nous observons
L’assimilation variationnelle transforme la reconstruction en problème d’optimisation. Une fonction de coût mesure l’écart entre la trajectoire du modèle et les observations, puis ajoute une information a priori ou une régularisation. L’état initial et les paramètres inconnus sont ajustés jusqu’à réduire ce coût.
Les détails mathématiques déterminent la pondération des erreurs et la propagation de l’incertitude. L’idée centrale est une recherche sous contraintes de la trajectoire la plus cohérente à la fois avec les équations et avec les mesures.
Simuler le système à partir de l’estimation actuelle de l’état initial.
Déterminer comment la modification des inconnues fait évoluer l’écart.
Mettre à jour l’estimation, relancer le calcul et poursuivre jusqu’à obtenir une solution acceptable.
C’est pourquoi l’optimisation continue, les problèmes inverses et l’assimilation de données ont toute leur place ensemble dans un cursus d’IA. La machine ne se contente pas d’ajuster une courbe. Elle résout un problème structuré sous contraintes, avec un budget de calcul et une définition de ce qui constitue une réponse admissible.
04 Back and Forth Nudging : corriger, inverser, recommencer
Jacques Blum et Didier Auroux ont introduit l’algorithme Back and Forth Nudging en 2005. Le nudging standard ajoute un terme de rétroaction aux équations du modèle afin de rapprocher l’état simulé des observations. Leur idée déterminante fut d’appliquer la correction à la fois vers l’avant et vers l’arrière sur une même fenêtre d’assimilation.
Partir de l’estimation actuelle et intégrer le modèle physique en rapprochant sa trajectoire des observations par nudging.
Utiliser l’état final corrigé pour intégrer en sens inverse sur la même fenêtre, avec un terme de rétroaction de signe approprié.
L’état reconstruit au début devient la nouvelle estimation initiale. Répéter jusqu’à stabilisation de la trajectoire reconstruite.
Le premier article a démontré la convergence pour un système linéaire. Il a également montré l’intérêt pratique de la méthode : sa formulation centrale ne nécessite ni linéarisation du modèle, ni construction d’un adjoint, ni processus de minimisation distinct comme dans 4D-Var. Des travaux ultérieurs ont développé la théorie et testé l’approche sur des systèmes de Lorenz, des équations de transport, des modèles d’eau peu profonde et des modèles océaniques.
| Famille de méthodes | Mécanisme central | Atout | Défi d’ingénierie |
|---|---|---|---|
| 4D-Var | Minimiser un coût sur une fenêtre temporelle. | Formulation variationnelle structurée globalement. | Le développement de l’adjoint et les intégrations répétées du modèle peuvent être exigeants. |
| Filtres de Kalman / d’ensemble | Alterner prévision et correction statistique. | Traitement explicite de l’évolution de l’incertitude. | La propagation des covariances ou de grands ensembles peut être coûteuse. |
| BFN / DBFN | Alterner observateurs vers l’avant et vers l’arrière. | Rétroaction directe, mise en œuvre comparativement légère et convergence rapide dans les configurations étudiées. | La stabilité vers l’arrière, le choix des gains et l’adéquation du modèle exigent toujours une attention mathématique. |
L’extension Diffusive Back and Forth Nudging a été conçue pour certains modèles diffusifs. Lors d’expériences sur un modèle d’eau peu profonde bidimensionnel et un modèle océanique tridimensionnel aux équations primitives, elle a stabilisé l’intégration vers l’arrière et réduit l’impact des observations bruitées. Il s’agit d’un résultat de recherche, non de l’affirmation qu’un algorithme remplace toutes les autres méthodes.
05 Deux parcours de recherche, une même culture des mathématiques appliquées
Cette collaboration est particulièrement féconde parce qu’elle s’inscrit dans des parcours de recherche bien plus vastes. Le même langage mathématique — équations aux dérivées partielles, contrôle, optimisation, analyse numérique et problèmes inverses — circule de la physique des plasmas à la circulation océanique, au traitement d’images, à la prévision météorologique et à la modélisation industrielle.

Pr Jacques Blum
Après l’École normale supérieure et un doctorat sous la direction de Jacques-Louis Lions, puis des recherches au CNRS et des postes de professeur à Grenoble, à l’École Polytechnique et à Nice, Jacques Blum a construit sa carrière autour de la simulation, de l’identification et du contrôle optimal de systèmes physiques gouvernés par des équations aux dérivées partielles.
Ses travaux couvrent l’équilibre des plasmas de tokamak, la reconstruction en temps réel, la circulation océanique et l’assimilation de données. La version 2017 de son CV témoigne déjà d’un parcours de recherche et d’enseignement d’une ampleur remarquable. À DSTI, il est membre du Conseil scientifique et a contribué à définir l’approche de l’école en matière d’accompagnement mathématique de l’ensemble des étudiants.
Pr Didier Auroux
Didier Auroux a été formé à l’École normale supérieure de Lyon, a réalisé une thèse sur l’assimilation de données pour des problèmes environnementaux, puis une habilitation sur les algorithmes rapides pour le traitement d’images et l’assimilation de données. Ses recherches réunissent géophysique, observateurs, contrôle optimal, problèmes inverses, analyse numérique et calcul scientifique.
Il dirige aujourd’hui la Maison de la Modélisation, de la Simulation et des Interactions, une structure qui soutient la recherche par la modélisation, la simulation, le calcul haute performance et la science des données.
06 L’excellence prend tout son sens lorsque les étudiants peuvent l’atteindre
À DSTI, faire intervenir des mathématiciens de premier plan ne sert pas à embellir une liste d’enseignants. Il s’agit de permettre aux étudiants de rencontrer les habitudes de pensée qui fondent une modélisation rigoureuse : définir l’état, expliciter les hypothèses, formuler l’objectif, identifier ce qui est observable et comprendre les conséquences numériques.
Jacques Blum enseigne les fondements mathématiques pendant le Warm Up de chaque MSc data de DSTI, auprès de promotions dont la préparation mathématique antérieure peut être très diverse.
Jacques Blum et Didier Auroux enseignent ensemble le langage mathématique nécessaire pour raisonner en science des données, au-delà de la simple utilisation de ses outils.
Les étudiants apprennent comment objectifs, gradients, contraintes et algorithmes transforment un problème mathématique en solution calculable.
Jacques a proposé la création des Support Sessions de DSTI, dans l’esprit des recitation classes pratiquées dans les universités de l’Ivy League et les grandes universités californiennes. Didier anime régulièrement des sessions de soutien pour les modules à forte composante mathématique. Le niveau attendu est élevé, et un enseignement structuré supplémentaire aide les étudiants à l’atteindre.
Leur domaine de recherche entre directement dans le cursus : reconstruire des états et paramètres cachés à partir de modèles et d’observations incomplètes. Découvrir le programme.
Didier enseigne Mathematics Harmonisation avec Dr Christine Malot, afin d’aider les étudiants à établir un socle mathématique commun avant d’aborder des travaux quantitatifs plus avancés. Découvrir le programme.
Jacques enseigne la composante physique, reliant le calcul aux systèmes physiques, aux limites énergétiques et aux enjeux environnementaux qu’il influence. Découvrir le programme.
Jacques et Didier tiennent particulièrement à enseigner à l’ensemble des étudiants, y compris à ceux qui se trouvent loin de leur propre niveau de recherche. C’est essentiel. La confiance en mathématiques ne se construit pas en abaissant le plafond intellectuel, mais en aménageant une voie fiable pour l’atteindre.
07 La position de DSTI : l’intelligence hybride plutôt que l’uniformité dictée par les modes
Ne contraignez pas l’apprenant à redécouvrir ce que le domaine sait déjà.
Lorsque des lois physiques, contraintes, taxonomies ou relations fiables existent, représentez-les. Réservez l’apprentissage à partir des données à l’incertitude résiduelle, aux paramètres inconnus, aux échelles non résolues et aux motifs que le modèle explicite ne peut fournir. L’intelligence réside dans la combinaison.
Les lois de conservation, les équations différentielles, les contraintes causales et les connaissances du domaine sont de l’information. Les écarter n’est pas neutre : c’est un choix de conception.
Les données sont précieuses lorsque les paramètres sont incertains, les modèles incomplets, les effets sous-maille non résolus ou les motifs impossibles à spécifier analytiquement.
Le travail difficile consiste à décider comment interagissent l’erreur du modèle, l’erreur d’observation et les composantes apprises, puis à valider le système obtenu.
Assimilation de données
Combiner un modèle dynamique aux observations afin que l’état reconstruit respecte à la fois les données disponibles et les lois qui gouvernent l’évolution.
Web sémantique
Représenter explicitement les entités et relations connues plutôt que de demander à chaque système en aval de les inférer de nouveau à partir de données non structurées.
L’analogie exprime un principe d’ingénierie, non l’affirmation que les mathématiques sont identiques. Dans les deux cas, connaissances explicites et apprentissage sont complémentaires. L’enseignement des technologies du Web sémantique par Pr Fabien Gandon et les travaux de Jacques Blum et Didier Auroux sur l’assimilation de données convergent vers la même discipline pédagogique : savoir ce que l’on sait, apprendre ce que l’on ignore et rendre la frontière vérifiable.
Cela change aussi la manière d’enseigner l’efficacité. Une méthode plus petite et structurée peut parfois être préférable à un grand apprenant générique : moins de mouvements de données, moins d’entraînement, une cohérence physique plus forte et une explication plus claire des échecs. Parfois, le modèle appris est la bonne réponse. Parfois, il n’est qu’une composante d’un système mathématique plus vaste.
08 Le parcours de recherche derrière les enseignements
Cet article s’appuie sur une suite de publications qui retrace les travaux depuis l’introduction d’un algorithme et la preuve de sa convergence jusqu’aux comparaisons numériques, aux développements théoriques et aux applications géophysiques.
La note fondatrice introduit BFN et démontre sa convergence pour un système linéaire d’équations différentielles ordinaires.
Un développement plus complet et une étude numérique de la méthode pour l’assimilation de données océanographiques.
Une extension conçue pour gérer la diffusion lors de l’intégration vers l’arrière.
Des essais sur des modèles d’eau peu profonde et des modèles océaniques complets, notamment sur le comportement de la méthode en présence de bruit d’observation.
Ce que les étudiants doivent retenir
L’IA ne se réduit pas à une seule catégorie de modèles. Elle consiste à construire avec rigueur des systèmes qui infèrent, optimisent et agissent dans l’incertitude. Parfois, les données doivent apprendre le modèle. Parfois, elles doivent le corriger. Savoir distinguer ces situations fait partie du métier d’ingénieur qui comprend les fondements scientifiques.