AI is maths: cuando el modelo ya conoce la física

La inteligencia artificial suele describirse como el aprendizaje de un modelo a partir de datos. Es una familia importante de enfoques, no una definición universal de inteligencia. En meteorología, oceanografía, sistemas energéticos, procesos industriales y muchos otros dominios físicos, ya contamos con ecuaciones, leyes de conservación, condiciones de frontera y décadas de conocimiento científico. El verdadero reto suele ser combinar ese conocimiento con observaciones escasas, ruidosas e incompletas.

No es un argumento contra el aprendizaje automático. Es un argumento a favor de elegir qué necesita aprenderse realmente.

01 Un pronóstico puede obedecer todas las ecuaciones y aun así partir del mundo equivocado

Un modelo dinámico describe cómo evoluciona un sistema a partir de un estado inicial. Si ese estado inicial es incorrecto, el modelo puede resolver sus ecuaciones a la perfección y producir la trayectoria equivocada. En sistemas no lineales, como la atmósfera o el océano, pequeños errores en el estado de partida pueden crecer rápidamente.

Las observaciones no resuelven el problema por sí solas. Satélites, boyas, radares y sensores miden solo ciertas variables, en lugares y momentos determinados, y con incertidumbre. El estado completo del modelo puede contener millones de valores; el vector de observación suele ser mucho más pequeño.

ModeloCoherente, pero con una inicialización imperfecta

Las ecuaciones codifican estructura y consistencia física, pero el estado inicial y los parámetros pueden ser inciertos.

DatosReales, pero parciales y ruidosos

Las mediciones anclan el modelo en la realidad, pero no describen todas las variables ni cada punto del espacio y del tiempo.

Problema inversoReconstruir lo que no puede observarse directamente

Inferir la condición inicial, los parámetros o la trayectoria ocultos que mejor explican la evidencia sin dejar de respetar el modelo.

La asimilación de datos es el campo matemático situado en esa interfaz. No pide que los datos sustituyan al modelo ni que el modelo ignore los datos. Busca el estado que haga a ambos tan compatibles como sea posible.

02 Asimilación de datos: hacer que el modelo escuche las observaciones sin olvidar la física

Una forma útil de entender la asimilación es como una negociación controlada. El modelo aporta la dinámica: qué evoluciones son físicamente posibles. Las observaciones aportan la corrección: dónde se aparta de la realidad la trayectoria simulada. Los supuestos estadísticos y la regularización determinan cuánto debe confiarse en cada fuente.

Un pequeño laboratorio de asimilación

Esta ilustración, deliberadamente sencilla, combina una trayectoria del modelo con observaciones. El análisis en tono verde azulado cambia conforme varía la confianza supuesta en las observaciones. La asimilación de datos real utiliza estructuras de covarianza, restricciones dinámicas y métodos de optimización más ricos.

Confianza relativa en las observaciones: 55%

confiar más en el modeloconfiar más en las observaciones

modelo observación análisis asimilado

Lo importante no es el promedio ponderado de esta demostración simplificada, sino el principio: el análisis se construye tanto a partir del conocimiento como de la evidencia. Un buen método de asimilación debe respetar la evolución temporal del modelo, considerar el error de observación y seguir siendo computacionalmente viable a la escala del sistema.

03 La optimización conecta lo que sabemos con lo que observamos

La asimilación variacional de datos convierte la reconstrucción en un problema de optimización. Una función de costo mide la discrepancia entre la trayectoria del modelo y las observaciones, y después incorpora información previa o regularización. El estado inicial y los parámetros desconocidos se ajustan hasta reducir ese costo.

Objetivo conceptual de 4D-Var

J(x₀, θ) = observation mismatch + background mismatch + parameter regularisation

Los detalles matemáticos determinan cómo se ponderan los errores y cómo se propaga la incertidumbre. La idea central es una búsqueda con restricciones de la trayectoria más consistente tanto con las ecuaciones como con las mediciones.

Modelo directo

Simular el sistema a partir de la estimación actual del estado inicial.

Información adjunta o de sensibilidad

Determinar cómo cambia la discrepancia cuando se modifican las incógnitas.

Paso de optimización

Actualizar la estimación, ejecutar de nuevo y continuar hasta alcanzar una solución aceptable.

Por eso la optimización continua, los problemas inversos y la asimilación de datos deben formar parte de un mismo plan de estudios de IA. La máquina no se limita a ajustar una curva. Resuelve un problema estructurado con restricciones, un presupuesto computacional y una definición de lo que cuenta como respuesta admisible.

04 Back and Forth Nudging: corregir, invertir, repetir

Jacques Blum y Didier Auroux introdujeron el algoritmo Back and Forth Nudging en 2005. El nudging estándar añade un término de retroalimentación a las ecuaciones del modelo para acercar el estado simulado a las observaciones. Su aporte clave fue aplicar la corrección tanto hacia adelante como hacia atrás dentro de la misma ventana de asimilación.

1Integrar hacia adelante

Partir de la estimación actual e integrar el modelo físico mientras el nudging acerca su trayectoria a las observaciones.

2Integrar hacia atrás

Usar el estado final corregido para integrar hacia atrás en la misma ventana, con un término de retroalimentación del signo adecuado.

3Actualizar y repetir

El estado reconstruido al inicio se convierte en la siguiente estimación inicial. Se repite el proceso hasta que la trayectoria reconstruida se estabiliza.

El primer artículo demostró la convergencia para un sistema lineal. También mostró el atractivo práctico del método: su formulación central no requiere la linealización del modelo, la construcción de un adjunto ni el proceso de minimización separado que utiliza 4D-Var. Trabajos posteriores desarrollaron la teoría y probaron el enfoque en sistemas de Lorenz, ecuaciones de transporte, modelos de aguas someras y modelos oceánicos.

Familia de métodos	Mecanismo central	Fortaleza	Reto de ingeniería
4D-Var	Minimizar un costo en una ventana temporal.	Formulación variacional estructurada de manera global.	El desarrollo del adjunto y las integraciones repetidas del modelo pueden ser exigentes.
Filtros de Kalman / de ensamble	Alternar pronóstico y corrección estadística.	Tratamiento explícito de la evolución de la incertidumbre.	La propagación de covarianzas o los ensambles grandes pueden ser costosos.
BFN / DBFN	Alternar observadores hacia adelante y hacia atrás.	Retroalimentación directa, implementación comparativamente ligera y convergencia rápida en los escenarios estudiados.	La estabilidad hacia atrás, la selección de ganancias y la adecuación del modelo siguen requiriendo cuidado matemático.

La extensión Diffusive Back and Forth Nudging fue diseñada para determinados modelos difusivos. En experimentos con un modelo bidimensional de aguas someras y un modelo oceánico tridimensional de ecuaciones primitivas, estabilizó la integración hacia atrás y redujo el impacto de las observaciones ruidosas. Es un resultado de investigación, no una afirmación de que un algoritmo sustituya a todos los demás métodos.

La postura científica madura: los métodos se eligen según la estructura del modelo, el sistema de observación, la incertidumbre y las restricciones computacionales. “Usar IA” todavía no es una especificación de método.

05 Dos trayectorias de investigación, una cultura común de matemáticas aplicadas

La colaboración es especialmente sólida porque forma parte de trayectorias de investigación mucho más amplias. El mismo lenguaje matemático —ecuaciones diferenciales parciales, control, optimización, análisis numérico y problemas inversos— viaja desde la física de plasmas hasta la circulación oceánica, el procesamiento de imágenes, el pronóstico meteorológico y el modelado industrial.

Profesor · análisis numérico, control y asimilación de datos

Pr Jacques Blum

Después de estudiar en la École normale supérieure y realizar un doctorado bajo la dirección de Jacques-Louis Lions, además de investigar en el CNRS y ocupar cátedras en Grenoble, la École Polytechnique y Niza, Jacques Blum construyó una carrera centrada en la simulación, identificación y control óptimo de sistemas físicos regidos por ecuaciones diferenciales parciales.

Su trabajo abarca el equilibrio de plasmas en tokamaks, la reconstrucción en tiempo real, la circulación oceánica y la asimilación de datos. Incluso la versión de 2017 de su CV refleja una trayectoria de investigación y docencia de amplitud excepcional. En DSTI es miembro del Consejo Científico y ayudó a definir el enfoque de la escuela para brindar apoyo matemático a todo el estudiantado.

1984Medalla de Bronce del CNRS

1990Prix Blaise-Pascal

1998Premio Seymour Cray

2017Grand Prix de la Ville de Nice

Página universitaria Biografía Cuerpo docente de DSTI

Profesor · director de la Maison de la Modélisation, de la Simulation et des Interactions

Pr Didier Auroux

Didier Auroux se formó en la École normale supérieure de Lyon, obtuvo un doctorado sobre asimilación de datos para problemas ambientales y una habilitación sobre algoritmos rápidos para procesamiento de imágenes y asimilación de datos. Su investigación reúne geofísica, observadores, control óptimo, problemas inversos, análisis numérico y cómputo científico.

Actualmente dirige la Maison de la Modélisation, de la Simulation et des Interactions, una estructura que apoya la investigación mediante modelado, simulación, cómputo de alto rendimiento y ciencia de datos.

Página universitaria Publicaciones MSI Cuerpo docente de DSTI

06 La excelencia cobra sentido cuando el estudiantado puede alcanzarla

En DSTI, llevar matemáticos destacados al aula no tiene como objetivo adornar una lista de docentes. Se busca que el estudiantado conozca los hábitos de pensamiento detrás de un modelado riguroso: definir el estado, explicitar los supuestos, formular el objetivo, identificar qué es observable y comprender las consecuencias numéricas.

Warm UpFundamentals of Mathematics

Jacques Blum enseña los fundamentos matemáticos durante el Warm Up de cada MSc de datos de DSTI, con grupos cuya preparación matemática previa puede variar considerablemente.

Todos los MSc de datosMathematics for Data Science

Jacques Blum y Didier Auroux enseñan juntos el lenguaje matemático necesario para razonar sobre ciencia de datos, no solo para operar sus herramientas.

MSc Data Science & AIContinuous Optimisation

El estudiantado aprende cómo los objetivos, gradientes, restricciones y algoritmos convierten un problema matemático en una solución computable.

A lo largo del plan de estudiosSupport Sessions

Jacques propuso crear las Support Sessions de DSTI, inspiradas en las recitation classes de las universidades de la Ivy League y de las principales universidades de California. Didier dirige regularmente sesiones de apoyo para módulos con fuerte contenido matemático. El nivel es alto y el estudiantado recibe enseñanza estructurada adicional para ayudarle a alcanzarlo.

MSc Data Science & AIInverse Problems & Data Assimilation

Su campo de investigación entra directamente al plan de estudios: reconstruir estados y parámetros ocultos a partir de modelos y observaciones incompletas. Explorar el plan de estudios.

BSc Computer Science & EngineeringMathematics Harmonisation

Didier imparte Mathematics Harmonisation con la Dra Christine Malot, ayudando al estudiantado a establecer una base matemática común antes de avanzar hacia trabajos cuantitativos posteriores. Explorar el plan de estudios.

BSc Computer Science & EngineeringEnergy – Climate – Sustainable IT

Jacques imparte el componente de física, conectando el cómputo con los sistemas físicos, los límites energéticos y las cuestiones ambientales en las que influye. Explorar el plan de estudios.

Jacques y Didier tienen un compromiso especial con enseñar a todo el estudiantado, incluyendo a quienes se encuentran lejos de su propio nivel de investigación. Eso importa. La confianza matemática no se construye bajando el techo intelectual, sino creando una ruta confiable para alcanzarlo.

07 La posición de DSTI: inteligencia híbrida antes que uniformidad dictada por las modas

No obligues al sistema de aprendizaje a redescubrir lo que el dominio ya sabe.

Cuando existan leyes físicas, restricciones, taxonomías o relaciones confiables, represéntalas. Usa el aprendizaje basado en datos para la incertidumbre residual, los parámetros desconocidos, las escalas no resueltas y los patrones que el modelo explícito no puede aportar. La inteligencia está en la combinación.

01Respetar la estructura conocida

Las leyes de conservación, las ecuaciones diferenciales, las restricciones causales y el conocimiento del dominio son información. Descartarlos no es neutralidad: es una decisión de diseño.

02Aprender la parte desconocida

Los datos son invaluables cuando los parámetros son inciertos, los modelos están incompletos, los efectos submalla no se resuelven o los patrones no pueden especificarse analíticamente.

03Optimizar la interfaz

El trabajo difícil consiste en decidir cómo interactúan el error del modelo, el error de observación y los componentes aprendidos, y en validar el sistema resultante.

Sistemas físicos

Asimilación de datos

Combinar un modelo dinámico con observaciones para que el estado reconstruido respete tanto la evidencia como las leyes que gobiernan la evolución.

Sistemas de conocimiento

Web semántica

Representar de manera explícita las entidades y relaciones conocidas, en vez de pedir que cada sistema posterior las infiera una y otra vez a partir de datos no estructurados.

La analogía es un principio de ingeniería, no una afirmación de que las matemáticas sean idénticas. En ambos casos, el conocimiento explícito y el aprendizaje son complementarios. La enseñanza de tecnologías de la Web semántica de Pr Fabien Gandon y el trabajo de Jacques Blum y Didier Auroux sobre asimilación de datos apuntan hacia la misma disciplina educativa: saber qué sabes, aprender lo que no sabes y hacer que la frontera sea verificable.

Esto también cambia la forma de enseñar la eficiencia. Un método más pequeño y estructurado puede ser preferible a un sistema de aprendizaje genérico más grande: menos movimiento de datos, menos entrenamiento, mayor consistencia física y una explicación más clara de las fallas. A veces el modelo aprendido es la respuesta correcta. A veces es un componente dentro de un sistema matemático más amplio.

08 La trayectoria de investigación detrás de las clases

El artículo se apoya en una secuencia de publicaciones que recorre el trabajo desde la introducción de un algoritmo y la demostración de su convergencia hasta la comparación numérica, el desarrollo teórico y las aplicaciones geofísicas.

Back and forth nudging algorithm for data assimilation problems

Didier Auroux & Jacques Blum · C. R. Acad. Sci. Paris, 2005

La nota fundacional introduce BFN y demuestra su convergencia para un sistema lineal de ecuaciones diferenciales ordinarias.

DOI

A nudging-based data assimilation method: the Back and Forth Nudging algorithm

Didier Auroux & Jacques Blum · Nonlinear Processes in Geophysics, 2008

Un desarrollo más completo y un estudio numérico del método en asimilación de datos oceanográficos.

Leer el artículo

Diffusive Back and Forth Nudging algorithm for data assimilation

Didier Auroux, Jacques Blum & Maëlle Nodet · C. R. Mathématique, 2011

Una extensión diseñada para gestionar la difusión durante la integración hacia atrás.

DOI

Data Assimilation for Geophysical Fluids: The Diffusive Back and Forth Nudging

Didier Auroux, Jacques Blum & Giovanni Ruggiero · Mathematical Paradigms of Climate Science, 2016

Pruebas en modelos de aguas someras y modelos oceánicos completos, incluyendo el comportamiento del método ante ruido en las observaciones.

Capítulo de libro

La idea que el estudiantado debe retener

La IA no es una sola clase de modelos. Es la construcción disciplinada de sistemas que infieren, optimizan y actúan bajo incertidumbre. A veces los datos deben aprender el modelo. A veces deben corregirlo. Saber distinguir ambas situaciones forma parte de formarse como profesional de la ingeniería con una comprensión sólida de los fundamentos científicos.