La inteligencia artificial suele describirse como el aprendizaje de un modelo a partir de datos. Es una familia importante de enfoques, no una definición universal de inteligencia. En meteorología, oceanografía, sistemas energéticos, procesos industriales y muchos otros dominios físicos, ya contamos con ecuaciones, leyes de conservación, condiciones de frontera y décadas de conocimiento científico. El verdadero reto suele ser combinar ese conocimiento con observaciones escasas, ruidosas e incompletas.
01 Un pronóstico puede obedecer todas las ecuaciones y aun así partir del mundo equivocado
Un modelo dinámico describe cómo evoluciona un sistema a partir de un estado inicial. Si ese estado inicial es incorrecto, el modelo puede resolver sus ecuaciones a la perfección y producir la trayectoria equivocada. En sistemas no lineales, como la atmósfera o el océano, pequeños errores en el estado de partida pueden crecer rápidamente.
Las observaciones no resuelven el problema por sí solas. Satélites, boyas, radares y sensores miden solo ciertas variables, en lugares y momentos determinados, y con incertidumbre. El estado completo del modelo puede contener millones de valores; el vector de observación suele ser mucho más pequeño.
Las ecuaciones codifican estructura y consistencia física, pero el estado inicial y los parámetros pueden ser inciertos.
Las mediciones anclan el modelo en la realidad, pero no describen todas las variables ni cada punto del espacio y del tiempo.
Inferir la condición inicial, los parámetros o la trayectoria ocultos que mejor explican la evidencia sin dejar de respetar el modelo.
La asimilación de datos es el campo matemático situado en esa interfaz. No pide que los datos sustituyan al modelo ni que el modelo ignore los datos. Busca el estado que haga a ambos tan compatibles como sea posible.
02 Asimilación de datos: hacer que el modelo escuche las observaciones sin olvidar la física
Una forma útil de entender la asimilación es como una negociación controlada. El modelo aporta la dinámica: qué evoluciones son físicamente posibles. Las observaciones aportan la corrección: dónde se aparta de la realidad la trayectoria simulada. Los supuestos estadísticos y la regularización determinan cuánto debe confiarse en cada fuente.
Un pequeño laboratorio de asimilación
Esta ilustración, deliberadamente sencilla, combina una trayectoria del modelo con observaciones. El análisis en tono verde azulado cambia conforme varía la confianza supuesta en las observaciones. La asimilación de datos real utiliza estructuras de covarianza, restricciones dinámicas y métodos de optimización más ricos.
Lo importante no es el promedio ponderado de esta demostración simplificada, sino el principio: el análisis se construye tanto a partir del conocimiento como de la evidencia. Un buen método de asimilación debe respetar la evolución temporal del modelo, considerar el error de observación y seguir siendo computacionalmente viable a la escala del sistema.
03 La optimización conecta lo que sabemos con lo que observamos
La asimilación variacional de datos convierte la reconstrucción en un problema de optimización. Una función de costo mide la discrepancia entre la trayectoria del modelo y las observaciones, y después incorpora información previa o regularización. El estado inicial y los parámetros desconocidos se ajustan hasta reducir ese costo.
Los detalles matemáticos determinan cómo se ponderan los errores y cómo se propaga la incertidumbre. La idea central es una búsqueda con restricciones de la trayectoria más consistente tanto con las ecuaciones como con las mediciones.
Simular el sistema a partir de la estimación actual del estado inicial.
Determinar cómo cambia la discrepancia cuando se modifican las incógnitas.
Actualizar la estimación, ejecutar de nuevo y continuar hasta alcanzar una solución aceptable.
Por eso la optimización continua, los problemas inversos y la asimilación de datos deben formar parte de un mismo plan de estudios de IA. La máquina no se limita a ajustar una curva. Resuelve un problema estructurado con restricciones, un presupuesto computacional y una definición de lo que cuenta como respuesta admisible.
04 Back and Forth Nudging: corregir, invertir, repetir
Jacques Blum y Didier Auroux introdujeron el algoritmo Back and Forth Nudging en 2005. El nudging estándar añade un término de retroalimentación a las ecuaciones del modelo para acercar el estado simulado a las observaciones. Su aporte clave fue aplicar la corrección tanto hacia adelante como hacia atrás dentro de la misma ventana de asimilación.
Partir de la estimación actual e integrar el modelo físico mientras el nudging acerca su trayectoria a las observaciones.
Usar el estado final corregido para integrar hacia atrás en la misma ventana, con un término de retroalimentación del signo adecuado.
El estado reconstruido al inicio se convierte en la siguiente estimación inicial. Se repite el proceso hasta que la trayectoria reconstruida se estabiliza.
El primer artículo demostró la convergencia para un sistema lineal. También mostró el atractivo práctico del método: su formulación central no requiere la linealización del modelo, la construcción de un adjunto ni el proceso de minimización separado que utiliza 4D-Var. Trabajos posteriores desarrollaron la teoría y probaron el enfoque en sistemas de Lorenz, ecuaciones de transporte, modelos de aguas someras y modelos oceánicos.
| Familia de métodos | Mecanismo central | Fortaleza | Reto de ingeniería |
|---|---|---|---|
| 4D-Var | Minimizar un costo en una ventana temporal. | Formulación variacional estructurada de manera global. | El desarrollo del adjunto y las integraciones repetidas del modelo pueden ser exigentes. |
| Filtros de Kalman / de ensamble | Alternar pronóstico y corrección estadística. | Tratamiento explícito de la evolución de la incertidumbre. | La propagación de covarianzas o los ensambles grandes pueden ser costosos. |
| BFN / DBFN | Alternar observadores hacia adelante y hacia atrás. | Retroalimentación directa, implementación comparativamente ligera y convergencia rápida en los escenarios estudiados. | La estabilidad hacia atrás, la selección de ganancias y la adecuación del modelo siguen requiriendo cuidado matemático. |
La extensión Diffusive Back and Forth Nudging fue diseñada para determinados modelos difusivos. En experimentos con un modelo bidimensional de aguas someras y un modelo oceánico tridimensional de ecuaciones primitivas, estabilizó la integración hacia atrás y redujo el impacto de las observaciones ruidosas. Es un resultado de investigación, no una afirmación de que un algoritmo sustituya a todos los demás métodos.
05 Dos trayectorias de investigación, una cultura común de matemáticas aplicadas
La colaboración es especialmente sólida porque forma parte de trayectorias de investigación mucho más amplias. El mismo lenguaje matemático —ecuaciones diferenciales parciales, control, optimización, análisis numérico y problemas inversos— viaja desde la física de plasmas hasta la circulación oceánica, el procesamiento de imágenes, el pronóstico meteorológico y el modelado industrial.

Pr Jacques Blum
Después de estudiar en la École normale supérieure y realizar un doctorado bajo la dirección de Jacques-Louis Lions, además de investigar en el CNRS y ocupar cátedras en Grenoble, la École Polytechnique y Niza, Jacques Blum construyó una carrera centrada en la simulación, identificación y control óptimo de sistemas físicos regidos por ecuaciones diferenciales parciales.
Su trabajo abarca el equilibrio de plasmas en tokamaks, la reconstrucción en tiempo real, la circulación oceánica y la asimilación de datos. Incluso la versión de 2017 de su CV refleja una trayectoria de investigación y docencia de amplitud excepcional. En DSTI es miembro del Consejo Científico y ayudó a definir el enfoque de la escuela para brindar apoyo matemático a todo el estudiantado.
Pr Didier Auroux
Didier Auroux se formó en la École normale supérieure de Lyon, obtuvo un doctorado sobre asimilación de datos para problemas ambientales y una habilitación sobre algoritmos rápidos para procesamiento de imágenes y asimilación de datos. Su investigación reúne geofísica, observadores, control óptimo, problemas inversos, análisis numérico y cómputo científico.
Actualmente dirige la Maison de la Modélisation, de la Simulation et des Interactions, una estructura que apoya la investigación mediante modelado, simulación, cómputo de alto rendimiento y ciencia de datos.
06 La excelencia cobra sentido cuando el estudiantado puede alcanzarla
En DSTI, llevar matemáticos destacados al aula no tiene como objetivo adornar una lista de docentes. Se busca que el estudiantado conozca los hábitos de pensamiento detrás de un modelado riguroso: definir el estado, explicitar los supuestos, formular el objetivo, identificar qué es observable y comprender las consecuencias numéricas.
Jacques Blum enseña los fundamentos matemáticos durante el Warm Up de cada MSc de datos de DSTI, con grupos cuya preparación matemática previa puede variar considerablemente.
Jacques Blum y Didier Auroux enseñan juntos el lenguaje matemático necesario para razonar sobre ciencia de datos, no solo para operar sus herramientas.
El estudiantado aprende cómo los objetivos, gradientes, restricciones y algoritmos convierten un problema matemático en una solución computable.
Jacques propuso crear las Support Sessions de DSTI, inspiradas en las recitation classes de las universidades de la Ivy League y de las principales universidades de California. Didier dirige regularmente sesiones de apoyo para módulos con fuerte contenido matemático. El nivel es alto y el estudiantado recibe enseñanza estructurada adicional para ayudarle a alcanzarlo.
Su campo de investigación entra directamente al plan de estudios: reconstruir estados y parámetros ocultos a partir de modelos y observaciones incompletas. Explorar el plan de estudios.
Didier imparte Mathematics Harmonisation con la Dra Christine Malot, ayudando al estudiantado a establecer una base matemática común antes de avanzar hacia trabajos cuantitativos posteriores. Explorar el plan de estudios.
Jacques imparte el componente de física, conectando el cómputo con los sistemas físicos, los límites energéticos y las cuestiones ambientales en las que influye. Explorar el plan de estudios.
Jacques y Didier tienen un compromiso especial con enseñar a todo el estudiantado, incluyendo a quienes se encuentran lejos de su propio nivel de investigación. Eso importa. La confianza matemática no se construye bajando el techo intelectual, sino creando una ruta confiable para alcanzarlo.
07 La posición de DSTI: inteligencia híbrida antes que uniformidad dictada por las modas
No obligues al sistema de aprendizaje a redescubrir lo que el dominio ya sabe.
Cuando existan leyes físicas, restricciones, taxonomías o relaciones confiables, represéntalas. Usa el aprendizaje basado en datos para la incertidumbre residual, los parámetros desconocidos, las escalas no resueltas y los patrones que el modelo explícito no puede aportar. La inteligencia está en la combinación.
Las leyes de conservación, las ecuaciones diferenciales, las restricciones causales y el conocimiento del dominio son información. Descartarlos no es neutralidad: es una decisión de diseño.
Los datos son invaluables cuando los parámetros son inciertos, los modelos están incompletos, los efectos submalla no se resuelven o los patrones no pueden especificarse analíticamente.
El trabajo difícil consiste en decidir cómo interactúan el error del modelo, el error de observación y los componentes aprendidos, y en validar el sistema resultante.
Asimilación de datos
Combinar un modelo dinámico con observaciones para que el estado reconstruido respete tanto la evidencia como las leyes que gobiernan la evolución.
Web semántica
Representar de manera explícita las entidades y relaciones conocidas, en vez de pedir que cada sistema posterior las infiera una y otra vez a partir de datos no estructurados.
La analogía es un principio de ingeniería, no una afirmación de que las matemáticas sean idénticas. En ambos casos, el conocimiento explícito y el aprendizaje son complementarios. La enseñanza de tecnologías de la Web semántica de Pr Fabien Gandon y el trabajo de Jacques Blum y Didier Auroux sobre asimilación de datos apuntan hacia la misma disciplina educativa: saber qué sabes, aprender lo que no sabes y hacer que la frontera sea verificable.
Esto también cambia la forma de enseñar la eficiencia. Un método más pequeño y estructurado puede ser preferible a un sistema de aprendizaje genérico más grande: menos movimiento de datos, menos entrenamiento, mayor consistencia física y una explicación más clara de las fallas. A veces el modelo aprendido es la respuesta correcta. A veces es un componente dentro de un sistema matemático más amplio.
08 La trayectoria de investigación detrás de las clases
El artículo se apoya en una secuencia de publicaciones que recorre el trabajo desde la introducción de un algoritmo y la demostración de su convergencia hasta la comparación numérica, el desarrollo teórico y las aplicaciones geofísicas.
La nota fundacional introduce BFN y demuestra su convergencia para un sistema lineal de ecuaciones diferenciales ordinarias.
Un desarrollo más completo y un estudio numérico del método en asimilación de datos oceanográficos.
Una extensión diseñada para gestionar la difusión durante la integración hacia atrás.
Pruebas en modelos de aguas someras y modelos oceánicos completos, incluyendo el comportamiento del método ante ruido en las observaciones.
La idea que el estudiantado debe retener
La IA no es una sola clase de modelos. Es la construcción disciplinada de sistemas que infieren, optimizan y actúan bajo incertidumbre. A veces los datos deben aprender el modelo. A veces deben corregirlo. Saber distinguir ambas situaciones forma parte de formarse como profesional de la ingeniería con una comprensión sólida de los fundamentos científicos.