Un modelo de machine learning puede estimar que dos elementos están relacionados. Un grafo de conocimiento puede expresar la relación, identificar ambos elementos, conectarlos con otras fuentes, definir el vocabulario utilizado y conservar la procedencia de la afirmación. Los dos enfoques responden a dimensiones distintas del problema de la inteligencia, y su combinación es una de las ideas más potentes de la IA moderna.
01 La Web dio una dirección a cada documento. Las tecnologías semánticas dan estructura a cada afirmación.
La Web original creó una arquitectura universal para publicar y enlazar documentos. Las tecnologías de la Web semántica amplían esa arquitectura para que los datos también puedan ser identificados, conectados e interpretados de manera consistente por el software. El cambio clave es sencillo y profundo: las relaciones se convierten en objetos de primera clase con significado explícito.
En lugar de guardar un nombre en una tabla, un cargo en otra y un programa en un tercer sistema, un grafo de conocimiento expresa afirmaciones conectadas. Cada sujeto, relación y objeto puede contar con un identificador web estable. Otras organizaciones pueden referirse a las mismas entidades sin copiar una base de datos completa ni acordar una única plataforma central.
Son, al mismo tiempo, afirmaciones legibles por personas y aristas de grafo procesables por máquinas. Su valor crece a medida que se conectan con vocabularios, conjuntos de datos y servicios más allá del sistema donde se escribieron originalmente.
02 Los grafos de conocimiento y sus esquemas son modelos compartidos de un dominio
Los grafos de conocimiento organizan entidades y las relaciones entre ellas. Su fortaleza reside en combinar una estructura de grafo, identificadores reutilizables globalmente y vocabularios formales. Un grafo puede integrar información de repositorios de investigación, sistemas empresariales, colecciones culturales, instrumentos científicos y conjuntos de datos públicos, conservando las distinciones que necesita cada fuente.
Identificar
Utiliza IRI estables para que una persona, organización, conjunto de datos o concepto pueda referenciarse sin ambigüedad entre sistemas.
Relacionar
Expresa enlaces tipados: authored, teaches, derived from, located in, governed by, compatible with o part of.
Interpretar
Conecta el grafo con vocabularios y ontologías que definen clases, propiedades, restricciones y consecuencias lógicas.
Esta arquitectura facilita la interoperabilidad sin obligar a todos los participantes a utilizar un mismo producto de software o esquema de base de datos. Resulta especialmente valiosa cuando los datos deben cruzar fronteras institucionales, disciplinarias o nacionales y seguir siendo utilizables con el tiempo.
03 Los estándares abiertos convierten un grafo en un ecosistema
El curso de Fabien se estructura alrededor de los estándares del W3C porque la interoperabilidad es una propiedad de todo el ecosistema. Cada capa cumple una función precisa.
Representa información mediante tripletas sujeto–predicado–objeto y las combina en grafos.
Leer la especificación del W3CDescribe expectativas estructurales y valida grafos RDF frente a formas y restricciones explícitas.
Leer la especificación del W3CConsulta con precisión patrones de grafo en conjuntos de datos RDF, incluidos caminos opcionales, filtros y agregaciones.
Leer la especificación del W3CDefinen vocabularios y ontologías, organizan clases y propiedades y permiten la inferencia formal.
Explorar OWL 2Publica y enlaza taxonomías, tesauros y esquemas de clasificación como sistemas de organización del conocimiento legibles por máquinas.
Explorar SKOSDescriben procedencia, catálogos, conjuntos de datos y enlaces entre colecciones de datos distribuidas.
Explorar la procedencia«Quien controla los metadatos controla la Web y, a través de la Web, muchas cosas de nuestro mundo».Pr Fabien Gandon — tomado de su página oficial
04 El razonamiento hace explícito el conocimiento implícito
La semántica formal permite que el software derive una afirmación a partir de otras afirmaciones siguiendo una ruta de razonamiento explícita. El resultado es distinto de una estimación estadística: la conclusión se desprende de relaciones y reglas declaradas.
Un pequeño laboratorio semántico
Sigue la misma información a través de la descripción, la validación y la inferencia. El ejemplo es deliberadamente compacto; los principios se pueden aplicar a grafos de conocimiento grandes y distribuidos.
SPARQL trabaja directamente con la estructura del grafo. Una consulta describe el patrón buscado, en lugar de las tablas que deben unirse.
PREFIX dsti: <https://dsti.school/id/>
SELECT ?programme
WHERE {
?course dsti:taughtBy dsti:FabienGandon ;
dsti:partOf ?programme ;
dsti:covers dsti:KnowledgeGraphs .
}Resultado
| programa |
|---|
| MSc in Data Science & AI |
| MSc in Data Engineering for AI |
| MSc in Data Analytics with AI |
| Executive MSc in Artificial Intelligence for Digital Transformation |
05 Pr Fabien Gandon: una vida de investigación construida alrededor de la inteligencia de la Web

Fabien Gandon es director de investigación en Inria, informático e ingeniero en matemáticas. Su doctorado de 2002 fue pionero en el uso conjunto de inteligencia artificial distribuida y tecnologías de la Web semántica para gestionar diversas fuentes de datos y usuarios mediante una arquitectura web. En Carnegie Mellon University trabajó en métodos de IA para aplicar preferencias de privacidad al consultar y razonar sobre datos personales.
Fundó el equipo de investigación Wimmics en Sophia Antipolis y lo dirigió de 2012 a 2024, construyendo un programa de investigación que conecta la semántica formal, la semántica social y la interacción humano–máquina. Representa a Inria en el W3C desde 2012, ocupa una cátedra de 3IA Côte d’Azur y ha presidido importantes conferencias internacionales de las comunidades de la Web y la Web semántica.
Su trabajo se ha movido repetidamente entre la teoría, los estándares y la implementación: DBpedia.fr y datos culturales enlazados; DataLift para publicar e interconectar conjuntos de datos; CovidOnTheWeb para literatura biomédica; D2KAB para agronomía y biodiversidad; WASABI para conocimiento musical; y HyperAgents para comunidades de personas y agentes artificiales que operan mediante la arquitectura web.
Inteligencia artificial, grafos de conocimiento, representación del conocimiento, Linked Data, ontologías e inteligencia distribuida.
Representante de Inria ante el W3C, exresponsable de Wimmics, presidente de conferencias y colaborador en la evolución de la Web.
Copresidente del Consejo Científico de DSTI junto con Dr Christine Malot y profesor de DSTI desde 2015.
Fabien también es coautor de la tercera edición de Semantic Web for the Working Ontologist, una obra de referencia que refleja la misma filosofía que su enseñanza: las ideas formales adquieren valor cuando pueden modelarse, consultarse y utilizarse en sistemas operativos.
06 En DSTI, los estudiantes construyen las capas semánticas por sí mismos
Semantic Web Technologies se imparte en todos los programas MSc de Data de DSTI y en el Executive MSc in Artificial Intelligence for Digital Transformation. El curso avanza desde la arquitectura de la Web hasta la publicación práctica de grafos, su validación, consulta, diseño de ontologías e inferencia.
Web architecture and Linked Data
Understand the principles and standards that allow resources and datasets to be published, identified and connected globally.
RDF and Turtle
Model entities and relationships as graphs, use RDF's advanced features and express the results in practical syntaxes.
SHACL validation
Define structural schemata and verify that graph data satisfy explicit quality and integrity expectations.
SPARQL querying
Select, aggregate and transform graph data through an open standard query language designed for graph patterns.
Ontologies and inference
Use RDFS, OWL and SKOS to design vocabularies, formalise domain knowledge and derive additional statements.
Provenance and bridges
Connect graph data to other formats and models, while describing datasets, catalogues and their history with open vocabularies.
El ritmo de aprendizaje combina trabajo preparatorio, autoevaluación, cursos intensivos y sesiones de laboratorio, un proyecto sustancial y un examen. Los estudiantes terminan con mucho más que terminología: han publicado, validado y consultado grafos de conocimiento, y han razonado sobre ellos.
07 La posición de DSTI: la inteligencia crece cuando el aprendizaje y el conocimiento trabajan juntos
El machine learning es especialmente eficaz para extraer regularidades de ejemplos. Las tecnologías semánticas destacan al representar identidades, relaciones, reglas de dominio, procedencia y definiciones compartidas. El criterio de ingeniería comienza por entender qué capacidad requiere el problema.
Aprender de la evidencia
Utiliza modelos estadísticos y de machine learning para patrones inciertos, demasiado complejos para expresarlos directamente o que se espera que evolucionen con nuevas observaciones.
Representar lo que se conoce
Utiliza grafos, vocabularios, restricciones y lógica para el conocimiento que debe seguir siendo explícito, interoperable, inspeccionable y reutilizable.
Esta posición híbrida es importante para la integración de datos empresariales, el conocimiento científico, el cumplimiento normativo, el patrimonio cultural, los gemelos digitales, los agentes inteligentes y cualquier sistema que deba seguir siendo comprensible más allá de una versión del modelo o una plataforma de proveedor.
08 Sigue la ruta de la investigación, los estándares y la enseñanza
Las páginas de Fabien forman un mapa conectado de su trayectoria: artículos de investigación, trabajo en estándares, proyectos, conferencias invitadas, divulgación y enseñanza. Los siguientes puntos de partida facilitan su exploración.