Faculty · AI is techConocimiento, grafos y estándares abiertos
En esta página
ResumenSignificadoGrafos de conocimientoEstándares abiertosRazonamientoPr Fabien GandonEn DSTILa posición de DSTIProfundiza
DSTI TechBlog /  AI is tech
Cuerpo docente AI is tech

Cuando un enlace transmite significado

La Web conecta documentos. La Web semántica conecta significado. Pr Fabien Gandon ha dedicado su carrera a desarrollar los grafos, estándares y métodos de razonamiento que permiten que los datos, las personas y los sistemas inteligentes se entiendan a través de la Web.

web-semanticagrafos-de-conocimientodatos-enlazadosrdfsparqlontologiesw3c

Un modelo de machine learning puede estimar que dos elementos están relacionados. Un grafo de conocimiento puede expresar la relación, identificar ambos elementos, conectarlos con otras fuentes, definir el vocabulario utilizado y conservar la procedencia de la afirmación. Los dos enfoques responden a dimensiones distintas del problema de la inteligencia, y su combinación es una de las ideas más potentes de la IA moderna.

Un modelo puede aprender un patrón. Un grafo puede expresar un hecho. Una ontología puede definir su significado. Un razonador puede derivar una consecuencia. La procedencia puede mostrar de dónde proviene.

01 La Web dio una dirección a cada documento. Las tecnologías semánticas dan estructura a cada afirmación.

La Web original creó una arquitectura universal para publicar y enlazar documentos. Las tecnologías de la Web semántica amplían esa arquitectura para que los datos también puedan ser identificados, conectados e interpretados de manera consistente por el software. El cambio clave es sencillo y profundo: las relaciones se convierten en objetos de primera clase con significado explícito.

En lugar de guardar un nombre en una tabla, un cargo en otra y un programa en un tercer sistema, un grafo de conocimiento expresa afirmaciones conectadas. Cada sujeto, relación y objeto puede contar con un identificador web estable. Otras organizaciones pueden referirse a las mismas entidades sin copiar una base de datos completa ni acordar una única plataforma central.

Fabien Gandon
enseña →
Semantic Web Technologies
Semantic Web Technologies
abarca →
Grafos de conocimiento
Grafos de conocimiento
representados con →
RDF

Son, al mismo tiempo, afirmaciones legibles por personas y aristas de grafo procesables por máquinas. Su valor crece a medida que se conectan con vocabularios, conjuntos de datos y servicios más allá del sistema donde se escribieron originalmente.

02 Los grafos de conocimiento y sus esquemas son modelos compartidos de un dominio

Los grafos de conocimiento organizan entidades y las relaciones entre ellas. Su fortaleza reside en combinar una estructura de grafo, identificadores reutilizables globalmente y vocabularios formales. Un grafo puede integrar información de repositorios de investigación, sistemas empresariales, colecciones culturales, instrumentos científicos y conjuntos de datos públicos, conservando las distinciones que necesita cada fuente.

1

Identificar

Utiliza IRI estables para que una persona, organización, conjunto de datos o concepto pueda referenciarse sin ambigüedad entre sistemas.

2

Relacionar

Expresa enlaces tipados: authored, teaches, derived from, located in, governed by, compatible with o part of.

3

Interpretar

Conecta el grafo con vocabularios y ontologías que definen clases, propiedades, restricciones y consecuencias lógicas.

Esta arquitectura facilita la interoperabilidad sin obligar a todos los participantes a utilizar un mismo producto de software o esquema de base de datos. Resulta especialmente valiosa cuando los datos deben cruzar fronteras institucionales, disciplinarias o nacionales y seguir siendo utilizables con el tiempo.

03 Los estándares abiertos convierten un grafo en un ecosistema

El curso de Fabien se estructura alrededor de los estándares del W3C porque la interoperabilidad es una propiedad de todo el ecosistema. Cada capa cumple una función precisa.

RDF

Representa información mediante tripletas sujeto–predicado–objeto y las combina en grafos.

Leer la especificación del W3C
SHACL

Describe expectativas estructurales y valida grafos RDF frente a formas y restricciones explícitas.

Leer la especificación del W3C
SPARQL

Consulta con precisión patrones de grafo en conjuntos de datos RDF, incluidos caminos opcionales, filtros y agregaciones.

Leer la especificación del W3C
RDFS & OWL

Definen vocabularios y ontologías, organizan clases y propiedades y permiten la inferencia formal.

Explorar OWL 2
SKOS

Publica y enlaza taxonomías, tesauros y esquemas de clasificación como sistemas de organización del conocimiento legibles por máquinas.

Explorar SKOS
PROV-O, DCAT & VoID

Describen procedencia, catálogos, conjuntos de datos y enlaces entre colecciones de datos distribuidas.

Explorar la procedencia
«Quien controla los metadatos controla la Web y, a través de la Web, muchas cosas de nuestro mundo».
Pr Fabien Gandon — tomado de su página oficial

04 El razonamiento hace explícito el conocimiento implícito

La semántica formal permite que el software derive una afirmación a partir de otras afirmaciones siguiendo una ruta de razonamiento explícita. El resultado es distinto de una estimación estadística: la conclusión se desprende de relaciones y reglas declaradas.

Un pequeño laboratorio semántico

Sigue la misma información a través de la descripción, la validación y la inferencia. El ejemplo es deliberadamente compacto; los principios se pueden aplicar a grafos de conocimiento grandes y distribuidos.

SPARQL trabaja directamente con la estructura del grafo. Una consulta describe el patrón buscado, en lugar de las tablas que deben unirse.

PREFIX dsti: <https://dsti.school/id/>

SELECT ?programme
WHERE {
  ?course dsti:taughtBy dsti:FabienGandon ;
          dsti:partOf ?programme ;
          dsti:covers dsti:KnowledgeGraphs .
}

Resultado

programa
MSc in Data Science & AI
MSc in Data Engineering for AI
MSc in Data Analytics with AI
Executive MSc in Artificial Intelligence for Digital Transformation

05 Pr Fabien Gandon: una vida de investigación construida alrededor de la inteligencia de la Web

Pr Fabien Gandon

Fabien Gandon es director de investigación en Inria, informático e ingeniero en matemáticas. Su doctorado de 2002 fue pionero en el uso conjunto de inteligencia artificial distribuida y tecnologías de la Web semántica para gestionar diversas fuentes de datos y usuarios mediante una arquitectura web. En Carnegie Mellon University trabajó en métodos de IA para aplicar preferencias de privacidad al consultar y razonar sobre datos personales.

Fundó el equipo de investigación Wimmics en Sophia Antipolis y lo dirigió de 2012 a 2024, construyendo un programa de investigación que conecta la semántica formal, la semántica social y la interacción humano–máquina. Representa a Inria en el W3C desde 2012, ocupa una cátedra de 3IA Côte d’Azur y ha presidido importantes conferencias internacionales de las comunidades de la Web y la Web semántica.

Su trabajo se ha movido repetidamente entre la teoría, los estándares y la implementación: DBpedia.fr y datos culturales enlazados; DataLift para publicar e interconectar conjuntos de datos; CovidOnTheWeb para literatura biomédica; D2KAB para agronomía y biodiversidad; WASABI para conocimiento musical; y HyperAgents para comunidades de personas y agentes artificiales que operan mediante la arquitectura web.

Líneas de investigación

Inteligencia artificial, grafos de conocimiento, representación del conocimiento, Linked Data, ontologías e inteligencia distribuida.

Estándares y comunidad

Representante de Inria ante el W3C, exresponsable de Wimmics, presidente de conferencias y colaborador en la evolución de la Web.

Gobernanza científica en DSTI

Copresidente del Consejo Científico de DSTI junto con Dr Christine Malot y profesor de DSTI desde 2015.

Fabien también es coautor de la tercera edición de Semantic Web for the Working Ontologist, una obra de referencia que refleja la misma filosofía que su enseñanza: las ideas formales adquieren valor cuando pueden modelarse, consultarse y utilizarse en sistemas operativos.

06 En DSTI, los estudiantes construyen las capas semánticas por sí mismos

Semantic Web Technologies se imparte en todos los programas MSc de Data de DSTI y en el Executive MSc in Artificial Intelligence for Digital Transformation. El curso avanza desde la arquitectura de la Web hasta la publicación práctica de grafos, su validación, consulta, diseño de ontologías e inferencia.

01

Web architecture and Linked Data

Understand the principles and standards that allow resources and datasets to be published, identified and connected globally.

02

RDF and Turtle

Model entities and relationships as graphs, use RDF's advanced features and express the results in practical syntaxes.

03

SHACL validation

Define structural schemata and verify that graph data satisfy explicit quality and integrity expectations.

04

SPARQL querying

Select, aggregate and transform graph data through an open standard query language designed for graph patterns.

05

Ontologies and inference

Use RDFS, OWL and SKOS to design vocabularies, formalise domain knowledge and derive additional statements.

06

Provenance and bridges

Connect graph data to other formats and models, while describing datasets, catalogues and their history with open vocabularies.

El ritmo de aprendizaje combina trabajo preparatorio, autoevaluación, cursos intensivos y sesiones de laboratorio, un proyecto sustancial y un examen. Los estudiantes terminan con mucho más que terminología: han publicado, validado y consultado grafos de conocimiento, y han razonado sobre ellos.

07 La posición de DSTI: la inteligencia crece cuando el aprendizaje y el conocimiento trabajan juntos

El machine learning es especialmente eficaz para extraer regularidades de ejemplos. Las tecnologías semánticas destacan al representar identidades, relaciones, reglas de dominio, procedencia y definiciones compartidas. El criterio de ingeniería comienza por entender qué capacidad requiere el problema.

Aprender de la evidencia

Utiliza modelos estadísticos y de machine learning para patrones inciertos, demasiado complejos para expresarlos directamente o que se espera que evolucionen con nuevas observaciones.

Representar lo que se conoce

Utiliza grafos, vocabularios, restricciones y lógica para el conocimiento que debe seguir siendo explícito, interoperable, inspeccionable y reutilizable.

El objetivo de ingeniería es la composición. Un modelo de lenguaje puede extraer hechos candidatos; SHACL puede validar su estructura; una ontología puede definir su significado; un grafo de conocimiento puede conectarlos con fuentes confiables; la procedencia puede registrar cómo se produjeron; y un razonador puede derivar las consecuencias que se desprenden del modelo formal.

Esta posición híbrida es importante para la integración de datos empresariales, el conocimiento científico, el cumplimiento normativo, el patrimonio cultural, los gemelos digitales, los agentes inteligentes y cualquier sistema que deba seguir siendo comprensible más allá de una versión del modelo o una plataforma de proveedor.

08 Sigue la ruta de la investigación, los estándares y la enseñanza

Las páginas de Fabien forman un mapa conectado de su trayectoria: artículos de investigación, trabajo en estándares, proyectos, conferencias invitadas, divulgación y enseñanza. Los siguientes puntos de partida facilitan su exploración.