# Quand un lien porte du sens

HTML canonique: https://dsti.school/fr/techblog/web-semantique-donnees-liees

Cette version Markdown est générée par le même build du site statique DSTI que la page HTML canonique. Elle est destinée à la lisibilité machine et à une consultation concise.

[DSTI TechBlog](https://dsti.school/fr/techblog) /  AI is tech

Corps enseignant AI is tech

Le Web relie des documents. Le Web sémantique relie du sens. Pr Fabien Gandon consacre sa carrière aux graphes, standards et méthodes de raisonnement qui permettent aux données, aux personnes et aux systèmes intelligents de se comprendre à travers le Web.

FG Regards sur la recherche et l’enseignement : Pr Fabien Gandon Graphes de connaissances, Linked Data, Web sémantique, ontologies et IA distribuée

23 Jun 2026 14 min de lecture AI is tech

web-semantique graphes-de-connaissances donnees-liees rdf sparql ontologies w3c

## Des données au sens partagé

D
Données Faits, mesures, documents et identifiants.

G
Graphes Entités reliées par des relations explicites et typées.

V
Vocabulaires Définitions partagées qui rendent les assertions interopérables.

I
Inférence Nouvelles connaissances déduites de relations et de règles formelles.

La position centrale de DSTI : L’IA gagne en capacité lorsque les motifs appris peuvent fonctionner avec des connaissances explicites, des standards ouverts et un raisonnement traçable.

Un modèle de machine learning peut estimer que deux éléments sont liés. Un graphe de connaissances peut énoncer cette relation, identifier les deux éléments, les relier à d’autres sources, définir le vocabulaire employé et conserver la provenance de l’assertion. Les deux approches répondent à des dimensions différentes de l’intelligence — et leur combinaison constitue l’une des idées les plus puissantes de l’IA moderne.

Un modèle peut apprendre un motif . Un graphe peut énoncer un fait . Une ontologie peut en définir le sens . Un moteur de raisonnement peut déduire une conséquence . La provenance peut indiquer son origine .

## 01 Le Web a donné une adresse à chaque document. Les technologies sémantiques donnent une structure à chaque assertion.

Le Web d’origine a créé une architecture universelle pour publier et relier des documents. Les technologies du Web sémantique étendent cette architecture afin que les données puissent également être identifiées, reliées et interprétées de manière cohérente par les logiciels. Le changement décisif est simple et profond : les relations deviennent des objets de premier plan dotés d’un sens explicite.

Au lieu de stocker un nom dans une table, un rôle dans une autre et un programme dans un troisième système, un graphe de connaissances exprime des assertions reliées. Chaque sujet, relation et objet peut disposer d’un identifiant Web stable. D’autres organisations peuvent faire référence aux mêmes entités sans copier une base de données entière ni s’accorder sur une plateforme centrale unique.

Fabien Gandon

enseigne →

Semantic Web Technologies

Semantic Web Technologies

couvre →

Graphes de connaissances

Graphes de connaissances

représentés avec →

RDF

Ce sont à la fois des assertions lisibles par l’humain et des arêtes de graphe exploitables par les machines. Leur valeur augmente lorsqu’elles se relient à des vocabulaires, jeux de données et services au-delà du système dans lequel elles ont été écrites.

## 02 Les graphes de connaissances et leurs schémas sont des modèles partagés d’un domaine

Les graphes de connaissances organisent des entités et les relations qui les unissent. Leur force réside dans la combinaison d’une structure en graphe, d’identifiants réutilisables à l’échelle mondiale et de vocabulaires formels. Un graphe peut réunir des informations provenant d’archives de recherche, de systèmes d’entreprise, de collections culturelles, d’instruments scientifiques et de jeux de données publics, tout en préservant les distinctions nécessaires à chaque source.

1

### Identifier

Utiliser des IRI stables afin qu’une personne, une organisation, un jeu de données ou un concept puisse être référencé sans ambiguïté entre différents systèmes.

2

### Relier

Exprimer des liens typés : authored, teaches, derived from, located in, governed by, compatible with ou part of.

3

### Interpréter

Relier le graphe à des vocabulaires et ontologies qui définissent classes, propriétés, contraintes et conséquences logiques.

Cette architecture favorise l’interopérabilité sans imposer à tous les participants un même logiciel ou un même schéma de base de données. Elle est particulièrement précieuse lorsque les données doivent franchir des frontières institutionnelles, disciplinaires ou nationales et rester utilisables dans le temps.

## 03 Les standards ouverts transforment un graphe en écosystème

Le cours de Fabien s’articule autour des standards du W3C, car l’interopérabilité est une propriété de l’ensemble de l’écosystème. Chaque couche joue un rôle précis.

RDF
Représente l’information sous forme de triplets sujet–prédicat–objet et assemble ces triplets en graphes.

[Lire la spécification du W3C](https://www.w3.org/TR/rdf11-concepts/)

SHACL
Décrit les attentes structurelles et valide les graphes RDF au regard de formes et contraintes explicites.

[Lire la spécification du W3C](https://www.w3.org/TR/shacl/)

SPARQL
Interroge précisément des motifs de graphe dans des jeux de données RDF, avec chemins optionnels, filtres et agrégations.

[Lire la spécification du W3C](https://www.w3.org/TR/sparql11-query/)

RDFS & OWL
Définissent des vocabulaires et ontologies, organisent classes et propriétés et prennent en charge l’inférence formelle.

[Explorer OWL 2](https://www.w3.org/TR/owl2-overview/)

SKOS
Publie et relie taxonomies, thésaurus et systèmes de classification sous forme de systèmes d’organisation des connaissances lisibles par les machines.

[Explorer SKOS](https://www.w3.org/TR/skos-reference/)

PROV-O, DCAT & VoID
Décrivent la provenance, les catalogues, les jeux de données et les liens entre collections de données distribuées.

[Explorer la provenance](https://www.w3.org/TR/prov-o/)

« Celui qui contrôle les métadonnées contrôle le Web et, à travers le Web, de nombreux aspects de notre monde. » Pr Fabien Gandon — extrait de sa page officielle

## 04 Le raisonnement rend explicites les connaissances implicites

La sémantique formelle permet à un logiciel de déduire une assertion à partir d’autres assertions en suivant un chemin de raisonnement explicite. Le résultat diffère d’une estimation statistique : la conclusion découle de relations et de règles déclarées.

### Un petit laboratoire sémantique

Suivez une même information à travers sa description, sa validation et son inférence. L’exemple est volontairement compact ; les principes s’appliquent à de vastes graphes de connaissances distribués.

SPARQL travaille directement avec la structure du graphe. Une requête décrit le motif recherché plutôt que les tables à joindre.

```sparql
PREFIX dsti: <https://dsti.school/id/>

SELECT ?programme
WHERE {
  ?course dsti:taughtBy dsti:FabienGandon ;
          dsti:partOf ?programme ;
          dsti:covers dsti:KnowledgeGraphs .
}
```

### Résultat

programme

MSc in Data Science & AI

MSc in Data Engineering for AI

MSc in Data Analytics with AI

Executive MSc in Artificial Intelligence for Digital Transformation

## 05 Pr Fabien Gandon : une vie de recherche consacrée à l’intelligence du Web

![Pr Fabien Gandon](https://www-sop.inria.fr/members/Fabien.Gandon/img/fabien-gandon-2021-vignette.jpg)

Fabien Gandon est directeur de recherche à Inria, informaticien et ingénieur en mathématiques. Sa thèse de 2002 a ouvert la voie à l’utilisation conjointe de l’intelligence artificielle distribuée et des technologies du Web sémantique pour gérer des sources de données et des utilisateurs divers au sein d’une architecture Web. À Carnegie Mellon University, il a travaillé sur des méthodes d’IA permettant de faire respecter les préférences de confidentialité lors de requêtes et de raisonnements sur des données personnelles.

Il a fondé l’équipe de recherche Wimmics à Sophia Antipolis et l’a dirigée de 2012 à 2024, en construisant un programme de recherche à l’interface de la sémantique formelle, de la sémantique sociale et de l’interaction humain–machine. Il représente Inria au W3C depuis 2012, est titulaire d’une chaire 3IA Côte d’Azur et a présidé de grandes conférences internationales des communautés du Web et du Web sémantique.

Ses travaux ont constamment circulé entre théorie, standards et déploiement : DBpedia.fr et les données culturelles liées ; DataLift pour publier et interconnecter des jeux de données ; CovidOnTheWeb pour la littérature biomédicale ; D2KAB pour l’agronomie et la biodiversité ; WASABI pour les connaissances musicales ; et HyperAgents pour des communautés de personnes et d’agents artificiels opérant au moyen de l’architecture du Web.

[Page officielle](https://www-sop.inria.fr/members/Fabien.Gandon/)
[Biographie et activités](https://www-sop.inria.fr/members/Fabien.Gandon/cv.html)
[Publications](https://www-sop.inria.fr/members/Fabien.Gandon/publications.html)
[Conférences](https://www-sop.inria.fr/members/Fabien.Gandon/talks.html)
[HAL](https://cv.hal.science/fabien-gandon)
[ORCID](https://orcid.org/0000-0003-0543-1232)
[Corps enseignant de DSTI](https://dsti.school/fr/enseignants#academics)

Axes de recherche
Intelligence artificielle, graphes de connaissances, représentation des connaissances, Linked Data, ontologies et intelligence distribuée.

Standards et communauté
Représentant d’Inria au W3C, ancien responsable de Wimmics, président de conférences et acteur de l’évolution du Web.

Gouvernance scientifique à DSTI
Coprésident du Conseil scientifique de DSTI avec Dr Christine Malot et professeur à DSTI depuis 2015.

Fabien est également coauteur de la troisième édition de Semantic Web for the Working Ontologist , un ouvrage de référence qui porte la même philosophie que son enseignement : les idées formelles prennent toute leur valeur lorsqu’elles peuvent être modélisées, interrogées et utilisées par des systèmes opérationnels.

## 06 À DSTI, les étudiants construisent eux-mêmes les couches sémantiques

Semantic Web Technologies est enseigné dans tous les MSc Data de DSTI ainsi que dans l’Executive MSc in Artificial Intelligence for Digital Transformation. Le cours part de l’architecture du Web pour aller vers la publication pratique de graphes, leur validation, leur interrogation, la conception d’ontologies et l’inférence.

01

### Web architecture and Linked Data

Understand the principles and standards that allow resources and datasets to be published, identified and connected globally.

02

### RDF and Turtle

Model entities and relationships as graphs, use RDF's advanced features and express the results in practical syntaxes.

03

### SHACL validation

Define structural schemata and verify that graph data satisfy explicit quality and integrity expectations.

04

### SPARQL querying

Select, aggregate and transform graph data through an open standard query language designed for graph patterns.

05

### Ontologies and inference

Use RDFS, OWL and SKOS to design vocabularies, formalise domain knowledge and derive additional statements.

06

### Provenance and bridges

Connect graph data to other formats and models, while describing datasets, catalogues and their history with open vocabularies.

Le rythme d’apprentissage combine travail préparatoire, autoévaluation, cours intensifs et séances de laboratoire, un travail approfondi et un examen. Les étudiants acquièrent bien plus qu’un vocabulaire : ils ont publié, validé et interrogé des graphes de connaissances, et mené des raisonnements sur ceux-ci.

[MSc in Data Science & AI](https://dsti.school/fr/msc-data-science-ai#curriculum)
[MSc in Data Engineering for AI](https://dsti.school/fr/msc-data-engineering-ai#curriculum)
[MSc in Data Analytics with AI](https://dsti.school/fr/msc-data-analytics-ai#curriculum)
[Executive MSc in AI for Digital Transformation](https://dsti.school/fr/executive-msc-intelligence-artificielle-transformation-digitale#curriculum)

## 07 La position de DSTI : l’intelligence progresse lorsque apprentissage et connaissances fonctionnent ensemble

Le machine learning est particulièrement efficace pour extraire des régularités à partir d’exemples. Les technologies sémantiques excellent dans la représentation des identités, relations, règles métier, provenances et définitions partagées. Le jugement d’ingénieur commence par la compréhension de la capacité qu’exige le problème.

### Apprendre à partir des données

Utiliser des modèles statistiques et de machine learning pour les motifs incertains, trop complexes à énoncer directement ou susceptibles d’évoluer avec de nouvelles observations.

### Représenter ce qui est connu

Utiliser graphes, vocabulaires, contraintes et logique pour les connaissances qui doivent rester explicites, interopérables, inspectables et réutilisables.

L’objectif d’ingénierie est la composition. Un modèle de langage peut extraire des faits candidats ; SHACL peut valider leur structure ; une ontologie peut en définir le sens ; un graphe de connaissances peut les relier à des sources fiables ; la provenance peut consigner leur mode de production ; et un moteur de raisonnement peut déduire les conséquences du modèle formel.

Cette approche hybride est importante pour l’intégration de données d’entreprise, les connaissances scientifiques, la conformité réglementaire, le patrimoine culturel, les jumeaux numériques, les agents intelligents et tout système qui doit rester compréhensible au-delà d’une version de modèle ou d’une plateforme fournisseur.

## 08 Suivre le fil de la recherche, des standards et de l’enseignement

Les pages de Fabien forment une carte reliée de sa carrière : articles scientifiques, travaux de normalisation, projets, conférences invitées, médiation et enseignement. Les points de départ suivants permettent de l’explorer facilement.

[Page officielle Une carte concise de ses fonctions, thèmes de recherche, projets et profils publics.](https://www-sop.inria.fr/members/Fabien.Gandon/)
[Publications et ouvrage HAL, ORCID et la troisième édition de Semantic Web for the Working Ontologist.](https://www-sop.inria.fr/members/Fabien.Gandon/publications.html)
[Conférences et cours Des graphes typés et du Linked Data aux systèmes intelligents interopérables et à l’augmentation des connaissances.](https://www-sop.inria.fr/members/Fabien.Gandon/talks.html)
[Wimmics L’équipe de recherche qui relie sémantique formelle, sémantique sociale et interaction humain–machine.](https://team.inria.fr/wimmics/)
[W3C L’organisation de standards ouverts à l’origine de l’architecture du Web et des spécifications du Web sémantique.](https://www.w3.org/)
[3IA Côte d'Azur L’institut interdisciplinaire d’IA où Fabien est titulaire d’une chaire de recherche.](https://3ia.univ-cotedazur.eu)