Fabien Gandon - Le Web Sémantique

avr. 15 2013

Fabien GandonPour ce premier épisode de la série le web de demain, Fabien Gandon a accepté de venir répondre à nos questions sur le web sémantique et le web de données. Pour ceux qui ne le connaitraient pas, Fabien est responsable de l’équipe de recherche Wimmics, une équipe de chercheurs qui travaillent à la fois pour l’Institut National de Recherche en Informatique et en Automatique (INRIA) et l’I3S (CNRS, Université de Nice). Avec son équipe il y étudie le web de données, le web sémantique et ses frictions avec le web social. Il est aussi le représentant de l’Inria auprès du W3C c’est-à-dire le consortium de standardisation du Web.

Comment pourrait-on définir le web sémantique ? Est-ce que le web sémantique porte selon-vous l'étiquette web 3.0 ?

Je ne suis pas un grand fan de la numérotation de versions appliquée au web. Non seulement il n’y a pas eu à proprement parler de changement de version, l’évolution dite web 2.0 étant essentiellement un déploiement de nouvelles pratiques, mais en plus elle donne l’impression que le web évoluerait par soubresauts dans une grande direction alors qu’il évolue en permanence et en continu dans de multiples directions (sécurité, services, multimodalité, multimédia, mobilité, ubiquité, données, sémantique, etc.). Ceci dit je fais tout de même une différence entre web 3.0 et web sémantique.

Un Graphe de données liées et noméesJe définis le web de données comme la première vague de déploiement du web sémantique. Le web de données augmente le web que nous connaissons et qui est essentiellement consulté par des humains avec un déploiement parallèle de données structurées et liées selon les principes du web. Ces données sont destinées aux logiciels qui consultent le Web.  Le Web de données met en relation d’immenses sources de données qui se lient entre elles avec la même clé de voute que l’architecture du Web classique : les URL, ces adresses que nous connaissons tous (ex., http://fabien.info). La différence est qu’ici ce ne sont pas des pages qui sont liées mais bien des entrées de bases de données formant un graphe de descriptions distribué à l’échelle mondiale.

L’étape suivante est appelée Web sémantique, car il s’agit du déploiement de nouvelles techniques permettant aux applications d’utiliser plus efficacement les données en reconnaissant les différents types de ressources et de liens qu’elles rencontrent sur le web, et en exploitant le sens et les raisonnements qui leur sont attachés.
Par exemple, si une ressource ayant pour titre « Hugo » est décrite sur le Web comme étant un écrivain, et si un internaute cherche une personne nommée « Hugo », les raisonnements et données du Web pourront être employés pour déduire automatiquement le fait qu’un écrivain étant une personne, la ressource intitulée « Hugo » est une réponse à la question de l’utilisateur ; alors qu’une autre ressource, de même intitulé mais du type « rue », sera écartée comme non pertinente.

Dès lors, le web dit 3.0 est pour moi l’intégration de toutes les évolutions précédentes (web 1.0, web 2.0) avec le déploiement du web de données et du web sémantique. C’est l’union de ces évolutions et leur combinaison dans des applications web.

Qu'est-ce qui a motivé votre choix de vous tourner vers la recherche en web sémantique ?

Notre équipe travaille sur la représentation et la gestion des connaissances depuis 1992. Notre objectif était alors d’aider notamment l’organisation, la navigation, la recherche et la circulation des connaissances à l’intérieur des organismes par leur représentation explicite et par le raisonnement automatique. C’est d’ailleurs dans ce domaine de la représentation des connaissances que la notion d’ontologie très utilisée pour le web sémantique est née.

Rapidement le web est apparu comme une architecture applicable aussi sur les intranets et nous avons commencé à construire des serveurs de connaissances sur le web. En 1998 nous avons identifié le projet du Web sémantique au W3C comme particulièrement prometteur pour standardiser les langages de représentation de connaissances sur le web et nous avons immédiatement commencé à travailler à la convergence de ces modèles. Dès 1999 nous avions l’un des premiers moteurs web sémantique (CORESE/KGRAM) que nous n’avons cessé d’étendre et de maintenir depuis lors, au travers de multiples projets de recherche.

Actuellement au-delà de l'intérêt que vous portez au domaine, quel impact peut avoir le web sémantique sur notre société ?

Un utilisateur du Web a une idée, des besoins et une vision du monde en tête à partir desquels il va décider de visiter tel ou tel site ou formuler une requête à un moteur de recherche par exemple. Si l’on est capable de capturer partiellement cette vision du monde dans des modèles informatiques et de les lier aux ressources du Web, on peut améliorer toutes les applications de ce dernier. Cela permet aux outils d’interroger et de raisonner sur ces modèles pour améliorer depuis leurs fonctionnalités essentielles (ex. de meilleures sélections dans les recherches, de meilleures recommandations) jusqu’à leurs interactions avec l’utilisateur (ex. de meilleurs choix d’affichages, plus de personnalisation et de contextualisation).

Quelques initiatives du Web Sémantique

Au-delà de l’expérience individuelle, le web de données et le web sémantiques offrent aussi une formidable opportunité de standardiser des formats d’échange des données ouvertes et ainsi de permettre l’accès et l’exploitation de formidables collections de données et à leurs croisements. Ainsi, l'ouverture des données (Open Data) par les collectivités ou les acteurs de l'éducation par exemple, permet aux journalistes de croiser différentes sources d'informations.

Le Web était déjà très riche en ressources multimédias, et cette richesse ne cesse d’augmenter avec le Web mobile et l’internet des objets : on parle alors de Web ubiquitaire et de Web des objets. Le Web de données et le Web sémantique viennent étendre la "toile" que nous connaissons aujourd’hui pour lui permettre d’intégrer, de décrire et de gérer cette richesse grandissante.

Quelles initiatives peut-on mettre en avant qui permettent de faire avancer la recherche ?

Vaste question qui fait l’objet chaque année de plusieurs conférences internationales telles que WWW, ISWC ou ESWC. Comme les programmes de ces évènements en attestent, il y a des initiatives à la fois pour le passage à l’échelle du traitement de ces graphes géants notamment en termes d’interrogations et de raisonnements, pour l’extraction de ces données des textes et des ressources multimédias du web, pour la gestion et l’utilisation collaboratives de ces données, pour la conception d’interactions ergonomiques avec toutes ces ressources etc.

Avez-vous en tête quelques initiatives concrètes qui représentent une avancée vers un web plus intelligent ?

BBC Wildlife explorerUne des initiatives les plus connues et les plus parlantes est celle de DBpedia qui s’intéresse à extraire les données contenues dans Wikipedia (ex. la catégorie zoologique d’un animal, la date d’investiture d’un président, la période d’une œuvre d’art) et à les rendre disponibles directement comme des données structurées et liées directement réutilisables par tout logiciel ayant accès au web. Dès lors ces données peuvent être réutilisées par d’autres applications pour leurs besoins par exemple le site de la BBC utilise les données zoologiques pour organiser et renseigner les pages de ses documentaires animaliers et augmenter l’expérience utilisateur avec des liens, des encarts et des parcours supplémentaires.

La démultiplication et redondance des données sur internet sert-elle ou dessert-elle l'adoption d'un web à plusieurs niveaux (contenu, sens, …) ?

Pour moi elle est bénéfique ne serait-ce que parce que cette redondance participe à éviter les goulets d’étranglement et les centralisations dangereuses à la disponibilité et la neutralité du web. De plus les différentes formes sous lesquelles on peut trouver une même donnée répondent aussi à différentes contraintes d’utilisation et différents utilisateurs (ex. un internaute vs. un web robot).

Comment aimeriez-vous voir le web dans 10 ans ? Comment pensez-vous qu'il sera ?

Pour être provocateur je pense que nous ne le verrons plus. Je veux dire par-là qu’il sera devenu diffus à tel point que nous interagirons avec lui à travers de multiples objets du quotidien sans même plus penser qu’il y a derrière eux toute l’architecture du web. Là où à l’origine nous avions un objet certes mondial mais visible essentiellement à travers la fenêtre du navigateur web, nous aurons une architecture mondiale reliée par et reliant de multiples ressources. Dans le même temps cet espace sera, je pense, devenu hybride en ce sens qu’on y croisera indifféremment des personnes et des agents logiciels qui interagirons dans des collectifs hybrides et dans des espaces partagés communs aux humains et aux machines.

Merci beaucoup Fabien

Des ressources pour aller plus loin

Pour aller un peu plus loin et comprendre tous les enjeux, voici le dernier livre de Fabien Gandon sur le sujet : Le web sémantique - Comment lier les données et les schémas sur le web ?

La version francophone de DBPedia : http://dbpedia.fr (et une présentation le concernant).

Quelques présentations faites par Fabien Gandon : http://www.slideshare.net/fabien_gandon/presentations

 

Fabien Gandon

Fabien Gandon

Chercheur en web sémantique auprès de l'INRIA et du CNRS. Membre du W3C.

 

Commentaires

7 comments

Portrait de Anthony

Merci pour cette analyse du web sémantique, un concept qui n'est pas évident à entendre au premier abord.

Portrait de Romain

Le marketing de contenu et le web sémantique ont en effet un bel avenir devant eux...
Il faudra à la fois réfléchir et penser les contenus pour les utilisateurs (en priorité) et seulement ensuite pour les robots en enrichissant le code html des pages web via les microdatas notamment.

Portrait de Masterprems

Super article sur la vision du sémantique. Très bon résumé également de l'évolution qu'il va falloir prendre en terme de réflexions et d'analyses sur la manière de structurer les contenus, pages, etc.
Merci pour le partage !

Portrait de Sylvain

Fort intéressant, mais un peu rapide quant aux développements concrets (je ne suis pas certain d'avoir compris le rôle de DBpedia). Dommage également que l'implication des moteurs de recherche (et en particulier des initiatives comme le knowledge Graph de Google) n'aient pas été abordée.
Mais cela reste un article et non une thèse, donc merci pour ce retour !

Portrait de Raucaz

Voilà une conclusion qui fout les jetons:
"le web sera devenu diffus à tel point que nous interagirons avec lui à travers de multiples objets du quotidien sans même plus penser qu’il y a derrière eux toute l’architecture du web."
Cela dépasse en fait les supputations sur le web de données et le web sémantique et ouvre des gouffres d'interrogations à peine mesurables.

Portrait de rédaction Web

Excellent interview à la fois très instructif.
Avant tout, il est clair que le web a évolué et tout référenceur doivent suivre cette évolution et parmi le web sémantique.

Portrait de FreeClo

This is really a very good information for me that the Semantic web.How would you define the semantic web? What is the Semantic Web according to you door label web 3.0? these questions are answered quite well. really thank you for the share.

Ajouter un commentaire