Web Sémantique

De documentation.
Aller à : Navigation, rechercher

Le web sémantique est le web des données. Il est souvent présenté comme le web 3.0 et permet aux moteurs de comprendre la signification des informations qu'on leur demande et de nous les délivrer.

Le terme a été inventé par Tim Berners-Lee, le co-inventeur du Web et directeur du W3C, qui coordonne les propositions de standards du web sémantique. Tim Bernes-Lee décrit ainsi les fonctions du web sémantique : "Le Web sémantique va permettre de relier les données qui sont dispersées dans des textes, des bases de données, des feuilles de calcul partout dans le monde. Le Web a permis de créer des liens entre plusieurs documents, mais il faut maintenant inventer des outils beaucoup plus puissants pour que les programmes informatiques puissent lire ou manipuler les données à l'intérieur de ces documents. Ce n'est pas un projet centralisé pour tout comprendre. Le but est de relier, de permettre à la communauté de donner du sens aux informations".


Sommaire

Techniques

RDF

Resource Description Framework (RDF).

RDF est le langage de base, permettant d’exprimer des relations sémantiques de type « sujet, prédicat, objet ». Il peut être utilisé pour l’expression de métadonnées d’un document, ou la description d’une entité comme un objet touristique. C'est un modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions.

Voir:

OWL

Web Ontology Language (OWL).

OWL est un langage de représentation des connaissances construit sur le modèle de données de RDF. Il fournit les moyens pour définir des ontologies web structurées.

OWL est un langage d’ontologie riche, permettant la déclaration en RDF de classes d’entités, de types d’attributs qualitatifs ou quantitatifs, de relations entre ces entités, ainsi que des contraintes reliant ces différents éléments. Il est basé sur la recherche effectuée dans le domaine de la logique de description.

Le langage OWL peut-être vu en quelque sorte comme un format de fichier pour certaines logiques de description. Il permet de décrire des ontologies, c'est-à-dire qu'il permet de définir des terminologies pour décrire des domaines concrets. Une terminologie se constitue de concepts et de propriétés (aussi appelés « rôles » en logiques de description). Un domaine se compose d'instance de concepts.

Voir:

Espaces sémantiques

Friend of a friend (FOAF)

Web_Sémantique:FOAF

Corporate Friends of Friends (FOAFCorp)

FOAF Corp est une extension de FOAF au domaine des entreprises.

Semantically-Interlinked Online Communities (SIOC)

SIOC est un vocabulaire permettant de décrire des objets couramment utilisés sur les sites communautaires et leurs relations. Il est défini en utilisant RDF. SIOC est une application du web sémantique pour décrire des blogs, des forums, des wikis..

Voir:

  • SIOC sur Wikipedia-Fr

Simple Knowledge Organization System (SKOS)

SKOS (Système simple d'organisation des connaissances) est une famille de langages formels permettant une représentation standard des thésaurus, classifications ou tout autre type de vocabulaire contrôlé et structuré. Construit sur la base du modèle de données standard RDF, son principal objectif est de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre du Web sémantique. SKOS est, depuis le 18 août 2009, une recommandation du W3C.

SKOS est un langage RDF en cours de finalisation, plus particulièrement adapté à la représentation des thésaurus, taxonomies et autres types similaires de vocabulaires structurés. SKOS est utilisé pour l’intégration à l’ontologie de thésaurus comme

Voir:

  • Définition formelle de SKOS sur le W3C
  • SKOS sur Wikipedia-FR
  • Présentation du répertoire Rameau de la BNF (data.bnf.fr) transcrit en langage SKOS : [1]
    • La version de RAMEAU accessible contient 157280 concepts, dont 96825 correspondant à des noms communs, 51646 noms géographiques, 2976 personnes, 3419 collectivités, 2296 titres et 123 subdivisions chronologiques.

Des datasets en SKOS:

Exemples d'usages:

Patrimoine Culturel (cultural heritage)

norme ISO 21127: information et documentation -- Une ontologie de référence pour l'échange d'informations du patrimoine culturel.


Géopolitique

L’ontologie géopolitique permet à la FAO (Organisation des Nations Unies pour l'alimentation et l'agriculture) et à ses partenaires de disposer d’une base de référence fiable en matière de données géopolitiques, car elle gère des termes en de multiples langues (anglais, français, espagnol, arabe, chinois, russe et italien), utilise des systèmes de codification normalisés (ONU, ISO, FAOSTAT, AGROVOC, etc.), indique les relations entre territoires (frontières terrestres, appartenance à un groupe, etc.) et suit les changements historiques => Ontologie géopolitique de la FAO (OWL, RDF).

Géographique, Topographie

Ontologie topographique par l'IGN

officiel géographique (COG) de l'INSEE

Tourisme

L’e-tourisme représente déjà la première activité commerciale sur le Web avec plus de 40% en valeur des transactions e-commerce réalisées en 2004.

Et pourtant peu de schéma sémantique existent et normalise les ontologies du tourisme.

  • Projet Eiffel - eTourisme et Web Sémantique
  • projet HARMONISE (FIXME: to search about)
  • projet Hi-Touch
  • ACCO - Accomodation Ontology A Web vocabulary for hotels, vacation homes, camping sites, and other accommodation offers for e-commerce
  • Divers
    • Le «Thésaurus du Tourisme et des Loisirs» par l’OMT (Organisation Mondiale du Tourisme) www.wtoelibrary.org www.world-tourism.org
      • document de présentation 2006.
      • Outil d'indexation et de recherche bibliographique, ce thesaurus comprend 8185 termes organisés en 20 champs sémantiques. Il comporte pour chaque langue une liste alphabétique, une liste hierarchique, une liste par groupe ... (en livre à 75€ sur ubifrance)
      • Trouvé une [www.turismorural.org.br/download/20120219151302.pdf version en ligne de 2005]
    • le GEMET (FIXME: to search about)
    • le thésaurus trilingue de l’UNESCO ulcc.ac.uk databases.unesco.org
    • Format TourinFrance (FIXME: introuvable sur les sites du gouv fr)
    • ITM (Intelligent Topic Manager) de la société Mondeca. (Topic Maps)
    • le moteur de raisonnement CoGITaNT (logiciel libre) qui utilise un langage de graphes proche des représentations internes d’ITM et qui présente de bonnes qualités en terme de performance et de passage à l’échelle. De plus, un éditeur graphique associé à CoGITaNT permet de construire (et de vérifier la cohérence) ces règles : CoGUI.

Autres

Catalogues d'ontologies:

Outils personnels
Espaces de noms

Variantes
Actions
Navigation
Catégories
Boîte à outils