- Virginie Thion-Goasdoué, CNAM (France)
- La société Data-Publica (France)
- Petri Kola , Media Lab Helsinki de l'université Aalto (Finlande)
Abstract
Le nombre de sources de données structurées disponibles sur le Web est en forte croissance aboutissant à un espace de données liées (Linked Open Data) de milliards d’assertions RDF (13 milliards en 2010). Différentes approches permettent d’établir automatiquement des liens sémantiques entre les données et en particulier des liens d’identité (réconciliation de références). Certaines s’appuient sur des connaissances déclarées par un expert. Or, ces connaissances sont rarement disponibles. Il s’agira dans cette thèse de définir une approche permettant de les découvrir automatiquement en s’adaptant aux caractéristiques des données (e.g. hétérogénéité, hypothèse du nom unique). L’incertitude de ces connaissances devra être modélisée et intégrée au processus de réconciliation. De plus, la plupart des approches supposent que toutes les données sont décrites conformément à une ontologie (OWL), ce qui n’est pas garanti dans le LOD. L’approche développée devra tenir compte de cette difficulté.
Context
Objectives
Work program
Extra information
Prerequisite
- Représentation des connaissances, bases de données
- Technologies du Web sémantique (RDF, OWL), Java
Détails
Expected funding
Institutional funding
Status of funding
Expected
Candidates
Danai Symeonidou en stage de M2R "Programme Franco-HELLENIQUE" entre l'Université de Crète et l'Université Paris-Sud 11.
Utilisateur
Créé
Jeudi 19 mai 2011 17:52:09 CEST
dernière modif.
Mercredi 09 novembre 2011 14:51:40 CET
Fichiers joints
filename
créé
hits
filesize
Aucun fichier joint à cette fiche
Connexion
Ecole Doctorale Informatique Paris-Sud
Directrice
Nicole Bidoit Assistante
Stéphanie Druetta Conseiller aux thèses
Dominique Gouyou-Beauchamps
ED 427 - Université Paris-Sud
UFR Sciences Orsay
Bat 650 - aile nord - 417
Tel : 01 69 15 63 19
Fax : 01 69 15 63 87
courriel: ed-info à lri.fr