Chargement...
 

Natural Language Speech and Audio Processing

Domaine
Natural Language Speech and Audio Processing
Domain - extra
Machine learning
Année
2013
Starting
October 2013
État
Open
Sujet
Intégration de méthodes de TAL à des méthodes d'apprentissage pour l'évaluation de réponses à des questionnaires
Thesis advisor
GRAU Brigitte
Co-advisors
Ludovic Denoyer (MCF-HDR, LIP6, UPMC), co-director
Anne-Laure Ligozat (LIMSI) and Benjamin Piwowarski (LIP6), co-encadrants
Laboratory
Collaborations
Cette thèse s'inscrit dans une collaboration avec le LIP6, UPMC afin de faire collaborer spécialistes du traitement automatique de la langue et spécialistes de l'apprentissage automatique.
Abstract
Le contexte général de la thèse porte sur la compréhension de texte, et plus particulièrement sur la mise en place de méthodes capables d'évaluer si les réponses données à des questions sont correctes ou non.
Une approche développée par le LIMSI est fondée sur l'utilisation de ressources linguistiques et la structure syntaxique des phrases pour comparer deux énoncés en adaptant des méthodes de calcul de distance de la littérature.
Le LIP6 s'intéresse au problème de l'apprentissage de représentations. Le but est de s'affranchir d'un travail manuel de pré-traitement des données pour représenter de manière automatique et semi-supervisée des objets complexes tels que des textes.
L'objectif de cette thèse est d'étudier comment intégrer ces approches dans un cadre unifié dans le but de développer des techniques novatrices de représentation/compréhension du texte.
Context
Le contexte général de la thèse porte sur la compréhension de texte, et plus particulièrement sur la mise en place de méthodes capables d'évaluer si les réponses données à des questions sont correctes ou non.
Cette problématique constitue un champ de recherche assez récent comme le montre la création de campagnes d'évaluation autour de ce thème, QA4MRE1 et la tâche 7 de Semeval2 : The Joint Student Response Analysis.
Cette problématique peut être posée comme un problème d'implication textuelle : étant donné un texte T et une hypothèse H, déterminer si T => H, c'est à dire, est-ce que l'on peut raisonnablement déduire l'information portée par l'hypothèse à partir des informations contenues dans le texte et dans une base de connaissance d'arrière plan. Le problème posé par l'implication textuelle est de reconnaître différentes formulations d'une même information et les relations d'inférence entre elles.
Objectives
Une approche développée par le LIMSI est fondée sur l'utilisation de ressources linguistiques et la structure syntaxique des phrases pour comparer deux énoncés en adaptant des méthodes de calcul de distance de la littérature.
Le LIP6 s'intéresse au problème de l'apprentissage de représentations. Le but est de s'affranchir d'un travail manuel de pré-traitement des données pour représenter de manière automatique et semi-supervisée des objets complexes tels que des textes.
L'objectif de cette thèse est d'étudier comment intégrer ces approches dans un cadre unifié dans le but de développer des techniques novatrices de représentation/compréhension du texte, en profitant de l'expérience complémentaire du LIMSI (traitement du langage naturel et tâche de question/réponse), et sur celle du LIP6 (apprentissage automatique sur des données complexes).
Work program
En particulier, cette thèse abordera les points suivants  :
  • produire et faire varier les niveaux de représentation des passages : suite de termes, structure syntaxique, structure sémantique, structure discursive ;
  • étudier comment et pour lesquels de ces objets un apprentissage automatique des représentations permet d'améliorer les performances, et en particulier exploiter des techniques d'apprentissage automatique afin d'inférer des relations entre des passages ;
  • étudier en quoi la variation des niveaux de représentations données en entrée peut amener à des processus ou résultats d'apprentissage différents.
  • L'évaluation des solutions proposées sera faite par la participation aux campagnes d'évaluation existantes.
Extra information
Cette thèse s'inscrit dans un cadre applicatif de e-learning qui consiste à développer des outils pour permettre à des étudiants de s'auto-évaluer et à des enseignants de disposer d'aide à l'évaluation des étudiants et leur suivi. Cet environnement permettra de disposer de corpus différents selon les niveaux des élèves et les domaines enseignés. L'intégration des solutions proposées dans l’environnement de e-learning permettra leur évaluation par des utilisateurs.
Prerequisite
Traitement Automatique de la Langue et Apprentissage Automatique
Détails
Télécharger sujetTheseLIMSI&P62013-v2.pdf
Expected funding
Research contract
Status of funding
Expected
Candidates
Utilisateur
brigitte.grau
Créé
Jeudi 13 juin 2013 15:43:17 CEST
dernière modif.
Vendredi 18 juillet 2014 15:23:34 CEST

Fichiers joints

 filenamecrééhitsfilesize 
sujetTheseLIMSI&P62013-v2.pdf 13 Jun 2013 15:43102862.79 Kb


Ecole Doctorale Informatique Paris-Sud


Directrice
Nicole Bidoit
Assistante
Stéphanie Druetta
Conseiller aux thèses
Dominique Gouyou-Beauchamps

ED 427 - Université Paris-Sud
UFR Sciences Orsay
Bat 650 - aile nord - 417
Tel : 01 69 15 63 19
Fax : 01 69 15 63 87
courriel: ed-info à lri.fr