Ce projet s'inscrit dans le thème des systèmes de dialogue apprenant de l'utilisateur et à l'utilisateur. Si d'une part les systèmes de dialogue en langue naturelle (écrite ou parlée) et d'autre part les systèmes apprenant à base d'apprentissage actif ont fait l'objet de très nombreux travaux, peu ont encore tenté de réunir ces deux champs d'activités.Le cadre applicatif dépendra des projets en cours mais essentiellement différents cadres tels que l'interfaçage avec un domaine formel (analyses statistiques), l'apprentissage de comportements sociaux,la réalisation de tâches de renseignements, etc. serviront de base d'expériences.
Context
Ce projet s'inscrit dans le thème des systèmes de dialogue apprenant la réalisation d'une tâche par l'interaction avec un utilisateur expert. Il s'agit de concevoir un système de dialogue capable d'apprendre à réaliser une tâche et que dans ce contexte il apprenne à interagir pour augmenter ses connaissances. Au-delà de l'apprentissage d'une tâche, il s'agit d'apprendre à modéliser la prise de décision quant au comportement optimal à adopter pour obtenir les informations manquantes à la réalisation d'une tâche.
Si les systèmes de dialogue en langue naturelle (écrite ou parlée) et les systèmes à base d'apprentissage actif ont fait l'objet de très nombreux travaux, peu ont tenté de réunir ces deux aspects. Dans ce cadre, de nombreuses questions se posent et notamment quelles sont les limites de l'apprentissage par l'interaction ? Quel amorçage minimal est nécessaire ?
Pour restreindre le champ d'étude, les cadres applicatifs porteront sur l'acquisition de compétences statistiques
Objectives
L'objectif de cette thèse est de proposer une approche permettant d'apprendre à modéliser le comportement d'un système de dialogue pour apprendre à réaliser une tâche.
On partira de formes de raisonnement par induction et par analogie minimales de manière à étudier les limites de ces approches pour qu'un système apprenne à apprendre une tâche et un domaine par l'interaction. Il conviendra également de proposer un modèle pour discriminer les informations pertinentes à extraire des énoncés en langue naturelle produits dans un cadre interactif. Cette discrimination résultera d'un apprentissage validé par l'interaction avec l'utilisateur expert.
L'analyse des énoncés dans un cadre interactif pose le problème de la variation linguistique et surtout des phénomènes de références (anaphores et déictiques). L'apprentissage doit intégrer la résolution de ses phénomènes et sera aussi validé par l'interaction avec l'utilisateur expert.
Work program
Année 1 :
- état de l'art (dialogue, apprentissage actif et modèle d'apprentissage à base d'induction et d'analogie)
- à partir d'un premier prototype de dialogue implémentant un modèle à base d'induction et un à base d'analogie pour l'apprentissage, il conviendra d'analyser et évaluer précisément l'état d'évolution des systèmes afin de proposer des adaptations et évolutions des modèles :
Année 2 :
- utilisation de l'interaction pour détecter et traiter les cas d'échecs (éventuellement par le biais de score de confiance sur les décisions et acquis précédents)
- généralisation de l'apprentissage
- identification de l'expert le plus approprié pour expliquer à l'utilisateur ce que le système sait ne pas savoir faire (extension du contexte)
Année 3 :
- validation de l'approche sur un autre langage formel de même type (commandes shell, etc.)
- rédaction de la thèse
- stage doctoral à l'étranger si état d'avancement de rédaction de la thèse au bout de 6 mois satisfaisant