Chargement...
 

Natural Language Speech and Audio Processing

Domaine
Natural Language Speech and Audio Processing
Domain - extra
Année
2013
Starting
01/10/2013
État
Open
Sujet
Apprendre à traduire par renforcement
Thesis advisor
YVON François
Co-advisors
Guillaume Wisniewski
Laboratory
Collaborations
Abstract
Cette thèse porte sur l'étude de la reformulation du problème de
l'apprentissage d'un système de traduction automatique dans un cadre
d'apprentissage par renforcement plutôt que dans celui de
l'apprentissage supervisé. Cette reformulation a pour objectif de
permettre d'améliorer la qualité des systèmes de traduction en
considérant une classe plus riche de fonctions d'évaluation, mais
également de simplifier la formalisation d'un système de traduction en
unifiant la génération et l'évaluation des hypothèses de traduction.
Context
Les systèmes de traduction automatique (TA) statistique reposent sur trois
composantes : i) un processus de génération qui transforme par des réécritures
non-déterministes, une phrase source en un ensemble
combinatoire d'hypothèses de traduction ; ii) une fonction de score
qui prédit la qualité d'une hypothèse de traduction ; iii) une
procédure de recherche, qui détermine, parmi toutes les hypothèses de
traduction possibles, celle dont le score est le plus grand.
L'apprentissage de la fonction de score d'un système de traduction
s'inscrit dans le cadre général de la prédiction structurée dont
l'objectif est d'apprendre à prédire des observations se décomposant
en un ensemble d'éléments interdépendants, telles que des séquences,
des arbres ou des graphes.Cette thèse propose de traiter
le problème de la prédiction structurée
comme un problème d'apprentissage par renforcement dans lequel la
sortie résulte d'un processus de construction exécutant une
suite de décisons loc
Objectives
La généralisation de ces méthodes aux systèmes standards de TA pose de
multiples problèmes. Ainsi, la taille de l'espace de recherche d'un système
de TA est largement plus grande que celle généralement
considérée dans les problèmes d'apprentissage par renforcement ; le
passage à l'échelle sera donc un véritable défi. Par ailleurs,
contrairement aux tâches traitées dans la littérature, plusieurs séquences de décisions
permettent de générer une bonne traduction, ce qui nécessite le
développement de nouvelles méthodes d'apprentissage. D'un point de vue
linguistique, mettre en œuvre de ces méthodes nécessite de
définir des mesures d'évaluation de la qualité des
traductions au niveau des phrases, et de spécifier de nouvelles
caractéristiques discriminant les mauvaises actions des
bonnes. Un premier objectif sera d'apporter des solutions à ces problèmes.

L'apprentissage par renforcement d'un système de TA ouvre également des perspectives pour modéliser d'autres paradigmes d
Work program
1ère année :
  • Bibliographie sur les méthodes d'apprentissage structuré et l'apprentissage par renforcement
  • Implémentation et évaluation de la méthode LASSO proposée par Daumé III et al, 2006
pour apprendre un système de traduction standard à base de segments

2ème année :
  • Étude théorique de la réduction de l'apprentissage par renforcement en classification multiclasse
  • Application des résultats théoriques pour améliorer le cadre d'apprentissage.

3ème année :
  • Applications des méthodes développées au cadre des modèles hiérarchiques
  • Rédaction et défense du mémoire de thèse.

Extra information
Prerequisite
Détails
Expected funding
Institutional funding
Status of funding
Expected
Candidates
Elena Knyazeva
Utilisateur
Francois.Yvon
Créé
Mercredi 22 mai 2013 18:27:14 CEST
dernière modif.
Mercredi 22 mai 2013 18:27:14 CEST

Fichiers joints

 filenamecrééhitsfilesize 
Aucun fichier joint à cette fiche


Ecole Doctorale Informatique Paris-Sud


Directrice
Nicole Bidoit
Assistante
Stéphanie Druetta
Conseiller aux thèses
Dominique Gouyou-Beauchamps

ED 427 - Université Paris-Sud
UFR Sciences Orsay
Bat 650 - aile nord - 417
Tel : 01 69 15 63 19
Fax : 01 69 15 63 87
courriel: ed-info à lri.fr