Cette thèse porte sur l'étude de la reformulation du problème de
l'apprentissage d'un système de traduction automatique dans un cadre
d'apprentissage par renforcement plutôt que dans celui de
l'apprentissage supervisé. Cette reformulation a pour objectif de
permettre d'améliorer la qualité des systèmes de traduction en
considérant une classe plus riche de fonctions d'évaluation, mais
également de simplifier la formalisation d'un système de traduction en
unifiant la génération et l'évaluation des hypothèses de traduction.
Context
Les systèmes de traduction automatique (TA) statistique reposent sur trois
composantes : i) un processus de génération qui transforme par des réécritures
non-déterministes, une phrase source en un ensemble
combinatoire d'hypothèses de traduction ; ii) une fonction de score
qui prédit la qualité d'une hypothèse de traduction ; iii) une
procédure de recherche, qui détermine, parmi toutes les hypothèses de
traduction possibles, celle dont le score est le plus grand.
L'apprentissage de la fonction de score d'un système de traduction
s'inscrit dans le cadre général de la prédiction structurée dont
l'objectif est d'apprendre à prédire des observations se décomposant
en un ensemble d'éléments interdépendants, telles que des séquences,
des arbres ou des graphes.Cette thèse propose de traiter
le problème de la prédiction structurée
comme un problème d'apprentissage par renforcement dans lequel la
sortie résulte d'un processus de construction exécutant une
suite de décisons loc
Objectives
La généralisation de ces méthodes aux systèmes standards de TA pose de
multiples problèmes. Ainsi, la taille de l'espace de recherche d'un système
de TA est largement plus grande que celle généralement
considérée dans les problèmes d'apprentissage par renforcement ; le
passage à l'échelle sera donc un véritable défi. Par ailleurs,
contrairement aux tâches traitées dans la littérature, plusieurs séquences de décisions
permettent de générer une bonne traduction, ce qui nécessite le
développement de nouvelles méthodes d'apprentissage. D'un point de vue
linguistique, mettre en œuvre de ces méthodes nécessite de
définir des mesures d'évaluation de la qualité des
traductions au niveau des phrases, et de spécifier de nouvelles
caractéristiques discriminant les mauvaises actions des
bonnes. Un premier objectif sera d'apporter des solutions à ces problèmes.
L'apprentissage par renforcement d'un système de TA ouvre également des perspectives pour modéliser d'autres paradigmes d
Work program
1ère année :
Bibliographie sur les méthodes d'apprentissage structuré et l'apprentissage par renforcement