Chargement...
 

Interaction

Domaine
Interaction
Domain - extra
Bioinformatics
Année
2010
Starting
Septembre
État
Open
Sujet
Visualisation interactive pour l'assemblage et la fouille de données visuelle en génomique bactérienne
Thesis advisor
FEKETE Jean-Daniel
Co-advisors
Stéphane Descorps-Declère (Institut Pasteur)
Laboratory
Collaborations
Abstract
Depuis le début des années 2000, la vitesse de séquençage de génomes a augmenté d’un facteur 15,000!. Cependant, les méthodes de reconstruction et d’annotation de ces génomes n’ont pas suivies.
L'objectif de cette thèse sera donc de fournir des outils visuels permettant l'assemblage interactif de génomes complets à partir de prétraitements et l'étude de la variabilité génomique, en particulier appliquée à des populations bactériennes.

Context
La découverte, en 1977, par Frederick Sanger du principe de séquençage de l'ADN à donnée naissance à une discipline scientifique majeur: la génomique. Dès lors, celle-ci c'est intéressée à étudier la biologie des organismes par l'étude de leurs génomes. La technologie permettant d'accéder à la séquence des macromolécules d'ADN a très peu évoluée pendant 20 ans. Il a fallut attendre les années 2000 et des avancées déterminantes en matière de biochimie et de nanotechnologie pour permettre la mise au point d'une nouvelle génération de séquenceurs offrant la possibilité de paralléliser un très grand nombre de réactions sur un support moléculaire.
Les effets conjugués de l'accroissement de la capacité de séquençage, des temps de production réduit, et du cout moindre ont favorisé le développement de programmes de séquençage portant sur des populations d'individus permettent d'étudier la diversité génétique existant entre et au sein d'espèces.
Objectives
Parmi l'ensemble des problèmes nouveaux nécessitant le développement de nouvelles approches analytiques, il nous est apparu important de traiter deux problèmes qui nous semble fondamentaux : l'assemblage et détection de variabilités dans des populations d'individus. S'agissant d'assemblage ou des détections de variabilités, de nombreuses analyses peuvent être accomplies à l'aide d'outils automatiques mais certaines étapes nécessitent l'expertise et le jugement humain. Pour ces étapes clés, la visualisation augmente la capacité de l'utilisateur à conduire des analyses complexes.
L'objectif de cette thèse est de fournir des outils visuels permettant l'assemblage interactif de génomes complets et l'étude de la variabilité génomique, en particulier appliquée à des populations bactériennes.
Work program
Dans un premier temps, la thèse focalisera son attention sur l'assemblage de génomes complets. L'assemblage consiste à ordonner et fusionner un ensemble de fragments génomiques extrait de façon aléatoire (les reads) en une liste de séquences plus grandes continues et contiguës si possible (les contigs).
Nous nous proposons de développer une représentation visuelle innovante permettant à un utilisateur de manipuler de très gros graphes de ces contigs indirectement et de façon interactive.
L'idée est de permettre de valider certains problèmes visibles à partir du graphe à l'aide d'outils interactifs d'aide à la décision.
Dans un second temps, la thèse portera ses efforts sur la conception d'un système de visualisation capable de travailler sur des listes de génomes constituant des populations afin de comparer des génomes entre eux.
Extra information
La thèse se déroulera à l'INRIA Saclay et à l'Institut Pasteur.
Prerequisite
Le candidat devra être familier avec les concepts biologiques sous-jacents et, autant que possible, avoir déjà réalisé des interfaces et idéalement des visualisations interactives.
Détails
Expected funding
Institutional funding
Status of funding
Expected
Candidates
Utilisateur
Créé
Samedi 17 avril 2010 00:34:28 CEST
dernière modif.
Samedi 17 avril 2010 00:42:46 CEST

Fichiers joints

 filenamecrééhitsfilesize 
Aucun fichier joint à cette fiche


Ecole Doctorale Informatique Paris-Sud


Directrice
Nicole Bidoit
Assistante
Stéphanie Druetta
Conseiller aux thèses
Dominique Gouyou-Beauchamps

ED 427 - Université Paris-Sud
UFR Sciences Orsay
Bat 650 - aile nord - 417
Tel : 01 69 15 63 19
Fax : 01 69 15 63 87
courriel: ed-info à lri.fr