Approche algorithmique pour la prédiction de la structure secondaire des ARN
Algorithmic approach for RNA secondary structure prediction

URL d'accès : http://ori-nuxeo.univ-lille1.fr/nuxeo/site/esupver...

Auteur(s):  Perriquet, Olivier
Date de soutenance : 2003
Éditeur(s) : Université Lille1 - Sciences et Technologies 

Langue : Français
Directeur(s) de thèse :  Touzet, Hélène ; Dauchet, Max
Classification : Informatique, information, généralités, Sciences de la vie, biologie, biochimie
Discipline : Informatique
Mots-clés : ARN -- Structure secondaire
Algorithmes prédictifs
Programmation dynamique --
Bioinformatique --

Résumé : Les travaux présentés dans cette thèse se placent dans le cadre des recherches informatiques liées à la génétique (bioinformatique) et concernent plus précisément la prédicition de la structure secondaire des ARN. Les Acides RiboNucléiques- ARN - sont des polymères qu'on peut considérer comme des longues chaînes de bases symbolisées par les lettres A, U, C, G. Ces chaînes se replient dans l'espace de manière spécifique à chaque séquence et adoptent une forme globulaire compacte. La modélisation de la structure peut être hierarchisée en niveaux de précision croissante: structure primaire (la séquence des bases), secondaire/tertiaire (le graphe des appariements entre bases), tridimensionnelle (la forme spatiale de la molécule). La prédiction de la structure tridimensionnelle étant hors de portée à l'heure actuelle pour des molécules de cette taille, les méthodes de prédiction se sont majoritairement concentrées sur la structure secondaire. Il existe principalement deux types d'approche selon qu'on considère une unique séquence ou un ensemble de séquences homologues. La première approche s'appuie sur le principe thermodynamique affirmant que la molécule doit être dans son état d'énergie libre minimal. La seconde tire parti, à l'aide d'un grand nombre de séquences, des mutations qu'elles ont subi au cours de l'évolution. Ces méthodes sont mal adaptées au contexte actuel où l'on découvre de nouvelles petites familles d'ARN structurés. Des méthodes hybrides procédant des deux approches ont donc vu le jour pour pouvoir s'appliquer à un petit nombre de séquences. CARNAC, la méthode que nous proposons, appartient à ce nouveau groupe d'algorithmes. Nous montrons où elle se place par rapport à toutes ces méthodes et nous donnons des résultats expérimentaux.



Cité Scientifique BP 30155 59653 VILLENEUVE D'ASCQ CEDEX Tél.:+33 (0)3 20 43 44 10