Lisa ALLALI Bio-Informatique formelle M1 MPRI 2004/2005 Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée Modélisation et.

Transcript Lisa ALLALI Bio-Informatique formelle M1 MPRI 2004/2005 Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée Modélisation et.

Lisa ALLALI Bio-Informatique formelle M1 MPRI 2004/2005 Présentation de la thèse de Julien ALLALI soutenue le 23 décembre 2004 à Marne la Vallée

Modélisation et comparaison de la structure secondaire de l’ARN

Sous la direction de Maxime Crochemore et Marie France Sagot

Présentation de la structure des ARN

Presentation

Les ARN sont des séquences mono-brin de nucléotides. Dans la cellule où ils exercent de nombreux rôles, ils ne restent pas sous forme linéaire. Un ARN se

replie

sur lui-même et crée des liaisons entre certains de ses nucléotides. Les bases qui ne sont pas liées sont dites “

non appariées

”.

Les 3 formes de l’ARN sont la structure

primaire

: séquence linéaire de nucléotides la structure

secondaire

la structure

tertiaire

: disposition des nucléotides sur le plan : disposition des nucléotides dans l’espace La conformation

spaciale

de l’ARN est

déterminée

et directement

liée

à la

fonction

de l’ARN dans la cellule. La structure tertiaire apparait donc naturellement comme la plus adaptée pour étudier la fonction d’un ARN. Cependant il est admis que 2 ARN ayant une

structure secondaire proche

auront une

fonction moléculaire

relativement

proche

La structure secondaire Les éléments de la structure secondaire

Une

hélice

est une suite contiguë de liaisons entre 2 nucléotides

La structure secondaire Les éléments de la structure secondaire

Une

hélice

est une suite contiguë de liaisons entre 2 nucléotides Une

boucle terminale

non appariées formant une boucle à l’extremité d’une hélice est une suite de bases

La structure secondaire Les éléments de la structure secondaire

Une

hélice

est une suite contiguë de liaisons entre 2 nucléotides Une

boucle terminale

non appariées formant une boucle à l’extremité d’une hélice est une suite de bases Une

boucle multiple

d’au moins 3 hélices est le point de rencontre

La structure secondaire Les éléments de la structure secondaire

Une

hélice

est une suite contiguë de liaisons entre 2 nucléotides Une

boucle terminale

non appariées formant une boucle à l’extremité d’une hélice est une suite de bases Une

boucle multiple

d’au moins 3 hélices est le point de rencontre Une

boucle interne

relie 2 hélices

La structure secondaire Les éléments de la structure secondaire

Une

hélice

est une suite contiguë de liaisons entre 2 nucléotides Une

boucle terminale

non appariées formant une boucle à l’extremité d’une hélice est une suite de bases Une

boucle multiple

d’au moins 3 hélices est le point de rencontre Une

boucle interne

relie 2 hélices Un

renflement

est une “demie” boucle interne

La structure secondaire Les éléments de la structure secondaire

Une

hélice

est une suite contiguë de liaisons entre 2 nucléotides Une

boucle terminale

non appariées formant une boucle à l’extremité d’une hélice est une suite de bases Une

boucle multiple

d’au moins 3 hélices est le point de rencontre Une

boucle interne

relie 2 hélices Un

renflement

est une “demie” boucle interne Une

tige

dénote une suite d’hélice(s)/boucle(s) interne(s)/(renflement(s)

La structure tertiare – repliement de l’ARN

Questions

Ce qui nous intéresse ici est la

comparaison

des structures secondaires de l’ARN pour chercher à prédire la fonction d’un ARN inconnu grâce à sa ressemblance avec un ARN connu. Mais

que signifie “être proche”

pour deux ARN ? Comment

automatiser

cette reconnaissance de ressemblance ? C’est ce que nous allons essayer de comprendre pour trouver une réponse satisfaisante à la question de la comparaison entre 2 ARN.

Modélisations existantes Vers une formalisation satisfaisante

Séquences annotées par des arcs

Séquences de type imbriqué représentant un ARN de transfert Structure

Secondaire

Structure

primaire

Séquences annotées par des arcs

Séquences de type imbriqué représentant un ARN de transfert Structure

Secondaire

Structure

primaire

Séquence annotée modélisant la structure secondaire

Séquences annotées par des arcs

Les informations

conservées

par les séquences anotées sont aussi bien la suite de

nucléotides

composent l’ARN que sa

structure

(helices boucles etc...).

qui Toutes ces informations sont-elles nécessaires ?

Il apparait que c’est la

structure

, plus que la sequence de nucléotides qui

détermine la fonction

d’un ARN (même si ces deux aspects ne peuvent être totalement séparés). Ainsi on peut imaginer de nouvelles représentations des ARN qui s’intéresseraient de façon plus accentuée à la structure pour elle-même.