À propos du séquençage de génomes

Bioinformatique Vivant Santé

Entre le début des années 1990 et aujourd’hui, l’efficacité des techniques de séquençage de l’ADN, comptée en nombre de nucléotides séquencés par jour, a été multipliée par un million. Ces extraordinaires progrès techniques ont des retombées scientifiques importantes. François Rechenmann nous en parle dans ce 27^e épisode du podcast audio.

Ecoutez l'interview de François Rechenmann

Télécharger le podcast

François Rechenmann

Que signifie séquencer le génome ? Quel est l’intérêt de ce séquençage ? Autant de questions auxquelles le chercheur, bioinformaticien, tente d’apporter une réponse. En effet, la connaissance de la séquence génomique offre potentiellement la connaissance des protéines de l’organisme.

Il s’agit de rechercher les gènes dont la séquence porte l’information nécessaire à la cellule pour synthétiser une ou plusieurs protéines. Les bioinformaticiens ont développé des méthodes spécifiques pour identifier les gènes sur une séquence, mais il n’existe toujours pas d’algorithme exact pour résoudre ce problème particulièrement difficile sur les séquences génomiques de mammifères.

La séquence d’un gène permet de déterminer la succession des acides aminés de la ou des protéines correspondantes, mais ne donne pas leurs fonctions. Là encore, la bioinformatique apporte des éléments de réponse, essentiellement en proposant des méthodes pour comparer des séquences à caractériser avec des séquences connues, accessibles dans des bases de données via Internet.

Ainsi, bien que la séquence génomique humaine soit connue depuis près de 10 ans, le travail d’identification et de caractérisation de l’ensemble des protéines humaines est bien loin d’être abouti.

Cependant, l’accroissement des vitesses de séquençage et la diminution corrélative des coûts permettent d’envisager d’autres approches. Ainsi, le projet de l’International Cancer Genome Consortium (ICGC) consiste à obtenir la séquence de génomes extraits de cellules cancéreuses et non cancéreuses auprès de 500 patients et ce, pour chacun des 50 types de cancers étudiés. À raison de deux séquençages par patient, ce sont donc 50 000 séquençages de génomes humains qui sont prévus !

Le partenaire français de l’ICGC dans ce projet est l’INCa, l’Institut National du Cancer, qui coordonne les travaux d’analyse relatifs à deux types de cancers, affectant le foie et le sein.

Comparer les séquences entre elles servira à identifier et caractériser leurs différences, afin d’établir la carte des mutations génomiques susceptibles d’être à l’origine de chaque type de cancer.

À l’évidence, ce travail requiert des moyens et des méthodes informatiques adéquats, tant pour gérer la masse des données et des résultats que pour effectuer les comparaisons massives, caractériser les différences à l’aide de méthodes statistiques adaptées — sont-elles significatives ? ne résultent-elles pas d’erreurs de séquençage ? —, et visualiser les résultats sous des formes à la fois synthétiques et parlantes.

À l’issue du projet commencera un délicat travail d’interprétation, dont il est attendu qu’il puisse conduire à de nouveaux outils et stratégies diagnostiques et thérapeutiques.

Newsletter

Le responsable de ce traitement est Inria. En saisissant votre adresse mail, vous consentez à recevoir chaque mois une sélection d'articles et à ce que vos données soient collectées et stockées comme décrit dans notre politique de confidentialité

[mo-optin-form id="AeywyMkDBP"]

Niveau de lecture

Aidez-nous à évaluer le niveau de lecture de ce document.

Votre choix a été pris en compte. Merci d'avoir estimé le niveau de ce document !

François Rechenmann

Directeur de recherche Inria, spécialiste de bio-informatique.

Voir le profil

Joanna Jongwane

Rédactrice en chef d'Interstices, Direction de la communication d'Inria

Voir le profil