Entre biologie, informatique et mathématiques : la bioinformatique

Bioinformatique Biologie Vivant

Pour une discipline qui ne compte qu'une vingtaine d'années d'existence, la bioinformatique fait beaucoup parler d'elle. Son développement a suivi l'augmentation exponentielle de la quantité de données provenant, entre autres, des programmes de séquençage systématique de génomes. Si, dans un premier temps, la priorité fut de stocker ce flot d'informations, le rôle de la bioinformatique a rapidement évolué. Il s'agit à présent de transformer ces données brutes en connaissances. Et ce n'est pas une mince affaire !

Un domaine de recherche qui analyse et interprète des données biologiques, au moyen de méthodes informatiques, afin de créer de nouvelles connaissances en biologie ; voici la définition de la bio-informatique reconnue par les spécialistes de cette discipline.

Séquençage automatique d’ADN (image écran INSERM).

Cette discipline récente, à l’interface entre informatique, biologie et mathématiques, étudie l’information contenue dans les séquences des gènes et des protéines cellulaires. En cela, la bio-informatique ne doit pas être confondue avec l’utilisation générale des ordinateurs en biologie, qui peut recouvrir des domaines plus variés : analyse d’images, simulation d’écosystèmes, épidémiologie…

Génomique et post-génomique

La bio-informatique a pour but de produire de nouvelles connaissances sur le fonctionnement des cellules des organismes vivants, leur évolution, leur état sain ou pathologique… Pour ce faire, elle s’est tout d’abord limitée à la génomique, qui étudie la structure, le fonctionnement et l’évolution des génomes. Mais il est apparu que la représentation de la cellule donnée par la génomique est statique, et ne permet pas de rendre compte de son évolution au cours du temps. Ainsi est née la post-génomique, qui cherche à savoir quand et dans quelles conditions les gènes vont enclencher la fabrication de protéines, et comment les protéines fabriquées interviennent dans le fonctionnement de la cellule.

À l’origine : les banques

La bio-informatique a fait son apparition dans les années quatre-vingts, parallèlement à la création des premières banques de séquences d’ADN et de protéines. Depuis, d’énormes progrès ont été réalisés dans le domaine de la biologie moléculaire, et des techniques spécifiques ont vu le jour, ou se sont développées, pour améliorer l’acquisition et le traitement des données. Toutes ces évolutions technologiques, couplées à une diminution du coût de leur mise en œuvre, ont conduit à une production en masse des données dont les volumes ne cessent de croître, et à un traitement à haut débit du matériel biologique. En février 2003, par exemple, la banque internationale de séquences d’ADN [EMBL (Europe) / DDBJ (Japon) / GenBank (USA)] recensait 28 milliards de nucléotides séquencés, et sa taille double tous les 14 mois… Si le recours aux moyens informatiques est bien sûr indispensable pour stocker ce raz-de-marée de données, il l’est encore davantage lorsqu’il s’agit d’homogénéiser, recouper, intégrer ces informations dont la diversité ne fait qu’augmenter. Car c’est une chose de détenir des quantités de matière première, en l’occurrence ces fameuses données, encore faut-il ensuite en extraire les connaissances qu’elles peuvent nous apporter.

Les défis de la recherche

La consultation et l’enrichissement permanent des bases de données sont au centre du travail des chercheurs. En résulte un phénomène de multiplication des informations, de plus en plus nombreuses mais aussi de plus en plus variées. Il serait malvenu de s’en plaindre ! Cependant, il devient primordial de veiller à ce que la gestion même de ces informations ne soit plus l’étape limitante de cette considérable – et, de ce fait, partiellement exploitée – masse de connaissances potentielles.

La bio-informatique hérite donc d’une lourde, et double, tâche. D’une part, concevoir de nouveaux algorithmes pour continuer à traiter, si possible toujours plus vite et de façon plus fiable et performante, les résultats qui s’accumulent. D’autre part, faire en sorte que les nouvelles données soient structurées et facilement accessibles. Autant de défis qui sont à la hauteur des perspectives ouvertes par cette révolution technologique autour de l’ADN.

Niveau de lecture

Aidez-nous à évaluer le niveau de lecture de ce document.

Votre choix a été pris en compte. Merci d'avoir estimé le niveau de ce document !

Isabelle Quinkal

Journaliste scientifique.

Voir le profil

François Rechenmann

Directeur de recherche Inria, spécialiste de bio-informatique.

Voir le profil