Entre biologie, informatique et mathématiques : la bioinformatique
Un domaine de recherche qui analyse et interprète des données biologiques, au moyen de méthodes informatiques, afin de créer de nouvelles connaissances en biologie ; voici la définition de la bio-informatique reconnue par les spécialistes de cette discipline.
Cette discipline récente, à l’interface entre informatique, biologie et mathématiques, étudie l’information contenue dans les séquences des gènes et des protéines cellulaires. En cela, la bio-informatique ne doit pas être confondue avec l’utilisation générale des ordinateurs en biologie, qui peut recouvrir des domaines plus variés : analyse d’images, simulation d’écosystèmes, épidémiologie…
Génomique et post-génomique
La bio-informatique a pour but de produire de nouvelles connaissances sur le fonctionnement des cellules des organismes vivants, leur évolution, leur état sain ou pathologique… Pour ce faire, elle s’est tout d’abord limitée à la génomique, qui étudie la structure, le fonctionnement et l’évolution des génomes. Mais il est apparu que la représentation de la cellule donnée par la génomique est statique, et ne permet pas de rendre compte de son évolution au cours du temps. Ainsi est née la post-génomique, qui cherche à savoir quand et dans quelles conditions les gènes vont enclencher la fabrication de protéines, et comment les protéines fabriquées interviennent dans le fonctionnement de la cellule.
À l’origine : les banques
La bio-informatique a fait son apparition dans les années quatre-vingts, parallèlement à la création des premières banques de séquences d’ADN et de protéines. Depuis, d’énormes progrès ont été réalisés dans le domaine de la biologie moléculaire, et des techniques spécifiques ont vu le jour, ou se sont développées, pour améliorer l’acquisition et le traitement des données. Toutes ces évolutions technologiques, couplées à une diminution du coût de leur mise en œuvre, ont conduit à une production en masse des données dont les volumes ne cessent de croître, et à un traitement à haut débit du matériel biologique. En février 2003, par exemple, la banque internationale de séquences d’ADN [EMBL (Europe) / DDBJ (Japon) / GenBank (USA)] recensait 28 milliards de nucléotides séquencés, et sa taille double tous les 14 mois… Si le recours aux moyens informatiques est bien sûr indispensable pour stocker ce raz-de-marée de données, il l’est encore davantage lorsqu’il s’agit d’homogénéiser, recouper, intégrer ces informations dont la diversité ne fait qu’augmenter. Car c’est une chose de détenir des quantités de matière première, en l’occurrence ces fameuses données, encore faut-il ensuite en extraire les connaissances qu’elles peuvent nous apporter.
Les défis de la recherche
La consultation et l’enrichissement permanent des bases de données sont au centre du travail des chercheurs. En résulte un phénomène de multiplication des informations, de plus en plus nombreuses mais aussi de plus en plus variées. Il serait malvenu de s’en plaindre ! Cependant, il devient primordial de veiller à ce que la gestion même de ces informations ne soit plus l’étape limitante de cette considérable – et, de ce fait, partiellement exploitée – masse de connaissances potentielles.
La bio-informatique hérite donc d’une lourde, et double, tâche. D’une part, concevoir de nouveaux algorithmes pour continuer à traiter, si possible toujours plus vite et de façon plus fiable et performante, les résultats qui s’accumulent. D’autre part, faire en sorte que les nouvelles données soient structurées et facilement accessibles. Autant de défis qui sont à la hauteur des perspectives ouvertes par cette révolution technologique autour de l’ADN.
Newsletter
Le responsable de ce traitement est Inria. En saisissant votre adresse mail, vous consentez à recevoir chaque mois une sélection d'articles et à ce que vos données soient collectées et stockées comme décrit dans notre politique de confidentialité
Niveau de lecture
Aidez-nous à évaluer le niveau de lecture de ce document.
Votre choix a été pris en compte. Merci d'avoir estimé le niveau de ce document !