© ANIRUDH via Unsplash, CC0
Étudier et comprendre les sucres du vivant pourrait permettre de mieux appréhender les mécanismes en jeu lors de l'infection des cellules par certains virus comme le SARS-CoV-2...
Newsletter
Le responsable de ce traitement est Inria. En saisissant votre adresse mail, vous consentez à recevoir chaque mois une sélection d'articles et à ce que vos données soient collectées et stockées comme décrit dans notre politique de confidentialité
Niveau de lecture
Aidez-nous à évaluer le niveau de lecture de ce document.
Votre choix a été pris en compte. Merci d'avoir estimé le niveau de ce document !
Frédérique Lisacek
Maître d'enseignement et de recherche à l'Université de Genève, responsable du "Proteome Informatics Group" au sein de l'institut suisse de Bioinformatique (en anglais Swiss Institute of Bioinformatics, SIB).
Modifications des protéines
Afin de comprendre les interactions de SARS-CoV-2 avec sa cible, précisons l’état des connaissances en matière de protéines. Une protéine est le résultat de la traduction d’un gène (ARN messager). Elle est fabriquée sous la forme d’une chaîne de plusieurs centaines d’acides aminés – en moyenne – puis se replie en trois dimensions. Une fois cette traduction terminée, tout autre événement impliquant cette protéine, est qualifié de post-traductionnel. En particulier, des groupes chimiques (phosphate, acétyle, etc.) sont ajoutés par des enzymes spécialisées sur un acide aminé spécifique, que l’on désigne comme site de modification dite « post-traductionnelle » (MPT). La compréhension de l’action de ces enzymes et de leurs conséquences fonctionnelles est actuellement un défi majeur dans l’étude des protéines. On observe expérimentalement la présence de ces MPT sans être en mesure d’expliquer clairement pourquoi les enzymes modificatrices agissent sur tel ou tel site (d’un à plusieurs dizaines), parfois en compétition (pour le même site), ou en coopération (sur des sites voisins). Les hypothèses courantes et partiellement vérifiées suggèrent que les MPT enrichissent les fonctions des protéines, ou qu’elles modulent, voire répriment leur activité. Dans la plupart des cas, chaque MPT implique l’ajout d’un même et unique groupe chimique et est désignée par un nom qui comporte une indication sur la nature de ce groupe. L’ajout d’un phosphate est une phosphorylation, d’un acétyle, une acétylation, d’un méthyle, une méthylation, etc. Il existe cependant une MPT, connue sous le nom de glycosylation, qui implique l’attachement de molécules de sucres, également appelées glycanes et qui sont extrêmement variables chimiquement. On s’accorde à penser qu’il y a au minimum des dizaines de milliers de molécules de sucres possibles mais on ignore encore s’il peut y en avoir des centaines de milliers ou même des millions. La glycosylation produit donc des protéines « glycosylées », aussi désignées comme des « glycoprotéines ».
Glycoprotéines et virus
La plupart du temps, les manuels de biologie ou même les articles de recherche utilisent le terme « glycoprotéine » sans faire référence aux sucres qui y sont attachés mais plutôt en englobant la sous-catégorie des protéines actives à la surface des cellules. Par exemple, pour les virus, les protéines de surface sont souvent appelées « gp-xxx », comme la gp120 du VIH (virus du SIDA), où « gp » est l’abréviation de « glycoprotéine ». En 2003, l’expression « bouclier de sucres » (« glycan shield ») a été proposée pour décrire la forte densité de sucres/glycanes détectée sur la gp160 du VIH-1. Du côté de l’hôte, il a été démontré que certains récepteurs (protéines à la surface des cellules qui contrôlent la communication intercellulaire) se lient aux glycanes virales. De nombreux virus déploient un tel bouclier mais les représentations courantes ne rendent pas compte de cette situation. Pourtant, l’année 2020 pourrait avoir marqué un tournant. La pandémie de COVID-19 et les trois prix Nobel de médecine ont fourni une occasion unique de mettre en évidence l’importance de la glycosylation des protéines virales et un plus grand nombre de chercheurs imaginent désormais des protéines « décorées », par opposition aux protéines nues de SARS-CoV-2 à la surface du virus (voir illustration ci-dessous).
Figure : (a) Représentation « classique » de Sars-Cov-2 (b) Représentation de Sars-Cov-2 incluant le bouclier de sucres (en orange) sur les glycoprotéines de surface (c) Zoom (à partir du cercle rouge) sur la glycoprotéine Spike (« spicule ») du SARS-CoV-2 modélisée, sans (à gauche comme dans la représentation (a)) et avec (à droite comme dans la représentation (b)) le bouclier de sucres (en bleu) (Source images : Wikipédia)
La fonction de camouflage que procure la présence de glycanes sur la protéine de surface permet au virus d’échapper à la vigilance du système immunitaire. En effet, peu de virus sont équipés pour synthétiser les molécules de sucres qui couvriront la glycoprotéine. Ainsi, lorsque le virus se multiplie dans une cellule infectée, il en profite pour détourner la machinerie de son hôte et se fabriquer un profil de sucres bon teint. Au final, les sucres de surface ne se distinguent en rien de ce que la cellule infectée peut produire elle-même et cette usurpation permet au virus de quitter l’hôte incognito et poursuivre son activité pathogène.
La particularité du bouclier est sa variabilité. Actuellement, il y a une quarantaine de sites d’attachement des sucres identifiés sur la protéine Spike de SARS-CoV-2. Tous ne sont pas forcément utilisés et les mutations inhérentes à la réplication du virus correspondent parfois à la disparition ou à l’apparition d’un site. Cette plasticité peut favoriser ou bloquer l’accès à la protéine et donc avoir des conséquences sur les interactions avec les anticorps, entre autres.
Même si la grande majorité des données de virologie sont des séquences génomiques (ADN), les glycobiologistes se penchent depuis longtemps sur les interactions hôte-virus puisque, pour pénétrer dans les cellules, ces interactions facilitées par les glycanes impliquent divers récepteurs de l’hôte, ainsi que des protéines de surface des virus. Ces dernières sont connues sous le nom d’hémagglutinine, pour la grippe par exemple. En fait, la reconnaissance des glycanes par des protéines fait l’objet d’un examen minutieux depuis des décennies tout simplement parce que les molécules des groupes sanguins sont des glycanes. Par exemple, il a été démontré que différentes souches de norovirus, responsables de gastro-entérites, ont des préférences distinctes pour les groupes sanguins O ou A. Ces études confirment que la glycosylation des virus doit être prise en compte dans la conception des vaccins afin de déclencher la production d’anticorps qui ciblent des régions des protéines moins susceptibles d’évoluer à travers des mécanismes de résistance.
Dans l’ensemble, la situation décrite jusqu’à présent souligne la nécessité de collecter des données et d’enregistrer les informations relatives à la glycosylation pour caractériser pleinement l’infection virale. Nous avons entrepris cette tâche non seulement pour soutenir les applications virologiques mais aussi dans le contexte plus large de la compréhension du rôle de la glycosylation à l’interface des cellules. Le profil de glycosylation de protéines de cellules saines se distingue de celui de protéines de cellules cancéreuses, par exemple. Pour aider à élucider le rôle de la glycosylation, nous développons des bases de données et des logiciels disponibles sur le portail Expasy de l’Institut suisse de bio-informatique (SIB). Nous collectons en particulier, les informations sur la structure des glycanes et leur attachement sur les protéines. Par exemple, un anticorps comme l’immunoglobuline gamma possède deux sites à sa surface sur lesquels un éventail de 60 à 70 glycanes sont attachées sans qu’on sache expliquer les conditions favorables ou défavorables à telle ou telle structure. En accumulant des données sur ces associations entre protéines et glycanes dans des contextes bien définis (quel organisme, quelle lignée cellulaire, quelles conditions expérimentales, quel type d’échantillon sain ou malade, etc.), nous développons des logiciels de comparaison, de visualisation et de prédiction. Grâce à ces outils, les chercheurs ayant des connaissances étendues ou non en glycobiologie peuvent explorer, rechercher et comparer entre elles les glycanes et/ou les glycoprotéines selon des conditions spécifiables. Nous collectons, entre autres, les données du bouclier de sucres de SARS-CoV-2 dans une section spécifique.
Le glycocode
Comme évoqué plus haut dans cet article, la prochaine étape dans la compréhension de la fonction des protéines consiste à déchiffrer les règles qui régissent l’occurrence multiple des modifications post-traductionnelles, appelé le « code MPT » (MPT pour modification post-traductionnelle, traduit de l’anglais PTM : post-translational modification). La glycosylation, qui est la plus variable de ces modifications, complique le tableau avec son propre « glycocode » porté par les glycoprotéines de surface ou les constituants (appelés polysaccharides) des membranes microbiennes. La dernière catégorie d’acteurs moléculaires de ce tableau dynamique de la surface cellulaire est constituée par les protéines qui se lient aux glycanes, appelées « lectines ». Cette capacité fait de ces protéines les lecteurs clés des informations codées par les glycanes. La diversité intra- ou interespèce des lectines est étendue mais ces protéines sont mal renseignées dans les bases de données généralistes qui fournissent insuffisamment de détails fonctionnels ou structurels permettant de les classer et de les comparer. En 2019, nous avons lancé la plate-forme UniLectin, en collaboration avec le CERMAV de Grenoble, pour répondre à ces carences d’informations. Nous avons proposé une nouvelle classification des lectines et développé des outils de prédiction des domaines de liaison des sucres (un domaine est une région spécifique d’une protéine lui conférant une sous-structure particulière).
Une approche communautaire
La structuration des données de glycobiologie reste un défi tant les techniques expérimentales utilisées sont diverses et inégalement automatisées. Il en résulte un éparpillement et un manque de cohérence des données qu’il est indispensable de rationaliser. L’ampleur de la tâche est telle qu’une large action collective est essentielle. Les glyco-informaticiens s’y sont attelés de façon globale, à travers l’Alliance GlySpace qui regroupe trois portails complémentaires développés sur trois continents (Amérique, Europe, Asie) dont celui que nous proposons sur Expasy. Nous représentons donc l’Europe. En s’appuyant sur le libre accès, nous nous efforçons de faciliter le partage des données et l’échange d’informations. Cette stratégie de collaboration vise à garantir des données de haute qualité, fiables et bien référencées (qui se conforment aux standards de format et de codage ainsi qu’aux nomenclatures couramment utilisées en bio-informatique) pour que la communauté des sciences de la vie puisse prendre en compte la contribution des sucres.