Dans la famille coronavirus, je demande…
Comment savons-nous que le SARS-CoV-2 descend du même « ancêtre » coronavirus que celui de la chauve-souris ? Grâce à la phylogénie. Une science capable de retracer, et parfois prévoir, les différentes étapes de l’évolution d’un virus. Explication avec le chercheur Stéphane Guindon, créateur du logiciel PhyML.
Avec l’émergence de la Covid-19, le logiciel de bio-informatique PhyML, utilisé pour suivre des épidémies virales plus classiques telle que la grippe saisonnière, tourne à plein régime. « Le logiciel évolue en permanence, nous implémentons des algorithmes pour aller plus vite, traiter de plus en plus de jeux de données et développer des fonctionnalités nouvelles… » explique Stéphane Guindon, chercheur au Laboratoire d’informatique, de robotique et de microélectronique de Montpellier* et concepteur du logiciel.
Tracer l’origine
Un logiciel capable de retracer la généalogie, ou phylogénie, de tout organisme pourvu d’un ADN. « Un arbre phylogénétique c’est un peu l’équivalent de l’arbre généalogique qui permet de retracer les liens de parenté entre individus issus d’une même famille. Cette « généalogie » est reconstruite ici en comparant les génomes de différentes espèces.» Le génome d’un virus est constitué de plus de 30 000 « briques chimiques », des nucléotides, qu’il faut donc analyser pour reconstituer l’itinéraire du virus et retracer ce qu’on appelle une « chaîne de transmission ».
Des séquences d’ARN – un ADN modifié – du SARS-CoV-2 ont ainsi été comparées par le logiciel à toutes celles contenues dans les bases de données existantes et ont permis d’établir un lien de proximité fort avec un virus présent chez la chauve-souris et le pangolin. L’analyse de ces séquences a également permis de déterminer que l’épidémie actuelle n’avait eu pour point de départ qu’un seul évènement de zoonose, autrement dit qu’un seul cas de transfert animal-homme. « S’il y avait eu plusieurs évènements l’arbre du virus n’aurait pas la même forme, il présenterait plusieurs sous-arbres, chacun correspondant à un transfert d’une souche virale de l’animal à l’homme. »
Suivre et prévoir l’évolution du virus
La phylogénie a permis de répondre à d’autres questions importantes concernant l’épidémie en analysant notamment le lien entre la diversité des séquences virales et le nombre de virus en circulation. « Dès le début du mois de mars, les analyses phylogénétiques mesurant la diversité génétique nous ont indiqué que la taille de population du virus doublait tous les 5 à 7 jours » précise le chercheur. Les analyses phylogénétiques par PhyML pourraient également permettre de mieux prévoir l’évolution du SARS-CoV-2 sur le long cours. Par exemple, chaque année la phylogénie aide à déterminer quelles souches du virus de la grippe sont les plus susceptibles de se développer l’hiver suivant, contribuant ainsi à la conception de vaccins efficaces.
350 000 heures de calcul par an
Développé en 2003 par Stéphane Guindon, PhyML a été parmi les premiers logiciels gratuits et accessibles via la plateforme de bio-informatique hébergée par le Lirmm. « Nous mettons nos serveurs à disposition des laboratoires de recherche car ces analyses phylogénétiques sont très gourmandes en temps de calcul. Certaines peuvent durer des heures, des jours, voire des semaines. » Chaque année la plateforme réalise ainsi environ 350 000 heures de calcul pour des laboratoires situés en France mais aussi et surtout dans toute l’Europe, en Chine et aux États-Unis…
*Lirmm (UM – CNRS)