De Facebook au développement des plantes : quand les réseaux s’en mêlent
Réseau téléphonique, réseau social, réseau routier, réseau professionnel… Le terme “réseau” est aujourd’hui passé dans le langage courant. Un réseau informatique constitué d’ordinateurs reliés entre eux, ou bien un réseau de métro dont les stations sont connectées par des lignes en sont deux représentations intuitives.
Jérémy Lavarenne, Institut de recherche pour le développement (IRD)
La théorie des graphes, transposée dans le monde réel au travers de la théorie des réseaux, nous enseigne que ces derniers possèdent des propriétés mathématiques intrinsèques. Elles rendent leur étude formelle possible, et ainsi de mieux comprendre, voire anticiper le fonctionnement des systèmes que les réseaux décrivent.
Qu’est-ce qu’un réseau ?
Le Wiktionnaire définit un réseau comme un “ensemble d’objets ou de personnes connectées ou maintenues en liaison”, mais aussi comme “l’ensemble des relations ainsi établies”. Il existe plusieurs manières de représenter un réseau, dont la plus courante et intuitive est sous la forme d’un objet mathématique nommé graphe. Celui-ci est défini comme un ensemble de nœuds et d’arêtes interconnectant ces nœuds. Il peut inclure une sur-couche d’informations, telles que l’ajout d’une valeur de poids aux nœuds pour représenter l’importance relative d’un objet, ou bien la directionnalité des arêtes permettant de distinguer le sens de la relation entre deux objets. Par exemple, sur le réseau de microblogging Twitter, la connexion entre un follower et le compte suivi n’est pas nécessairement réciproque : l’interaction est dirigée, et pourra être représentée par une flèche partant du follower et pointant vers le compte suivi.
Internet, écosystèmes, cerveau humain, organisations économiques… Les graphes permettent ainsi de représenter – ou “modéliser” – et d’analyser une très grande diversité de systèmes complexes. Ce qui rend ces approches d’autant plus intéressantes, car les systèmes complexes sont définis par un comportement difficile à comprendre et à anticiper à partir de la seule connaissance individuelle de leurs composants.
L’analyse de réseau : un large spectre d’applications
Couplés à des performances de calcul en constante progression, les apports de la théorie des graphes et les progrès en algorithmique nous fournissent un ensemble d’outils qui nous permettent de dégager de l’information à partir de réseaux de grande taille. Il est en effet courant de rencontrer des graphes composés de milliers de nœuds et dizaines de milliers d’arêtes, dont l’information peut sembler difficile à appréhender au premier abord.
Un exemple connu et amusant pour comprendre l’intérêt de l’analyse de réseaux nous provient des sciences sociales. Déterminé par Wayne W. Zachary entre 1970 et 1972, le Zachary’s Karate Club est un graphe documentant 78 liens d’affinités entre 34 membres d’un club d’arts martiaux. Alors intéressé par le rôle des flux d’information et de sentiments dans les phénomènes de scission des groupes de taille réduite, l’auteur appliqua un algorithme regroupant les membres partageant le plus d’affinités entre eux pour émettre une hypothèse quant à la constitution de sous-groupes pouvant résulter d’un éventuel conflit. De manière amusante, un tel évènement survint au cours de l’étude, causant une scission effective du groupe, identique à une personne près à celle prédite par l’analyse du réseau d’affinité, et validant à 97 % le modèle de Zachary.
Un autre exemple, emprunté au domaine de l’écologie et mis en image en 2016 par Mauro Martino sur la base des travaux de recherche de Guo et collaborateurs, nous présente un réseau composé de différentes espèces de plantes (nœuds) partageant au moins une espèce de fourmis symbiotiques (arêtes). Ici, l’analyse du réseau dans le cadre d’une simulation de la disparition progressive et aléatoire de certaines espèces de fourmis en conséquence de changements climatiques permet d’estimer la résilience du réseau, c’est-à-dire sa capacité à subir des variations environnementales tout en restant capable d’assumer ses fonctions. Cette approche fournit ainsi un indicateur supplémentaire à d’autres déjà existants pour décrire la fragilité des écosystèmes face au changement climatique.
La formation des racines des céréales
Le changement climatique est également amené à impacter fortement les activités et les rendements agricoles, de par une modification des régimes pluviaux engendrant des épisodes de rudesse climatique plus marqués. Pour compenser ces fluctuations, les agronomes et biologistes s’accordent sur l’importance à donner aux travaux menés sur le système racinaire, la “moitié cachée” des plantes. Celle-ci est en première ligne lorsque le sol est en déficit d’eau (sécheresse) ou contaminé par de trop fortes teneurs en chlorure de sodium (salinisation). Les céréales, et en particulier la famille des Poacées dont font partie le riz, le maïs et le blé, constituent la source directe ou indirecte de près de la moitié des calories alimentaires de l’humanité. Pour adapter les plantes à ces conséquences du changement climatique global, il est donc stratégique de comprendre d’une part quels sont les déterminants génétiques de l’architecture des systèmes racinaires. Ceux-ci peuvent contrôler par exemple le nombre ou le diamètre des racines, l’angle ou la profondeur d’enracinement. D’autre part, il est important de saisir le rôle de cette architecture pour rendre les plantes tolérantes à ces stress.
Dans ce contexte, mes travaux de thèse sont centrés sur la compréhension des premières étapes du développement racinaire chez le riz. En première impression, pas de réseau en vue ! Cependant, un pan de la science des réseaux s’intéresse de près à la biologie : il s’agit de l’étude des réseaux de régulation de gènes.
Lors d’un processus développemental comme l’organogénèse racinaire, des gènes spécifiques sont traduits en protéines. Certaines de ces protéines sont impliquées dans la régulation d’autres gènes. Une manière d’étudier un processus biologique est d’identifier les liens entre, d’une part les gènes codant pour des régulateurs et d’autre part les gènes dont ils régulent l’expression, pour commencer à modéliser un réseau de régulation de gènes.
C’est ce que nous avons fait pour étudier et découvrir de nouveaux déterminants génétiques impliqués dans la formation des racines coronaires, une catégorie de racines qui émerge en couronne à partir des entre-nœuds de la tige au fur et à mesure du développement de la plante, et constituent chez les céréales la majeure partie du système racinaire.
Ces racines coronaires forment la majeure partie du système racinaire chez les céréales. Pour cela et tout au long des premières étapes de la formation des racines coronaires du riz, nous avons échantillonné à intervalle régulier l’organe concerné. Grâce aux récentes avancées des techniques dites de transcriptomique, nous avons identifié les variations de niveaux d’expression génique au cours du processus de développement d’une racine coronaire chez le riz. À partir d’un sous-ensemble de gènes présentant de fortes variations de niveau d’expression, nous avons, grâce à un algorithme qui analyse les similarités et les décalages temporels entre les profils d’expression des gènes au cours du temps, prédit quel gène régule quel autre. Sur cette base, nous avons construit un modèle de réseau de régulation de gènes pouvant expliquer ces variations d’expression.
Quelles applications ?
D’un point de vue fondamental, l’analyse de ce réseau a pour intérêt principal de permettre d’identifier des liens nouveaux entre des gènes déjà décrits pour leur implication dans le développement racinaire, mais aussi avec des gènes dont le rôle dans ce processus était jusqu’alors inconnu. Également, l’analyse de ce réseau par des méthodes de regroupement (tel que présenté dans l’exemple de Zachary) permet de repérer des groupes de gènes plus fortement connectés entre eux qu’avec le reste du réseau. De tels ensembles, qualifiés de modules, sont susceptibles de jouer un rôle dans une fonction biologique donnée. Enfin, l’identification des nœuds les plus connectés du réseau permet de pointer du doigt les gènes dont le rôle est crucial pour le processus dans son ensemble.
En cela, ces approches dites de “biologie des systèmes” qui prennent en compte la globalité d’un processus plutôt que de focaliser sur certain de ses éléments sont intéressantes d’un point de vue fondamental pour formuler des hypothèses nouvelles sur son fonctionnement. D’un point de vue appliqué, elles peuvent permettre de détecter de nouveaux gènes cibles pour la sélection variétale, par exemple dans notre cas pour moduler l’architecture racinaire et obtenir des plantes plus tolérantes à des stress tels que la sécheresse. Enfin, qu’il s’agisse de recherche fondamentale ou appliquée, les capacités prédictives des approches systémiques permettraient de réduire le temps nécessaire à la création de nouvelles variétés de plantes.
Les avancées récentes des technologies de séquençage (telles que le RNAseq, pour “séquençage d’ARN”) et des méthodes permettant la modélisation et l’analyse de réseaux de régulation de gènes ouvrent ces dernières à une utilisation sur un ensemble de plus en plus large d’espèces cultivées. Cela nous laisse penser que les activités de sélection variétale, jusqu’alors basées sur la sélection de variants de gènes sans considération de leur rôle de régulation génique, s’enrichiront dans les années à venir de la biologie des systèmes. L’activité de sélectionneur pourrait ainsi intégrer des fonctions “d’ingénierie des réseaux de régulation”. Les croisements variétaux et outils biotechnologiques auraient alors un rôle à jouer dans l’ajout ou le recâblage de nœuds de réseaux contrôlant des aspects précis de croissance ou de réponse aux stress des plantes.
Pour en savoir plus concernant la science des réseaux, nous vous recommandons la lecture du livre “Network science” de Albert-László Barabási, en accès libre sur le site Internet de l’auteur. Nous tenons à remercier Antony Champion (IRD) pour la relecture de ce texte.
Jérémy Lavarenne, Ingénieur agronome, Doctorant CIFRE Université de Montpellier-Biogemma, Institut de recherche pour le développement (IRD)
La version originale de cet article a été publiée sur The Conversation.