Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

Réseaux de co-expression de gènes

Другие языки:

Réseaux de co-expression de gènes

Подписчиков: 0, рейтинг: 0

Un réseau de co-expression de gène construit à partir d'un ensemble de données issues d'une micromatrice contenant des profils d'expression génique de 7221 gènes provenant de 18 patients affligés d'un cancer de l'estomac.

L'expression d'un gène est la transcription et la traduction d'un gène en ARN messager et donc en protéines (sauf cas des micro ARN). Il y a co-expression quand plusieurs gènes s'expriment dans des conditions similaires. Un réseau de co-expression de gène (GCN) est un graphe, où chaque nœud correspond à un gène et où une paire de nœuds est reliée par un arc s'il existe une relation significative de co-expression entre eux. Un réseau de co-expression de gène peut être construit, si l'on dispose de suffisamment de profils d'expression de gènes, en provenance de plusieurs échantillons ou d'expérimentations, en recherchant des paires de gènes qui ont un modèle d'expression similaire. C'est-à-dire un modèle d'expression où les niveaux de transcription de deux gènes exprimés conjointement montent et retombent simultanément dans les différents échantillons. Les réseaux de co-expression de gènes (GCN) sont intéressants sur le plan biologique car ils mettent en évidence les gènes qui sont contrôlés par le même programme de régulation transcriptionnel, ou alors qui sont fonctionnellement liés, ou bien encore qui sont des membres du même réseau de régulation génétique.

La direction et le type de la relation de co-expression ne sont pas définis dans les réseaux de co-expression de gènes, au contraire d'un réseau de régulation génique (GRN), où un arc orienté reliant deux gènes représente un processus biochimique comme une réaction, une transformation, une interaction, une activation ou une inhibition. Par rapport à un GRN, un GCN ne permet pas de déduire les relations de causalité entre les gènes et dans un GCN les arcs indiquent seulement une corrélation d'expression de ces différents gènes. Les modules ou les sous-graphes fortement interconnectés dans les réseaux de co-expression de gène (GCN) correspondent aux groupes de gènes ayant une fonction similaire ou participant à un processus biologique commun.

La direction des arcs est absente dans les réseaux de la co-expression de gène. Par exemple si trois gènes X, Y et Z s'expriment conjointement, il n'est pas indiqué si X active Y et Y active Z, ou si Y active X et Z, ou si un autre gène les activent tous les trois.

Les réseaux de la co-expression de gènes sont généralement construits à l'aide d'ensembles de données générées par l'expression de gènes au moyen de technologies à haut débit telles que les biopuces/micromatrices (microarray)ou RNA-Seq.

Histoire

Le concept de réseaux de co-expression de gènes a été introduit par Butte et Kohane en 1999 en tant que "relevance networks". Bute et Kohane intégrèrent cette approche plus tard avec des données d'expression de gènes pour construire le premier réseau de co-expression de gènes.

Construction d'un réseau de co-expression de gènes

Pour construire un réseau de co-expression de gènes, il faut suivre une approche en deux étapes : d'abord calculer le degré de co-expression, puis sélectionner le seuil à partir duquel on considère que cette expression devient significative.

En premier on sélectionne une mesure de la co-expression et un score de similarité est calculé pour chaque paire de gènes à l'aide de cette valeur. Ensuite, un seuil est déterminé et des paires de gènes qui ont un score de similarité plus élevé que le seuil sélectionné sont considérés comme ayant une co-expression significative et ils sont reliés par un arc dans le réseau.

La figure décrit les deux étapes générales pour la construction d'un réseau de co-expression de gène : 1) Calculer la valeur de la co-expression (par exemple la valeur absolue du coefficient de corrélation de Pearson) pour chaque paire de gènes et 2) choisir un seuil de signification (p. ex. corrélation > 0,8).

Les données d'entrée pour la construction d'un réseau de co-expression de gènes sont souvent représentées par une matrice. Si nous avons les valeurs d'expression génique de m gènes pour n échantillons (conditions), les données d'entrée seraient une matrice m × n, appelée matrice d'expression. Par exemple, dans une expérience de microréseau, les valeurs d'expression de milliers de gènes sont mesurées pour plusieurs échantillons. Dans la première étape, un score de similarité (mesure de co-expression) est calculé pour chaque paire de lignes dans la matrice d'expression. La matrice résultante serait une matrice m × m, appelée matrice de similarité. Chaque élément de cette matrice montre à quel point le niveau d'expression de deux gènes est similaire. Dans la deuxième étape, les éléments de la matrice de similarité qui dépassent un certain seuil (c.-à-d. des co-expressions significatives) sont remplacés par 1 et les éléments restants sont remplacés par 0. La matrice résultante, appelée matrice adjacente, représente le graphe du réseau. Dans cette matrice, chaque élément montre si deux gènes sont connectés dans le réseau (les éléments 1) ou non (les éléments 0).

Le coefficient de corrélation de Pearson (en), l'information mutuelle, la corrélation de Spearman et la distance euclidienne sont les quatre méthodes les plus fréquemment utilisés pour construire des réseaux de co-expression de gènes. Plusieurs autres mesures, telles que la corrélation partielle, la régression, et une combinaison de corrélation partielle et échange d'informations ont aussi été utilisés.

Voir aussi

Analyse de réseaux par corrélation pondérée (en)
réseaux de régulation de l'expression génique (en) ; Régulation de l'expression des gènes
Inférence d'un réseau biologique (en)
réseau biologique

Références

Portail de la biologie cellulaire et moléculaire
Portail de l’informatique