Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
Galaxy (bioinformatique)
Другие языки:

Galaxy (bioinformatique)

Подписчиков: 0, рейтинг: 0

Galaxy est une plate-forme de fouille de données, de gestion de données et d'archivage électronique qui a pour objectif de rendre la bioinformatique accessible aux chercheurs n'ayant pas de compétence en programmation informatique. Bien qu'originellement développée pour la recherche en génomique, elle est maintenant largement employée comme un système bioinformatique général de fouille de données.

Fonctionnalité

Galaxy est un système de fouille de données. Ce type de système fournit un moyen d'établir des analyses informatiques multi-étapes à la manière d'une recette. Une interface graphique est généralement disponible afin d'indiquer quelles données traiter, quelles étapes réaliser et dans quel ordre.

Galaxy est aussi une plate-forme de gestion de données biologiques. Il prend en charge le téléversement de données à partir d'un ordinateur personnel, d'une URL ou de nombreuses ressources en ligne (tels que l'Explorateur de Génomes, BioMart ou InterMine).

Galaxy prend en charge un grand nombre de formats de données biologiques et permet des conversions entre différents formats. Il fournit une interface web à de nombreux programmes de manipulation de texte, permettant aux chercheurs de réaliser leur propres reformatages et manipulations de fichiers sans posséder de notions de langage de script.

Galaxy possède des programmes de manipulation d'intervalles pour effectuer des opérations sur les ensembles (telles que les intersections, les unions, etc.). Plusieurs formats de fichiers bioinformatiques incluent des données d'intervalles génomiques (un cadre de référence, comme un nom de chromosome ou de contig, et des coordonnées de début et de fin), autorisant ainsi l'intégration de ces données.

Enfin, Galaxy prend en charge l'archivage électronique des données (voir Reproductibilité et Transparence ci-dessous)

Objectifs du project

Galaxy est « une plate-forme web ouverte pour la réalisation d'une science génomique accessible, reproductible et transparente ».

Accessibilité

La bioinformatique est un domaine spécialisé qui requiert souvent un savoir en programmation informatique. Galaxy a pour objectif de donner aux chercheurs en biologie un accès à la bioinformatique sans qu'il leur soit demandé de connaissance en programmation. Pour cela, Galaxy possède une interface utilisateur simple permettant la mise en place de processus de traitement complexes. Ce choix rend relativement facile la mise en place d'analyses classiques mais plus difficile la mise en place de traitements comprenant, par exemple, des boucles (voir Taverna pour un exemple de système supportant les boucles).

Reproductibilité

La reproductibilité est un objectif commun en science : lorsqu'un résultat scientifique est publié, la publication doit inclure les informations nécessaire permettant à d'autres de répéter l'expérimentation afin d'obtenir les mêmes résultats. Il existe de nombreux efforts récents pour étendre cette répétabilité communément utilisée dans le domaine expérimental (de paillasse) au domaine bioinformatique. Ceci s'est avéré une tâche bien plus compliquée qu'initialement prévue.

Transparence

Galaxy prend en charge les éléments nécessaires à la transparence scientifique en autorisant les chercheurs à partager tout objet de Galaxy soit publiquement, soit avec un cercle de personnes particulier. Les éléments partagés peuvent être consultés en détail, relancés tels quels ou copiés et modifiés afin de tester de nouvelles hypothèses.

Objets de Galaxy : historiques des traitements, jeux de données et pages

Les objets de Galaxy correspondent à tout élément pouvant être sauvegardés, maintenus ou partagés dans Galaxy :

Historiques (Histories)
Les historiques contiennent les analyses bioinformatiques (recettes) exécutées avec des jeux de données, des étapes et des paramètres précis. Les historiques incluent aussi bien les jeux de données intermédiaires que finaux.
Traitements (Workflows)
Les traitements contiennent les différentes étapes et leurs paramètres utilisés lors d'analyses bioinformatiques mais en aucun cas les données associées. Les traitements sont utilisés pour exécuter une même analyse sur différents jeux de données.
Jeux de données (Datasets)
Les jeux de données comprennent tous les jeux de données d'entrée, intermédiaires et de sortie utilisés ou produits par l'analyse.
Pages
Historiques, traitements et jeux de données peuvent inclure des annotations fournies par l'utilisateur. Les pages Galaxy permettent la création de feuilles virtuelles ayant pour objectif de décrire comment et pourquoi une analyse a été menée. L'étroite intégration des pages dans les historiques, les traitements et les jeux de données permet l'accomplissement de cet objectif.

Disponibilités

Galaxy est disponible :

  1. à partir d'un serveur public gratuit, pris en charge par le projet Galaxy. Ce serveur inclut de nombreux outils bioinformatique largement utilisés dans de nombreux domaines de la recherche génomique. Les utilisateurs peuvent créer leur login, enregistrer leurs historiques, traitements et jeux de données sur le serveur. Ces éléments sauvegardés peuvent être partagés avec d'autres.
  2. sous forme d'un logiciel open source pouvant être téléchargé, installé et personnalisé selon les besoins. Galaxy peut être installé localement ou à travers un cloud.
  3. à partir de serveurs web publics maintenus par d'autres organismes que le projet Galaxy. Plusieurs organismes ayant leur propre installation de Galaxy ont opté pour une mise à disposition publique.
  4. à partir du projet GenomeSpace.

Implémentation

Galaxy est une plate-forme open source implémentée utilisant le langage de programmation Python. Elle et développée par l'Équipe Galaxy composée de membres de l'université d'État de Pennsylvanie, de l'université Emory et par la communauté Galaxy.

Communauté

Galaxy est un projet open source et la communauté attenante comprend les utilisateurs, les organisations qui installent leur propre plate-forme, les développeurs de Galaxy et les développeurs des outils bioinformatiques. Le projet Galaxy possède une liste de diffusion et une rencontre annuelle.

Références


Voir aussi

Articles connexes

Liens externes



Новое сообщение