Après quatre années d'existence, l'initiative LifeGrid a pris officiellement fin le 30 Septembre 2010

Projets






Université Blaise Pascal - LBP - M. DEBROAS Didier

Projet i-bio de gestion par ontologie de ressources bioinformatiques distribuées

Les biologistes sont confrontés à de nouvelles formes de données telles que des images (ex : puces à ADN) ou de grandes séquences (génomes). Le développement d’Internet et des technologies de l’information ont modifié le mode de travail des chercheurs. L’environnement de l’expérimentateur intègre maintenant des ressources informatiques distribuées (accès aux données et applications). Cette évolution pose cependant de nombreux problèmes dans la validation et l’extraction de l’information. Le projet présenté prend en compte l’évolution des systèmes d’information vers l’intégration des ressources distribuées (web services). Il s’agit aussi de préparer les nouvelles formes d’Internet telle que les grilles de calcul. Le projet d’intégration entre Internet et Biologie est appelé i-bio.

Nous avons identifié trois types d’objets systématiquement manipulés lors d’expériences en bioinformatique : les données, les applications et les protocoles. Nous souhaitons travailler sur les méta-modèles décrivant ces objets en nous inspirant des structures déjà publiées (BSML, OPM, …). Il existe aussi des règles de dépendance entre ces objets telles que celles fournies par les standards de méta-données (ex. Topic Maps). Mais l’objectif de i-bio est de montrer que l’introduction du concept d’ontologie est une étape déterminante de la structuration de l’information et la gestion des ressources informatiques. Sur la durée de l’appel d’offre LifeGrid, le projet vise à produire un prototype qui remplisse une fonction de service du Pôle modélisation de Clermont-Ferrand à l’adresse des laboratoires de recherche en biologie de la région. Le projet i-bio associe développement informatique et recherche. Nous prévoyons la mise à disposition d’un post-doctorant et l’embauche d’un ingénieur informaticien (LifeGrid) pour réaliser l’implémentation du prototype.

Le projet i-bio regroupe le développement d’une base de données et de deux interfaces : la première est orientée utilisateur et la seconde vers les services (en particulier les web services). L’interface utilisateur est à vocation graphique. Elle sera distribuée sur des postes de travail individuels. Elle sera développée à partir d’une technologie telle que JAVA. L’autre est un connecteur entre la base de données et les outils de recherche sur les ressources distribuées. Ce projet sera à usage public et les sources seront ouvertes car il intègre des applications issues de cette philosophie.

Nous avons défini quatre applications biologiques pour valider l’architecture de i-bio. Elles serviront à instancier la base de données. Deux de ces études de cas concernent le développement de sites web à vocation scientifique : « protéome minimum » et « Hoplantgen ». Ces deux projets intègrent de nombreuses informations hétérogènes et restitue, grâce à une valeur ajoutée scientifique, un service à la communauté internationale. Ces projets intègrent de nombreux protocoles de mise à jour. Une étude de cas porte sur le traitement des données et l’extraction d’information dans le cadre d’une expérience de métagénomique. La dernière application de biologie concerne la mise en place d’une structure de veille concernant une ontologie décrivant un contexte génique particulier en parasitologie.


LifeGrid, le système d'information régional