Plate-forme

1/06/2017

Grid'5000 : l'expérimentation informatique à grande échelle

Opérationnelle depuis 2005 à Lille et hébergée depuis le 1er mars 2017 au sein du centre de recherche Inria Lille – Nord Europe, la plate-forme Grid'5000 permet aux scientifiques de tester en grandeur réelle leurs concepts de logiciels avec une puissance de calcul et de stockage très importante. Alors que certains calculs prendraient des années sur une seule machine, Grid'5000 réduit cette durée à quelques jours voire quelques heures grâce au calcul parallèle distribué.

Promouvoir et développer la recherche expérimentale sur l’informatique parallèle distribuée à grande échelle, comme le calcul haute performance (HPC), le cloud computing et le big data , tel est l'objectif de Grid'5000. « Les chercheurs expérimentent ainsi les outils logiciels qu’ils développent pour répondre aux besoins grandissants des applications en termes de calcul intensif, de volumes de données, de simplicité de déploiement et d’utilisation via le cloud. », note Nouredine Melab, responsable scientifique pour le site lillois Grid'5000 et chercheur dans l'équipe de recherche Dolphin* du centre Inria de Lille.

Soutenue par Inria, le CNRS, différents conseils régionaux et universités, cette plate-forme fournit aux utilisateurs un environnement hautement contrôlable pour l’expérimentation reproductible sur plus de 10 000 cœurs de calcul. D'où un traitement efficace des problèmes de très grande taille dans divers domaines tels que l’intelligence artificielle.

Exemple concret : il y a une dizaine d'années, lors de sa thèse, un doctorant coencadré par Nouredine Melab a fait passer le temps de résolution d’un problème d’ordonnancement de 22 ans sur une machine à 25 jours seulement en utilisant les ressources informatiques de 7 sites. « Depuis, nous sommes passés à 9 jours avec des cartes graphiques encore plus performantes. Et dans les prochaines semaines, il suffira de quelques heures ! », s'enthousiasme le scientifique.

Composée de ressources réparties sur 8 sites (dont un au Luxembourg, les 7 autres se trouvant en France), la plate-forme permet une mutualisation des ressources. « Elle favorise également les synergies entre les équipes de recherche en informatique et le montage de projets de collaboration multisites », précise le chercheur.

Financement CPER Data : l'accélérateur indispensable

Pour continuer dans cette voie, la plate-forme va recevoir un financement dans le cadre d’un Contrat de plan État-région (CPER) « Data » porté par Inria, de plus d'un million d'euros. Selon le responsable de la plate-forme : « Le but est de développer la recherche autour de la science des données en lien avec le tissu économique régional via, entre autres, des laboratoires communs Inria-Entreprises », dans la droite ligne de la mission de transfert, chère à Inria. Autre objectif de ce financement : favoriser une recherche de grande qualité reconnue internationalement. Dans ce cadre, trois axes sont privilégiés : l'Internet des objets, l'intelligence des données et des connaissances ainsi que leur optimisation, et le calcul haute performance. Ces axes s'appuient sur quatre leviers : l'attractivité, les démonstrateurs (afin de valider un produit développé), le transfert vers les PME et les infrastructures de recherche dont fait partie Grid'5000. C'est ainsi que dans la première phase de financement, la plate-forme a rejoint depuis deux mois le site Inria de Lille avec des serveurs de calcul multicœurs et des PDU (permettant la mesure de la consommation énergétique de Grid'5000). « Dans un second temps, l'intégration d'accélérateurs graphiques, de coprocesseurs et un cluster de stockage sont prévus », explique le chercheur.

Un environnement de pointe mis à disposition de chercheurs ou d'ingénieurs provenant de laboratoires par exemple. Ainsi, 600 utilisateurs par an fréquentent la plate-forme. « Nous souhaitons rapprocher les équipes travaillant dans le domaine des systèmes distribués », insiste-t-il.

De nombreux étudiants formés

L'aspect formation tient également un grand rôle. Depuis 2005, plus de 500 étudiants en master d'informatique « calcul scientifique » de l'université de Lille – sciences et technologies ont été formés à l'utilisation de cluster et à la programmation parallèle dans le cadre de leurs travaux pratiques sur cette plate-forme. En outre, plusieurs ingénieurs jeunes diplômés ont été recrutés sur Grid'5000. Sur le site de Lille, un jeune ingénieur officie depuis fin 2015 pour une durée de deux ans. Un autre jeune diplômé viendra le remplacer au terme de son contrat. Il est aussi prévu de recruter un ingénieur pour l'administration système et réseau ainsi que pour le développement logiciel, en support aux équipes lilloises. « Les ingénieurs que nous formons sur deux ans deviennent de véritables experts dans leur domaine et s'insèrent très bien dans le privé ou le public par la suite », souligne Nouredine Melab.

Quels sont les autres défis à relever par Grid'5000 dans le futur ? « Le défi est d’abord scientifique pour faire face aux changements significatifs d’échelle des applications. De nombreux problèmes nécessiteront d’être adressés, notamment le passage à l’échelle, la gestion de l’hétérogénéité des ressources et la maîtrise de la consommation énergétique. Il sera aussi important de mettre les recherches développées autour de Grid’5000 au service du transfert technologique et de la société. Cela passera entre autres par la définition d’un modèle économique régissant l’accès des entreprises à Grid’5000. », assure le responsable lillois de Grid'5000. « Un rapprochement avec FIT ( Future Internet of Things : plate-forme dédiée aux tests des technologies liées aux objets connectés, ndlr) est en route. L’objectif affiché, dixit Frédéric Desprez Directeur scientifique de Grid’5000, est de construire un grand instrument nommé SILECS permettant de s'attaquer à tous les défis scientifiques de l'Internet des objets, des centres de données et des réseaux les reliant. Cette plate-forme expérimentale polyvalente préfigurera à une échelle réaliste, les infrastructures qui seront déployées demain afin de tester les modèles, les algorithmes et les langage s », affirme Nouredine Melab.

*l’équipe de recherche Dolphin est commune avec l'université de Lille − sciences et technologies, au sein de l'UMR 9189 CNRS - Centrale Lille - Université de Lille − sciences et technologies, CRIStAL.

Mots-clés : CPER Data Informatique parallèle et distribuée Développement logiciel à grande échelle Supercalculateur Formation