Jean-Michel Prima - 7/04/2016

Grid'5000 s'ouvre aux entreprises

Plateforme nationale d’expérimentation pour les systèmes distribués et le cloud computing, Grid'5000 est au service de la recherche académique depuis 2003. Cette infrastructure s'ouvre désormais aux entreprises qui souhaiteraient l'utiliser à des fins scientifiques, comme l'explique David Margery, directeur technique de la plateforme et membre du Service expérimentation et développement (SED) du centre Inria Rennes - Bretagne Atlantique.

1000 serveurs. 8000 cœurs répartis sur 10 sites. 25 grappes de matériel différent. Grid'5000 constitue l'un des grands équipements techniques de la recherche française. Avec 500 utilisateurs par an et un taux de mobilisation de la ressource qui atteignait 75% en moyenne en 2014, cet instrument est largement plébiscité par la communauté scientifique. Destiné principalement au monde académique, l'outil est désormais également accessible aux entreprises. “En participant à des programmes européens de recherche dans lesquels collaboraient des industriels, nous nous sommes aperçus que certaines entreprises, elles aussi, avaient besoin d'une plateforme d'expérimentation, explique David Margery. Typiquement il peut s'agir d'une PME qui développe une application pour envoyer des photos par téléphone portable. Mais avant de lancer le produit, elle veut savoir combien d'utilisateurs peuvent simultanément transmettre leurs images. Donc combien de serveurs elle doit déployer pour gérer l'afflux de données. On retrouve là toute la problématique classique du passage à l'échelle. Sur ces problèmes de grands volumes, l'entreprise a le choix entre beaucoup de stratégies de gestion de données. Mais pour déterminer si elle va utiliser telle ou telle technologie, encore faut-il qu'elle ait les moyens de faire sa R&D correctement. Or ce n'est pas toujours facile d'effectuer une comparaison en utilisant des services de cloud publics comme Amazon, Google ou Microsoft. ” Pourquoi ? “Parce que la virtualisation cache la proportion de processeur allouée à l'utilisateur et la charge. On ne connaît pas le détail du matériel auquel on accède. Quand on teste successivement deux algorithmes, il se peut que l'un semble meilleur que l'autre. En réalité, durant ces deux exécutions, on a peut-être tout simplement bénéficié de conditions physiques différentes. Dans ce cas, les analyses sont faussées. Sur ce type d'infrastructures, on se trouve donc face à une vraie difficulté de compréhension des résultats. Ce n'est pas impossible mais il faut prendre beaucoup de précautions. ” Et c'est précisément là que se situe la plus-value de Grid'5000.

Maîtriser tous les paramètres

“Depuis 10 ans, nous menons un vrai travail de fond sur la qualité de la plateforme pour faire de l'expérience en termes de résultats, d'analyse et de reproductibilité. Nous mettons à disposition du matériel nu et nous isolons autant que possible les paramètres externes à l'expérience. C'est dans ce croisement entre le déploiement du matériel et la qualité expérimentale que réside notre domaine d'expertise, une expertise d'ailleurs unique au monde. Quiconque déploie son infrastructure serveur, son ‘back-end’, sur Grid'5000 sait exactement sur quel matériel il travaille : quels processeurs, quels types de disques... S'il le souhaite, il peut construire sa pile technologique à partir de zéro pour maîtriser tous les paramètres. Ultérieurement, quand il voudra comparer deux expériences, il le fera à conditions égales. Nous offrons des métriques qui vont jusqu'à la consommation électrique durant l'exécution. ” Autant d'éléments qui assurent la reproductibilité de l'expérience. Précision importante : “L'infrastructure ne sert pas à faire du déploiement expérimental d'une technologie avant de l'installer ailleurs, mais à réaliser des expériences sur cette technologie elle-même. Il s'agit plutôt donc de mener des expériences avec des utilisateurs simulés pour voir ce qui se passerait dans certains scénarios. ” D'un point de vue pratique, l'accès à Grid'5000 se fera sur la base d'un tarif en cœur/heure. Combien ? “Environ deux fois le prix d'une offre comparable sur un cloud public. L'une de nos contraintes est de ne pas exposer nos partenaires à d'éventuelles poursuites pour avoir bénéficié de tarifs subventionnés. Il s'agit en aucun cas d'une façon indirecte de subventionner des industriels. ”

Accompagnement scientifique

Outre le contrat pour l'utilisation de l'instrument, les entreprises qui le souhaitent pourront bénéficier d'un contrat annexe d'expertise. “Un de nos chercheurs consacrera alors du temps à conseiller le nouvel utilisateur. ” Pour la prise en main de l'outil ? “Pas exactement. Pour cela nous avons des tutoriels très au point. Non, il s'agira plutôt d'aider l'entreprise à construire son expérience. Adopter la bonne démarche scientifique pour vérifier une hypothèse. Dépasser la démarche produit qui tend simplement à valider le bon fonctionnement d'un démonstrateur. Ce contact avec les entreprises est aussi très intéressant pour les chercheurs d'Inria car il leur permet de se confronter à des cas réels. Si, au cours d'un travail de conseil, un scientifique découvre qu'il existe un problème à résoudre, il pourra en faire un sujet d'étude. Ainsi, en créant une nouvelle passerelle recherche-industrie, nous espérons que l'ouverture de Grid'5000 donnera l'opportunité de développer de nouvelles collaborations avec nos laboratoires. ”