Sites Inria

English version

Equipe de recherche CAMUS

Compilation pour les Architectures MUlti-coeurS

  • Responsable : Philippe Clauss
  • Type : équipe
  • Centre(s) de recherche : Nancy
  • Domaine : Algorithmique, programmation, logiciels et architectures
  • Thème : Architecture, langages et compilation
  • Les "équipes" Inria sont en général des groupes de chercheurs engagés dans la définition d'un projet et d'objectifs partagés, qui donneront lieu à la création d'une équipe-projet. Les équipes-projets ainsi créées peuvent être commune avec des partenaires (universités ou organismes de recherche)

Présentation de l'équipe

L'équipe CAMUS s'attache à développer, adapter et étendre des techniques de parallélisation et d'optimisation automatiques, ainsi que des méthodes de preuves et de certification, pour l'exploitation efficace des processeurs multi-coeurs existants et à venir.

Ses recherches s'articulent autour de cinq problématiques, toutes intimement liées, pour atteindre les objectifs qui sont la performance, la correction et la productivité. Ces problématiques sont : la parallélisation et l'optimisation statiques de programmes (où tout le parallélisme détecté statiquement est exprimé, ainsi que tout le parallélisme "possible" qui sera éventuellement exploité dynamiquement), le profilage et la modélisation du comportement à l'exécution (des modèles expressifs de représentation du comportement serviront de moteur aux processus de parallélisation dynamique), la parallélisation et l'optimisation dynamiques (ces processus pouvant fonctionner au sein d'une machine virtuelle), la programmation et la compilation objet pour multi-coeurs (où le parallélisme d'objets, exprimé ou détecté, doit résulter en une exécution efficace), et la preuve de transformations de programmes pour multi-coeurs (la correction des nombreuses transformations statiques ou dynamiques devant être maîtrisée).

Axes de recherche

Les objectifs de l'équipe relèvent directement de la mise en adéquation entre le logiciel et la nouvelle voie d'évolution des processeurs à travers les multi-coeurs. Performance, correction et productivité doivent être les effets ressentis par les utilisateurs. Ils seront le fruit de recherches que nous articulons autour des problématiques suivantes :

  • Problématique 1 : Parallélisation et optimisation statiques de programmes
  • Problématique 2 : Profilage et modélisation du comportement à l'exécution
  • Problématique 3 : Parallélisation et optimisation dynamiques, machine virtuelle
  • Problématique 4 : Programmation et compilation objet pour multi-coeurs
  • Problématique 5 : Preuve de transformations de programmes pour multi-coeurs

La performance en temps étant notre principal objectif, les applications cibles de nos développements sont caractérisées par des phases de calculs intensifs. De telles applications sont nombreuses dans les domaines du calcul scientifique, de l'optimisation, de la fouille de données et du multimedia.

Le développement d'applications efficaces et correctes pour les processeurs multi-coeurs nécessite des interventions à toutes les étapes, de la conception initiale de l'application à son exécution finale.

En amont, tout le parallélisme potentiel de l'application doit être exhibé. Il s'agit alors d'utiliser des approches d'analyse et de transformations statiques (problématique 1) qui résultent en un code intermédiaire multi-parallèle informant la machine virtuelle d'exécution de tout le parallélisme qu'il est possible d'exploiter physiquement. Mais le compilateur n'a que peu de connaissance sur l'environnement d'exécution. Il connaît bien sûr le jeu d'instructions, peut connaître le nombre de coeurs, mais il ne sait pas quelles seront réellement les ressources disponibles à chaque instant de l'exécution (mémoire, nombre de coeurs).

C'est pourquoi un mécanisme de type "machine virtuelle" devra adapter l'application aux ressources (problématique 3). De plus, le compilateur ne pourra exploiter qu'une partie du parallélisme de l'application. En effet, certaines informations du programme (valeurs de variables, adresses mémoire accédées, etc.) n'étant accessibles qu'à l'exécution, une autre partie du parallélisme devra être généré à la volée, lors de l'exécution, là aussi par un mécanisme dynamique.

Cette extraction de parallélisme à la volée passe par la construction de modèles de comportement spéculatifs (problématique 2), ces modèles servant ensuite à la génération de code parallèle spéculatif (problématique 3). Parmi les objectifs de la modélisation du comportement, on peut ajouter le monitoring, ou profilage, du comportement d'une version du programme. En effet, la complexité des architectures actuelles et à venir ne permet plus de garantir a priori un comportement optimal d'une version d'un programme. Un processus de monitoring permettra de sélectionner la meilleure parallélisation à la volée.

L'adoption de plus en plus répandue d'approches et de langages de type "objet" met en exergue le besoin de développer des outils propres pour la programmation des architectures multi-coeurs. Le formalisme objets et méthodes implique des schémas d'exécution particuliers, qui, au niveau du code binaire final, se traduisent par des schémas élémentaires très éloignés. La maîtrise du comportement à l'exécution est donc encore bien plus difficile. L'analyse et l'optimisation, qu'elles soient statiques ou dynamiques, doivent prendre en compte dès le départ cette distorsion entre spécification "objet" et code binaire final : comment se traduit la parallélisation d'objets ou de méthodes (problématique 4).

Notre projet repose sur la conception d'une chaîne de production d'une exécution efficace de l'application sur l'architecture multi-coeurs. Chacun des maillons de cette chaîne doit être vérifié formellement afin de garantir aussi bien la correction que l'efficacité. Plus précisément, il faut vérifier que le compilateur produit du code intermédaire correct et garantir que la machine virtuelle réalise bien l'exécution parallèle équivalente sémantiquement au programme source : toutes les transformations subies par l'application, soit statiquement par le compilateur, soit dynamiquement par la machine virtuelle, doivent préserver la sémantique initiale. Elles devront être prouvées et certifiées (problématique 5).

Relations industrielles et internationales

Relation internationales :

  • Réseau d'Excellence Européen HiPEAC
  • Université de Buenos Aires, équipe LAFHIS, Argentine
  • Université d'Uppsala, Suède
  • Université de Batna, Algérie

Relations industrielles :

  • Reservoir Labs, New York, USA
  • STMicroelectronics, Grenoble-Crolles, France
  • Kalray, Paris, France
  • Intel, San Diego, CA, USA

Mots-clés : Compilation Parallélisme Optimisation de programmes Processeurs multi-coeurs

Suivez Inria tout au long de son 50e anniversaire et au-delà !