Open science/Open Access

HAL : une infrastructure exemplaire pour contribuer à une édition scientifique ouverte, publique et pérenne

Date:
Mis à jour le 02/12/2021
Alors que la plate-forme HAL fête ses vingt ans, Laurent Romary, membre de l’équipe Almanach et spécialiste en informatique linguistique, évoque avec nous les conditions de son émergence et la nécessité, avec son succès et le développement de la science ouverte, d’en renforcer la structure et les potentialités.
Mains sur clavier avec écrans en arrière-plan
© Inria / Photo C. Morel

Pourquoi a été créée la plate-forme HAL, et comment a-t-elle évolué ?

Portrait Laurent Romary
© Inria / Photo J.-M. Ramès

L’archive ouverte HAL (pour "Hyper articles en ligne") a été mise en place, par le CNRS, pour offrir un service de preprints indépendant de la plate-forme ArXiv aux États-Unis tout en maintenant un lien très fort de miroir avec celle-ci. Elle a évolué peu à peu pour accueillir de plus en plus de documents - auteurs associés à des articles publiés dans des revues ou conférences traditionnelles, sous l’effet d’une prise de conscience par les chercheurs des enjeux de ce que nous appellerions maintenant la science ouverte.

Dès 2003, avec la publication de la déclaration de Berlin et sa signature par les principaux établissements de recherche français, dont Inria le 20 juillet 2004, HAL est perçu comme un instrument idéal d’une politique plus institutionnelle d’ouverture large des publications scientifiques.

 

 

HAL en chiffres

971 000

documents référencés en 2021

60

millions de documents téléchargés en 2020

74 000

comptes utilisateurs actifs

Quelle a été la participation d'Inria à la création de HAL ?

Inria avait la possibilité technique à cette époque de mettre en œuvre sa propre archive, mais l’institut a choisi, sous l’impulsion de Jean-Pierre Verjus, alors directeur de la communication et de l’information scientifique, de se rallier à HAL pour y ouvrir dès avril 2005 un portail aux couleurs d’Inria, hal.inria.fr. Ce fut l’une des toutes premières institutions à faire ce pas et la démarche s’accompagna dès le départ d’un fort investissement des personnels documentaires pour prendre en charge la modération des soumissions et surtout communiquer largement en direction des chercheurs pour les inciter à déposer systématiquement dans HAL.

Inria s’est aussi très tôt impliqué, en collaboration avec le CCSD, l’unité de service du CNRS qui développe HAL, dans la mise en œuvre d’outils facilitant notamment l’intégration groupée de documents (X2HAL) ou l’extraction automatique de métadonnées à partir des PDF sources (GROBID). Devenu entre-temps l’un des établissements partenaires du CCSD, Inria a montré le chemin d’une implication institutionnelle exemplaire dans le domaine de la science ouverte en instaurant une obligation de dépôt pour tous les chercheurs de ses équipes. À ce jour, plus de 85% des textes intégraux de l’institut sont ainsi disponibles sous HAL.

En quoi la plate-forme est-elle un bon exemple de l'open science ?

La plate-forme HAL a intégré au fil des années tous les éléments qui constituent maintenant le bréviaire de la science ouverte et qu’on retrouve en partie dans la terminologie en vogue, à savoir le fait de disposer de données FAIR. D’un point de vue technique, HAL offre un accès persistant à ses contenus, intégrant une gestion des versions et des identifiants pérennes. Les entrées de HAL sont très bien indexées sur les moteurs de recherche internationaux, et la plate-forme offre une API d’accès complète. Pour la gestion des métadonnées, HAL est couplé à une série de référentiels contenant les entités de référence utilisées dans les métadonnées associées aux articles et permettant de contrôler les affiliations. La plate-forme permet également le référencement aux revues scientifiques ou encore le lien avec les projets ANR ou européens ayant financé la recherche correspondante.

Les contenus comme les référentiels sont associés à des mécanismes de validation et d’édition qui contribuent à faire des publications dans HAL un corpus scientifique de qualité. Enfin et surtout, HAL offre toute une palette de fonctionnalités centrées sur les chercheurs (identifiants couplés aux grandes bases internationales telles que ORCID, pages personnelles, gestion de collections) permettant d’en faire un véritable espace de gestion de ses propres productions.

 

Infographie sur le fonctionnement de la HAL (archive ouverte)

Quels sont les défis qu'HAL va devoir relever dans les années à venir ?

L’un des défis principaux pour HAL, qui est devenu une plate-forme de référence pour de nombreuses institutions, qui comme le CNRS récemment, y ont adopté des politiques de dépôt systématique, est de continuer à offrir des services proches des chercheurs eux-mêmes et s’intégrer dans le cycle global de la publication scientifique. C’est dans cet esprit que nous soutenons le déploiement de la plate-forme de gestion d’épirevues Épisciences, qui permet l’évaluation par les pairs de preprints déposés au préalable dans HAL (ainsi que d’autres archives ouvertes telles qu’ArXiv).

Par ailleurs, HAL doit permettre de relier étroitement une publication avec les jeux de données ou les logiciels qui y sont associés. Nous avons ainsi contribué à la mise en œuvre d’un dépôt logiciel dans HAL référençant les sources archivées dans Software Heritage. Enfin, avec l’accroissement des contenus, HAL commence à devenir une alternative crédible aux grandes bases bibliométriques internationales (WoS, Scopus, etc.) pour suivre la production scientifique française et en analyser les points forts. Il faut pour cela penser la prochaine génération d’outils et d’interfaces qui permettront notamment à chaque chercheur, équipe ou institution d’obtenir des listes de publication pour une page web, ou encore d’analyser ses propres publications.

Sources