Ouvrir ses données, une initiative pas si simple

Le libre accès est défini comme la « mise à disposition gratuite sur l’Internet public, permettant à tout un chacun de lire, télécharger, copier, transmettre, […] ou s’en servir à toute autre fin légale, sans barrière financière, légale ou technique autre que celles indissociables de l’accès et l’utilisation d’Internet » (Initiative de Budapest pour l’Accès Ouvert, 2002)

L’ouverture des données de la recherche ou Open Research Data consiste à mettre en libre accès les données issues d’un projet de recherche.

La volonté d’ouverture des données de la recherche est liée à plusieurs mouvements :

  • La science ouverte (Open Science), qui comprend le libre accès (Open access), les données ouvertes (Open Data), l’évaluation ouverte par les pairs (Open Peer Review), la science participative ou citoyenne (Citizen Science).
  • L’ouverture des données (Open Datapromue par des administrations publiques engagées dans l’Open Government Data et des acteurs privés. 
  • Les mouvements citoyens des communs (Commons) de la connaissance, des logiciels libres (Free Software Movement), du code source ouvert (Open Source)…

Pour bien ouvrir ses données, un chercheur est amené à combiner 3 types de compétences : juridiques, administratives et techniques.

 

Les compétences utiles

Le guide Ouverture des données de recherche – Guide d’analyse du cadre juridique en France (V2 - décembre 2017), issu d’un groupe de travail inter-organismes animé par l’INRA et soutenu par le Comité pour la Science ouverte est une bonne approche pour aborder le cadre juridique. Néanmoins, il convient de consulter la politique de son établissement sur la décision d'ouverture des données.

Ce guide présente :

  • Les textes concernant directement ou ayant un impact sur l’ouverture des données de la recherche :
  • Les 3 grandes catégories de communicabilité des données :
    • communication obligatoire : données géographiques, données relatives à des émissions de substances dans l’environnement
    • communication interdite par principe : données présentant des risques pour la protection du secret de la défense nationale, données présentant des risques pour la sûreté de l’État, la sécurité publique, la sécurité de l’établissement, secrets professionnels
    • communication sous condition : données présentant des risques pour la protection du potentiel scientifique et technique de la nation, zones à régime restrictif (ZRR), données protégées par le droit d’auteur et autres droits de propriété intellectuelle, droit d'auteur, autres droits de propriété intellectuelle, données relatives aux personnes et à la vie privée, données statistiques, données liées à un contrat avec un tiers non soumis à une obligation de service public
  • Les aspects techniques de la diffusion et les licences de diffusions utilisables (à noter que les Creative Commons n’en font pas partie)

Le guide propose également un logigramme de communicabilité d’une donnée, qui a fait l’objet d’un outil de visualisation disponible en ligne.

Il propose enfin un ensemble de fiches pratiques synthétiques sur différents aspects (bases de données, données personnelles, données statistiques, etc.).

Les questions juridiques liées à l’ouverture des données sont complexes : n’hésitez pas à vous rapprocher du service juridique de votre établissement.


«  Il convient d’être particulièrement prudent lorsqu’il y a une publication scientifique et que l’éditeur impose le dépôt des données dans un entrepôt spécifique. (…) les décisions d’ouverture de données se prennent au niveau de l’établissement et non pas au niveau de l’agent.  » (Ouverture des données de recherche – Guide d’analyse du cadre juridique en France)

Les obligations administratives liées aux financements de la recherche sont en constante évolution. Il convient de suivre régulièrement l’évolution des exigences.

Au niveau européen le programme cadre Pilote H2020 et son extension ainsi que le Plan S de cOAlition S régissent les principales obligations.

 

H2020, le programme-cadre de financement de l’Union européenne 2014-2020

Pour H2020, l’ouverture des données est l’option par défaut, mais il existe un certain nombre d’exception permettant de s’en extraire (Opt-out) comme le risque de compromettre le projet, des raisons éthiques, la règlementation relative aux données personnelles, la propriété intellectuelle et la sécurité. Vous pouvez vous procurer la liste complète p. 8 du guide H2020 Programme Guidelines to the Rules on Open Access to Scientific Publications and Open Access to Research Data in Horizon 2020 .

 

Plan S et cOAlition S

Une déclaration communepubliée en septembre 2018 par cOAlition S, consortium formé de l’ERC et des agences nationales de financement européens dont l’ANR, vise à « faire de l’Open Access une réalité en 2020 ». Elle est à l’initiative du Plan S.

En France

En France, Le Plan national pour la science ouverte annoncé par Frédérique Vidal, le 4 juillet 2018, rend obligatoire l’accès ouvert pour les publications et dans une certaine mesure pour les données issues de recherches financées par appels à projets sur fonds publics. 

L’ANR dans son plan d’action 2019  « demande à ce que les publications consécutives aux projets qu'elle finance, soient déposées en texte intégral dans une archive ouverte, et imposera de plus un plan de gestion des données (DMP) pour les projets financés à partir de 2019 ».

 

Politiques d’établissement

De plus en plus d’institutions établissent des mandats liés à l’Open Access et à l’Open Data. Le site ROARmap, répertoire mondial des politiques en la matière, permet d’en prendre connaissance.


Sur les obligations liées à des financements européens, rapprochez-vous des contacts dédiés de votre établissement (exemples : Pôle Ingénierie des projets de recherche internationaux à l’UVSQCellule Europe de Paris-SudDirection déléguée aux Affaires Européennes pour le CEA…)

Pour publier des données ouvertes et liées, deux approches complémentaires peuvent être suivies :

  • Appliquer les notions contenues dans FAIR est une base pour l’ouverture des données de la recherche : les données FAIR ne sont pas nécessairement ouvertes, mais les principes FAIR permettent, si les données sont communicables, de poser les bonnes bases pour leur ouverture, selon le principe de la Commission Européenne « aussi ouvert que possible, aussi fermé que nécessaire ».
  • A partir du moment où les données de la recherche sont ouvertes sur le Web, rejoindre les standards du Web sémantique permet d’assurer qu’elles pourront être réutilisées dans les meilleures conditions par l’ensemble des internautes, qu’ils soient chercheurs ou issus de la société civile. Un bon moyen de commencer est d’appliquer l’échelle des 5 étoiles de l'Open Data, ensemble gradué proposé par Tim Berners-Lee aboutissant au Linked Open Data.