Open Science et données de la recherche

Un article de Wiki URFIST.


Alors que la problématique de l'accès ouvert aux publications scientifiques (Open Access) a une vingtaine d'années, on parle aujourd'hui de l'accès aux données elles-mêmes, du partage des données de la recherche. Quelles sont les raisons de ce glissement d'échelle et quels sont ses enjeux? Enjeux scientifiques mais aussi enjeux économiques et juridiques. Mais d'abord de quoi parle-t-on? Qu'est-ce au juste que les données de la recherche ? Nous verrons qu'il en existe de plusieurs sortes qui posent chacune des questions spécifiques. Enfin on envisagera les conséquences de cette nouvelle problématique pour l'activité du chercheur lui-même et la question des Plan de Gestion des Données (DMP).

Open Science Monitor


Sommaire

[modifier] Prise de contact: une recherche et ses données

étude de cas (Atelier d'Yvette Lafosse et Françoise Cosserat)

-> Tutoriels « Le libre accès aux résultats de la recherche dans le cadre d’Horizon 2020 »

[modifier] Qu'est-ce que "les données de la recherche"?

> Noëmie Rosemberg, "De la définition des données de la recherche," dans En quête des données, le 30/09/2015

[modifier] définitions (données et validation)

Celle de l'OCDE:

"les « données de la recherche » sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche.

Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris). L’accès à tous ces produits ou résultats de la recherche est régi par d’autres considérations que celles abordées ici."

Celle de l'Australian National Data Service:

"Research Data: Data are facts, observations or experiences on which an argument, theory or test is based. Data may be numerical, descriptive or visual. Data may be raw or analysed, experimental or observational. Data includes: laboratory notebooks; field notebooks; primary research data (including research data in hardcopy or in computer readable form); questionnaires; audiotapes; videotapes; models; photographs; films; test responses."

Sylvie Fayet:

"A minima, on s’accorde implicitement sur l’idée suivante : quand on évoque « les données de la recherche », on désigne des chiffres, relevés, mesures, résultats d’expérience, réponses à des enquêtes, statistiques, comptages, et autres donnés quantitatives sur la base desquels va s’élaborer une hypothèse, et/ou qui serviront à infirmer ou valider cette hypothèse… bref essentiellement du quantitatif, que l’on pourra traiter, trier, exploiter, visualiser de manière homogène. La publication de telles données fait déjà partie, dans certaines disciplines du moins, des canons de la rédaction d’un article scientifique (par exemple, la partie « Materials and methods » dans les recommandations pour la rédaction d’articles dans des revues médicales)."

[modifier] les différents types de données

de la publication aux données: embedded data, underlying data, raw data...:

Media:Schema DR 170120.pdf

[modifier] finalités du partage des données de la recherche

  • validation (science reproductible)
  • réutilisation (science cumultaive)

[modifier] le dépôt des données sur DoRANum

[modifier] Enjeux et contexte:

[modifier] Open Science / "Science ouverte"

“Open science is the idea that scientific knowledge of all kinds should be openly shared as early as is practical in the discovery process.”

Michael Nielsen
[modifier] concepts parents
  • "sciences"
    • e-science: la science électronique / numérique
      • "documentation électronique" (cf. open access)
        • questions de granularité
      • informatisation de l'activité scientifique (cf. big data): "ideas like recursion, parallelism and abstraction taken from computer science will redefine modern science. Implicit in the idea of a fourth paradigm is the ability, and the need, to share data. In sciences like physics and astronomy, the instruments are so expensive that data must be shared. Now the data explosion and the falling cost of computing and communications are creating pressure to share all scientific data." (John Markoff)
    • open access [ fr ]
    • Science 2.0
    • Open Science [ fr ]
  • data

Image:LOD Cloud 2014.svg.png[1]

[modifier] Open Science

[Open Science Monitor http://ec.europa.eu/research/openscience/index.cfm?pg=home&section=monitor]

[modifier] crise de la validation

> Balibar

Image:69730b52558050bbdc3d1c69c982f764.jpg

"La règle est de décrire ses travaux avec suffisamment de précision pour que quelqu’un d’autre puisse les comprendre dans tous leurs détails, les reproduire, les vérifier, les confirmer ou les réfuter."

[modifier] contexte juridique et réglementaire

> Ouverture des données de la recherche: Guide d'analyse du cadre juridique en France

[modifier] Quel cadre réglementaire suivre ?

"Il existe beaucoup de textes de différentes formes (loi, circulaire, directive, etc.) qui régissent les données qui peuvent être produites par la recherche :

  • Texte principal : Loi n°78‐753 du 17.07.1978 dite « loi CADA » modifié par la loi du 28/12/15 relative à la gratuité et aux modalités de réutilisation des informations du secteur public,
  • Code de la recherche : article L112‐1 « e) L'organisation de l'accès libre aux données scientifiques »,
  • A venir : le projet de loi Lemaire pour une république numérique,
  • Autres textes : loi Informatique et Libertés, circulaire pour la Protection du Patrimoine Scientifique et Technique, code de l’environnement (ex art L124‐ 2), directive Inspire, etc.

Est-ce que je produis des documents administratifs ? Oui si mon employeur est public

  • Tout ce que je fais dans le cadre de ma mission peut être considéré comme un document administratif
  • Attention ! Pour les doctorants : si la thèse est cofinancée ou réalisée en collaboration avec un partenaire de l’employeur => il faut se reporter au contrat
  • Cas particulier : je suis chercheur ou enseignant-chercheur: mes écrits, cartes, photographies, plans qui sont originaux et donc soumis au droit d’auteur m’appartiennent (exception – loi DADVSI 2006-961). Mais le reste appartient bien à mon employeur."
[modifier] l'affaire de l'API d'Elsevier

cf. Data Mining : quand Elsevier écrit sa propre loi… / Pierre-Carl Langlais (février 2014)

Accord Couperin / Elsevier: "Tous les contenus accessibles et souscrits sur ScienceDirect dans le cadre de cet accord seront utilisables à des fins de data et text mining via une interrogation des données par une API connectée à la plateforme ScienceDirect. Les modalités appliquées seront celle du cadre juridique défini par Elsevier pour ce type de service."

"La licence Elsevier comprend trois conditions. Tout élément (output) issu de l’extraction :

  1. peut comprendre des extraits de 200 caractères au maximum du texte original.
  2. doit être publié sous une licence non commercial (CC-BY-NC)
  3. doit inclure un lien DOI vers le contenu original."

[modifier] déclinaisons disciplinaires

En gros (très gros) en SHS la finalité "réutilisation" l'emporte sur la finalité "validation" > TDM

[modifier] les Humanités numériques

http://web.stanford.edu/group/toolingup/rplviz/

[modifier] cultures disciplinaires (quelques exemples)

[modifier] Gérer et partager ses données

> Faut-il partager ses données?

[modifier] DMP / PGD
-> Tutoriels « Le libre accès aux résultats de la recherche dans le cadre d’Horizon 2020 »
  • Les plans de gestion de données
  • Organisation et description
  • Stockage et conservation
  • Partage et diffusion
[modifier] et les doctorants?
  • déposer la thèse / déposer les données: Les données de la recherche dans les thèses de doctorat - Livre blanc: "les thèses appartiennent à l’enseignement supérieur, hors tout circuit commercial, et elles ont, du fait de leur nombre, leur richesse et qualité mais aussi leur représentativité, un grand intérêt pour la veille et l’innovation."

Image:Capture d’écran 2016-01-20 à 12.06.05.png

  • cf. supra "cadre législatif"

[modifier] retour sur l'étude de cas


[modifier] Seconde Partie (ED niçoises): Gérer et diffuser ses données : principes et bonnes pratiques / Mathieu Saby (BU UNS)

Support sur Jalon: Gérer et diffuser ses données : principes et bonnes pratiques



[modifier] Syndication