Colloque DHNord 2021

Publier, partager, réutiliser les données de la recherche
Les data papers et leurs enjeux

S’il est un constat sur lequel la majorité des chercheurs en SHS s’accorde à propos de l’impact du numérique dans leur pratique, c’est celui d’un renouvellement profond de l’édition scientifique, qu’il s’agisse des possibilités ouvertes par l’édition numérique, de la publication des données de la recherche ou encore de la révision des modèles économiques.

C’est dans ce contexte que depuis 10 ans se développent de plus en plus d’expérimentations autour des data papers en SHS. Venus des sciences de la vie et de la terre, leur définition varie en fonction des domaines et des pratiques. Davantage consacrés aux données qu’aux résultats de la recherche, les data papers se présentent comme un complément aux publications scientifiques traditionnelles. Ils permettent avant tout de décrire les jeux de données de la recherche afin de les disséminer, favoriser leur réutilisation ou encore la reproductibilité de la recherche. Parfois, ils sont accompagnés de code exécutable (executable papers) ou encore de modélisations, voire d’analyses.

Les data papers, étroitement liés à la science ouverte, soulèvent donc plusieurs enjeux pour les SHS : ils interrogent la nature des données, leur ouverture, leur documentation, leurs publics et leurs éventuelles réutilisations. Ils font également écho au développement du data journalisme, qui s’interroge parfois aussi sur des façons de publier les données ou de pointer vers celles-ci, en complément aux publications des articles et récits qui s’appuient sur des données. À l’heure où plusieurs revues en SHS intègrent, ou souhaitent intégrer, des data papers à leurs formats de publications scientifiques, le colloque #dhnord2021 sera consacré aux data papers en SHS et à leurs enjeux scientifiques, éditoriaux ou sociaux. Les communications pourront notamment aborder les sujets suivants : publication des données en SHS, exemples de data papers, ouverture des données de la recherche, reproductibilité en SHS, création de nouveaux modèles éditoriaux, data journalisme, développement d’outils ou de méthodes de publication des données, public(s) des data papers.

Ateliers

Les executable papers

Michael Nauge, ingénieur de recherche à l’Université de Poitiers.

9h-12h30

Pré-requis :

  • Savoir ce qu’est un article scientifique "traditionnel".
  • Comprendre ce qu’est l’algorithmie, la programmation et l’analyse de données.

Objectifs : Être capable d’envisager l’écriture d’un article scientifique combinant habilement : textes, données numériques, codes, visualisations.

Programme :

  • Démo : article scientifique exécutable : but, intérêt, démonstration, explication.
  • TP : écriture de texte en markdown + écriture de code pour chargement d’une matrice de données et génération de graphiques interactifs + sensibilisation au concept de TIDY data.

Environnement utilisé : Jupyter

Publier dans le Journal of Digital History

Lars Wieneke et Elisabeth Guerard (C²DH, Université du Luxembroug)

14h-17h

Pré-requis :

  • 1ère partie : aucun.
  • 2ème partie : avoir des notions de programmation ou d’analyse de données.

Objectifs :

  • 1ère partie : connaître le fonctionnement du JDH.
  • 2ème partie : savoir utiliser un jupyter notebook.

Programme :

  • Démonstration de l’utilisation d’un Jupyter notebook : 90min.
  • TP, apprendre à utiliser un jupyter notebook : 90min.

La seconde partie se fera en groupe restreint de 10 personnes afin d’assurer l’accompagnement nécessaire.

Des programmes au cœur de l’édition scientifique
Écritures, appropriations, réutilisations des articles exécutables

Nicolas Sauret, Stéphane Pouyllau et Mélanie Bunel (Huma-Num Lab)

9h-12h30

Description :

Comment appréhende-t-on un data paper ? Comment exploiter ce format et quelles opportunités ouvre-t-il pour la recherche en SHS ? Dans cet atelier, nous proposons de mener une réflexion collective pour répondre à ces questions en projetant plusieurs scénarios d’usage. Il s’agira d’imaginer des modalités d’évaluation et d’appropriation et de dessiner ainsi la fonction épistémologique de ces nouveaux objets éditoriaux. L’atelier sera l’occasion d’utiliser notamment l’instance Gitlab d’Huma-Num et Callisto, la plateforme prototype Jupyter Lab du HN Lab.

Pré-requis : Avoir des notions de programmation ou d’analyse de données.

Programme

Le data paper
Une nouvelle forme de publication scientifique en SHS

Conférences

13h30-15h30

D’artefacts archéologiques à artefacts documentaires : les data papers en archéologie. Le cas du Journal of Open Archaeology Data
Chérifa Boukacem Zeghmouri (Université Lyon 1)

Révéler les formes et logiques de citation des data papers en archéologie : le cas du Journal of Open Archaeology Data
Violaine Rebouillat (Université Lyon 1)

Le Journal of Open Humanities Data : enjeux et défis dans la publication de data papers pour les SHS
Paola Marongiu (Université de Neuchâtel)
Nilo Pedrazzini (University of Oxford)
Marton Ribary (University of Surrey)
Barbara McGillivray (Alan Turing Institute)

Table ronde

16h-18h

Modération : Michael Nauge (Université de Poitiers)

Interventions :

  • Chérifa Boukacem Zeghmouri (Université Lyon 1)
  • Violaine Rebouillat (Université Lyon 1)
  • Paola Marongiu (Université de Neuchâtel)
  • Nilo Pedrazzini (University of Oxford)

Écrire des data papers en SHS
Exemples et partages d'expériences (#1)

Conférences

13h30-15h

Adressbuch 1854
Mareike König (Deutschen Historischen Instituts Paris)
Evan Virevialle (Université Paris 1 Panthéon-Sorbonne)
Gérald Kembellec (Deutschen Historischen Instituts Paris)

Utiliser les R Notebooks en traitement automatique des langues : un exemple de classification automatique supervisée de mémoires et thèses universitaires
Vincent Arnaud, Kevin Bouchard & Gilles-Philippe Morin (Université du Québec à Chicoutimi)

Keynote

16h-18h

Découvrir le Journal of Digital History
Frédéric Clavert, Lorella Viola, Lars Wieneke & Ori Elisar (C²DH, Université du Luxembourg)

Écrire des data papers en SHS
Exemples et partages d'expériences (#2)

Conférences

13h30-15h

Un data paper en SHS : pourquoi, pour qui, comment ?
Victor Gay (Toulouse School of Economics)

Phoebus e-Balzac : édition numérique exhaustive d’un monument littéraire
Karolina Suchecka (Université de Lille)
Victoria Le Fourner (MESHS)

Cultures visuelles en SHS. Construire un corpus de 470 000 images scientifiques avec du deep learning
Pierre Carl Langlais (Université de Montpellier Paul-Valéry)

Posters

15h-16h

La mise en œuvre de mécanismes de citation de données : un socle solide pour bâtir des data papers
Edward Gray et Nicolas Larrousse (Huma-Num)

Sur l’hétérogénéité des données pratiques consacrées à l’homogénéisation des données des différents fonds d’archives audiovisuelles (projet CROBORA)
Shiming Shen (Université Côté d’Azur)

Réutiliser les corpus numériques formés par OCR : inspection du bruit et du silence
Caroline Parfait, Jean-Baptiste Tanguy et Gaël Lejeune (Sorbonne Université)

Table ronde

16h-18h

Modération : Sébastien de Valeriola (Université Libre de Bruxelles)

Interventions :

  • Pierre Carl Langlais (Université Paul Valéry, Montpellier 3)
  • Evan Virevialle (Université Paris 1 Panthéon-Sorbonne)
  • Gérald Kembellec (Deutschen Historischen Instituts Paris)
  • Vincent Arnaud (Université du Québec à Chicoutimi)
  • Victor Gay (Toulouse School of Economics)
  • Karolina Suchecka (Université de Lille)
  • Victoria Le Fourner (MESHS)

Keynote

16h-18h

Des articles et des données : L’écosystème des data papers
Joachim Schöpfel (Université de Lille)

Outils et infrastructures

Conférences

13h30-15h30

HTR-United : mutualisons la vérité de terrain !
Alix Chagué et Laurent Romary (Inria)
Thibault Clérice (Université Lyon 3)

Vers un écosystème d’écriture et d’édition avec les données
Nicolas Sauret (Université Paris-Nanterre)
Stephane Pouyllau (CNRS)
Mélanie Bunel (Huma-Num)

Comment passer de l’entrepôt de données aux data papers ? Retour sur l’expérience de data.sciencespo : difficultés rencontrées et pistes de solutions
Guillaume Garcia (Sciences Po Paris)
Alina Danciu, Anna Egea, Delphine Lereculeur & Cyril Heude (Sciences Po)

Data papers et dissémination des données de la recherche : quelles pratiques en SHS ?
Mariannig Le Béchec (Université Lyon 1)
Iana Atanassova (Université de Franche-Comté, Institut Universitaire de France)

Table ronde

16h-18h

Modération : Pierre Mounier (OpenEdition)

Interventions :

  • Alix Chagué (Inria)
  • Nicolas Sauret (Université Paris-Nanterre)
  • Guillaume Garcia (Sciences Po Paris)
  • Mariannig Le Béchec (Université Lyon 1)
  • Iana Atanassova (Université Franche-Comté, Institut Universitaire de France)

Informations

Du 15 au 19 novembre 2021

En ligne

Comité scientifique

  • Clarisse Bardiot (UPHF)
  • Juliette De Maeyer (Université de Montréal)
  • Marjolaine Boutet (UPJV)
  • Hervé Flanquart (ULCO)
  • Antoine Jacquet (ULB / Bibliothèque royale de Belgique)
  • Gerald Kambellec (CNAM)
  • Marine Roussillon (Université d’Artois)
  • Joachim Schopfel (Université de Lille)
  • Dominique Trudel (Université du Québec à Chicoutimi)
  • Philippe Useille (UPHF)
  • Sebastien de Valeriola (ULB)

Comité d’organisation

  • Humanités numériques : Florence Perret et Victoria Le Fourner
  • Communication : Mathilde Wybo et Quentin Gonot
  • Régie technique et logistique : Alexis Grillon, Denis Duvet et Marie-Catherine Malaquin
  • Gestion financière : Dominique Santolini
  • Crédits vidéo : La Fractale

Partenaires

CRIHN