Les Journées dataSHS 2018 proposent un choix d'ateliers d'initiation aux méthodes de traitement et d'analyse de données en sciences humaines et sociales. Plus particulièrement, les ateliers ont deux objectifs :
1) faire acquérir aux participants des notions théoriques sur des méthodes d'analyse et de représentation de données numériques en sciences humaines et sociales afin que ceux-ci puissent les adapter à leurs propres travaux ;
2) initier les participants via des travaux pratiques au traitement, à la structuration et à l'analyse de données.
Les ateliers sont basés sur des logiciels libres et de prise en main accessible. Ils sont ouverts aux étudiants (niveau Master 2 et doctorat), aux jeunes chercheurs, aux enseignants-chercheurs et ingénieurs des laboratoires affiliés à la MESHS. La participation est libre mais se fait sur inscription, dans la limite de 15 places par atelier.
Les ateliers se déroulent les 10-14 décembre 2018 à la MESHS de 9h à 17h. Ils sont organisés par l'axe Humanités numériques et la Plateforme universitaire de données de Lille. Cette action de formation bénéficie du soutien financier du Conseil régional des Hauts-de-France dans le cadre du contrat de plan État-Région ISI-MESHS.
Lundi 10 décembre : Nettoyage et harmonisation de bases de données
Mardi 11 décembre : Cadre juridique et gestion de données de la recherche
Mercredi 12 décembre : Analyse de données textuelles (transcriptions d'entretiens) avec Sonal
Jeudi 13 décembre : Analyse de réseaux en sciences humaines et sociales
Vendredi 14 décembre : Cartographie avec Magrit
Participation libre dans la limite de 15 places par atelier.
Les inscriptions seront confirmées par e-mail. En cas de forte demande pour un atelier, les demandes seront placées en liste d'attente et retenues en fonction de désistements éventuels.
Lundi 10 décembre : Nettoyage et harmonisation de bases de données
Intervenant: Julien Boelaert (MCF en science politique, CERAPS, Université de Lille)
L'une des premières difficultés que peuvent présenter les bases de données, en particulier en présence de données texte (noms, phrases, ...), sont les petites scories qu'elles contiennent : fautes d'orthographe, conventions de notations différentes... Avant tout traitement statistique, il faut alors nettoyer ou harmoniser la base. L'objectif de cette journée est précisément de familiariser les participants aux outils de nettoyage de données. Nous traiterons d'une part les expressions régulières (regex), un langage de requêtes qui permet de faire des recherches complexes, d'extraire des informations et de nettoyer des données de texte. Nous passerons pour cela par des fonctions R, mais les regex sont un langage commun à beaucoup d'autres programmes de traitement de données. D'autre part, nous emploierons le logiciel OpenRefine, qui permet d'harmoniser de façon efficace des données texte.
Mardi 11 décembre : Cadre juridique et gestion de données de la recherche
| Matin
La réglementation relative aux données à caractère personnel en sciences sociales
Intervenant: Thomas Soubiran (Ingénieur d'études en analyse de données, CERAPS, CNRS)
Comment mettre en conformité un projet de recherche en sciences humaines et sociales au regard de la réglementation applicable aux données personnelles ? Cet atelier rappellera les notions clefs et les grands principes de la réglementation. Il en développera ensuite les implications pratiques à partir d’exemples concrets correspondant aux différentes étapes de la recherche (collecte, analyse, conservation).
| Après-midi
Principes et enjeux de la gestion des données de la recherche
Intervenante: Marie Puren (Chercheuse post-doctorale, LARHRA)
L'atelier vise à présenter les principes et les enjeux de la gestion des données de la recherche pour ensuite permettre aux participant(e)s de prendre en main les problématiques liées à la création d’un plan de gestion des données à l'aide de l'outil DMP Opidor. Des jeux de données leur seront fournis, mais les participant(e)s qui le souhaitent sont vivement incité(e)s à travailler sur leurs propres jeux de données.
Mercredi 12 décembre : Analyse de données textuelles (transcriptions d'entretiens) avec Sonal
Intervenant: Alex Alber (MCF en sociologie, Université de Tours)
Description : L'atelier visera à familiariser les participants avec le maniement des corpus audio-textuels dans le logiciel Sonal et présentera divers outils d'analyse, notamment lexicométriques. La matinée sera consacrée à l'organisation des données (importation des fichiers texte/son/vidéo, ajout de méta-données, retranscription, thématisation). L'après-midi proposera différents exercices d'extraction et d'analyse à partir des matériaux.
Voir la présentation du logiciel SONAL par Alex Alber.
Jeudi 13 décembre : Analyse de réseaux en sciences humaines et sociales
| Matin
Introduction à la théorie de l’analyse de réseaux et à la théorie des graphes
Intervenant : Fabien Eloire (MCF en sociologie, CLERSE, Université de Lille)
| Après-midi
Atelier basé sur Cytoscape, logiciel pour l'analyse et visualisation de réseaux
Intervenant : Guillaume Brysbaert (Ingénieur de recherches en bioinformatique, UGSF, Université de Lille)
Description : L'atelier permettra aux participants de découvrir et pratiquer les fonctionnalités du logiciel Cytoscape. Les participants auront l'occasion de travailler sur l'import et le filtrage des données, la visualisation et l'analyse de réseaux (mesures de centralité, etc.), l’export de données. L'atelier sera conclu par une discussion autour des données des participants.
Liens utiles: tutoriel Cytoscape (en français); tutoriels Cytoscape (en anglais).
Vendredi 14 décembre : Cartographie avec Magrit
Intervenants: Nicolas Lambert (Ingénieur en cartographie thématique et développement web, RIATE), Ronan Ysebaert (Ingénieur en traitement et analyse de bases de données, RIATE)
Description : Magrit est une application de cartographie en ligne qui permet réalisation de représentations cartographiques usuelles telles que les cartes choroplèthes ou les cartes en symboles proportionnels. D’autres types de cartes sont aussi proposés: lissages, carroyages, discontinuités, anamorphoses, etc. Magrit entend couvrir dans un même environnement logiciel, l’ensemble de la chaîne de traitement, de la donnée géographique à la carte d’édition. Des jeux de données seront fournis par les formateurs. Toutefois, les participant(e)s peuvent venir avec leurs propres données et travailler dessus.
URI/Permalink: