Au-delà de la seule numérisation de données de la recherche, l'enjeu des humanités numériques est de nature heuristique. Il s'agit en effet de permettre l'exploration des données (corpus textuels ou oraux, données brutes, images...) avec des techniques numériques (textmining, cartographie, visualisation...) afin de construire un sens nouveau. C'est dans cette perspective que s'inscrit le projet proposé d'un séminaire en trois journées thématiques.
Avec le développement de l'eScience, l'accès aux données de la recherche devient un enjeu important pour les dispositifs de la communication et veille scientifique. Tandis que les projets d'infrastructure portent avant tout sur de grands réservoirs de données (big data), d'autres résultats de la recherche restent moins accessibles. Nous nous intéressons aux petits ensembles de données (small data), produits par des doctorants et diffusés avec les thèses de doctorat : des annexes, du matériel audio-visuel, des tableaux et bases de données, résultats bruts d'enquêtes etc. Hier déposé comme matériel complémentaire avec un exemplaire de la thèse dans les BU, aujourd'hui, avec la mise en place des dispositifs de thèses électroniques, ce matériel est ou pourrait être diffusé sur des serveurs et plateformes documentaires. Source potentiellement riche d'information dans tous les domaines scientifiques, ce matériel est pourtant peu exploité à ce jour. Un intérêt particulier est la nature non commerciale et publique de la plupart de ces résultats. Notre travail consiste à faire le point sur ce matériel et à dresser un premier état des questions et problèmes à soulever pour ouvrir ces small data à la communication scientifique.
GERiiCO (Groupe d'études et de recherche interdisciplinaire en information et communication)
URI/Permalien: