Stéréotypes viraux : analyser les circulations historiques de l’image médiatique au prisme du deep learning,
Pierre-Carl Langlais, Université Paul-Valéry Montpellier 3 and Sorbonne Université
Retrouvez cette présentation (version augmentée) en plein écran ici
Résumé
La numérisation massive des collections patrimoniales a ouvert de nouvelles perspectives de recherche sur la dissémination nationale et internationale des productions culturelles et médiatiques. Des travaux récents en humanités numériques s’appuyent sur des outils de détection automatique de reprises de textes. Le projet Numapresse a entrepris d’étendre l’analyse de la viralité médiatique aux productions visuelles, en utilisant un corpus pilote de 100 000 illustrations extraites de magazines et de quotidiens de 1850 à 1914. L’identification des images réimprimées est basée sur un modèle d’apprentissage profond. Le modèle ne permet pas seulement d’explorer plus facilement les motifs visuels internes au corpus : les données générées par les différentes couches du processus d’apprentissage peuvent être détournées pour repérer des similitudes et des régularités visuelles.
Après plusieurs tentatives nous avons privilégié les données de la troisième couche : elles représentent apparemment un équilibre optimal entre les données trop descriptives, des couches précédentes et les données trop abstraites, des couches suivantes (qui tentent de converger autant que possible sur l’ontologie du modèle). L’identification des reprises et des régularités visuelles contribue ainsi à faire émerger une analyse structurelle globale des flux de circulation d’images. Sans surprise nous avons pu repérer un grand nombre de reprises dans le Voleur illustré, qui a agi comme un agrégateur de contenu visuel au XIXe siècle.
Biographie
Pierre-Carl Langlais est un chercheur en science de l’information et de la communication et en humanités numériques. Sa thèse consacrée à une lecture "distante" de la naissance de la chronique boursière au 19e siècle a été distinguée par le prix de la recherche 2016 de la Société française des sciences de l’information et de la communication. Il est actuellement post doctorant pour le projet Numapresse, un projet en humanités numériques dédié à l’exploration de grands corpus d’archives de presse ancienne. Investi dans le mouvement du libre accès, il a rédigé un rapport sur les nouveaux modèles de l’édition scientifique pour le ministère de la recherche français en 2016, lequel a inspiré l’appel de Jussieu pour la science ouverte. En 2020, il publie son premier livre en collaboration avec Marie-Ève Thérenty et Julien Schuh aux éditions du CNRS : “Fake new & viralité avant Internet : les lapins du Père-Lachaise et autres légendes médiatiques."
URI/Permalien: