Intervention de: Andrea Del Lungo (Université de Lille), Pierre Glaudes (Université Paris-Sorbonne), Tania Duclos et Maxime Perret (post-doctorants affectés au projet Phoebus)
Le Projet d'Hypertexte de l'OEuvre de Balzac reposant sur l'Utilisation de Similarités consiste à mettre en résonance l'ensemble de l'oeuvre balzacienne (La Comédie humaine, les romans de jeunesse, les contes drolatiques, le théâtre et les oeuvres diverses) avec un vaste corpus d'écrits contemporains, à aires culturelles multiples et de nature variée, qui ont pu la nourrir : oeuvres romanesques d'autres auteurs de l'époque , recueils collectifs de littérature panoramique (auxquels Balzac apporta des contributions), ouvrages scientifiques susceptibles d'avoir influencé la création balzacienne, notamment dans les domaines de la médecine, de la physiologie et des sciences naturelles. L'objectif du projet est de permettre des recherches et des comparaisons intertextuelles élaborées à l'intérieur de l'oeuvre de Balzac, et dans le corpus plus vaste de textes littéraires et scientifiques de l'époque, entre 1800 et 1850, afin de faire émerger des correspondances, de repérer des emprunts, des citations, des reprises, des plagiats éventuels. L'ambition est de constituer ainsi une cartographie de l'univers intellectuel de Balzac à partir des traces que d'autres textes ont laissées dans l'oeuvre.
Le projet se situe dans le domaine des humanités numériques et vise à fournir à la communauté scientifique de nouveaux outils d'interrogation de vastes corpus textuels, susceptibles de permettre une connaissance approfondie de phénomènes génétiques, poétiques, stylistiques, ainsi que de leurs implications en termes idéologiques. Du point de vue de la méthodologie littéraire, il se situe dans le domaine de l'intertextualité, de l'interdiscursivité et de la génétique. Dans ce sens, le corpus balzacien offre un champ d'application particulièrement fécond car Balzac a la spécificité de multiplier les supports d'écriture (livres, volumes collectifs, feuilletons, articles de journal), en réutilisant ses textes antérieurs. En même temps, son oeuvre, qui définit par son ampleur l'état socio-historique contemporain, se nourrit de l'apport d'autres textes, notamment ceux de la littérature panoramique, et intègre diverses formes de savoir qui dépassent le champ littéraire. Au terme de ce projet, on sera en mesure de cartographier les sources que Balzac a utilisées au cours de l'écriture des différents romans de La Comédie humaine.
Au niveau de l'informatique, dans le cadre d'une recherche sur les méthodes d'exploitation de vastes corpus textuels qui se pose aujourd'hui comme une nécessité, notre projet vise à mettre à profit les techniques algorithmiques contemporaines pour explorer systématiquement les réseaux de réutilisations textuelles. L'étude porte donc sur la mise en évidence automatique de réseaux de segments textuels présents à l'intérieur d'une oeuvre d'un auteur qui proviennent de l'ensemble de cette oeuvre et d'un corpus contemporain plus large. Nous souhaitons, dans ce projet, utiliser ces techniques pour fabriquer un prototype informatique de repérage de réemplois pour l'analyse intertextuelle, qui fournira aux chercheurs une méthode originale d'interrogation de très vastes corpus textuels.
La finalité du projet est donc de réaliser un objet scientifique nouveau en termes de méthode et de corpus : une édition hypertextuelle de Balzac, que personne n'a encore procurée à ce jour, comprenant une bibliothèque virtuelle constituée d'ouvrages qui appartenaient à son univers intellectuel. Cette édition sera accessible dans un site dédié, présentant trois manières d'utilisation : une visualisation générale sur le mode d'une cartographie, donnant des informations d'ordre statistique et quantitatif ; un déroulement linéaire permettant d'accéder à la comparaison entre les textes sources et les textes cibles par un système de double fenestrage ; la lecture intégrale d'une oeuvre de Balzac, en « feuilletant » un texte dont les parties qui présentent des homologies avec d'autres textes seraient signalées. Une fois testée sur Balzac, cette approche pourrait être généralisée à bien d'autres auteurs du patrimoine.
Le projet Phoebus est financé par l'ANR pour la période 2015-2018 et voit la collaboration de trois équipes:
- Alithila de l'université de Lille, responsable: Andrea Del Lungo
- CELLF de l'université Paris-Sorbonne, responsable: Pierre Glaudes
- LIP6 de l'université Paris 6, responsable: Jean-Gabriel Ganascia
URI/Permalink: