La base de données francophone belge du CIEL (Collectif interuniversitaire d’étude du littéraire)

The CIEL Franco-Belgian Database (Collectif interuniversitaire d’étude du littéraire

La base de datos francófona belga de CIEL (Colectivo interuniversitario de estudio de lo literario)

Björn-Olav Dozo

Traduction(s) :
The CIEL Franco-Belgian Database (Collectif interuniversitaire d’étude du littéraire)

Citer cet article

Référence électronique

Björn-Olav Dozo, « La base de données francophone belge du CIEL (Collectif interuniversitaire d’étude du littéraire) », Biens symboliques / Symbolic Goods [En ligne], 2 | 2018, mis en ligne le 02 mai 2018, consulté le 18 août 2018. URL : https://revue.biens-symboliques.net/225

Comment est né le projet de base de données ?

La base de données du Collectif interuniversitaire d’étude du littéraire (CIEL) est le fruit d’une collaboration entre l’Université libre de Bruxelles et l’Université de Liège : cette initiative de recherche collective a été dirigée par Paul Aron et Jean-Marie Klinkenberg et coordonnée par Benoît Denis. Ce projet fut financé par la Communauté française de Belgique de 2002 à 2007 à Liège et à Bruxelles, puis de 2008 à 2013 à Bruxelles. Plusieurs thèses ont été réalisées en son sein1.

La base de données a été réalisée par le Centre informatique de philosophie et lettres (CIPL), alors sous la direction de Gérald Purnelle2. Le CIPL, créé en 1983 à l’Université de Liège, est une Unité décentralisée d’informatique (UDI), qui correspond actuellement à un centre de recherche et de développement en humanités numériques. Son objectif général est de promouvoir et coordonner l’utilisation de l’informatique au sein de la faculté de philosophie et lettres de l’Université de Liège et d’assurer l’accompagnement et les développements des projets informatiques pour la recherche et l’enseignement.

Luc Desert, informaticien au CIPL, a développé la base du CIEL de 2002 à 2005. Formé par ce dernier, Björn-Olav Dozo a d’une part assuré (avec Daphné de Marneffe) l’encadrement des étudiants chargés de compléter la base de données et d’autre part exploité les données de manière sérielle.

Comment les corpus ont-ils été délimités ?

La base a deux objectifs principaux : l’un patrimonial, l’autre plus « expérimental ». Le premier découle du constat que l’histoire de la littérature belge de langue française s’est écrite au gré d’initiatives éparses, provoquant de grandes disparités dans la documentation actuellement disponible. La constitution de la base de données vise d’abord à compiler les informations déjà existantes, à les corriger s’il y a lieu, puis à les mettre à jour. Le support informatique est le format idéal pour ce type de données en incessant devenir. Le deuxième objectif vise à traiter statistiquement cette masse de données.

La base reprend, à l’heure actuelle, toutes les données prosopographiques disponibles dans les différents travaux existants, tels la Biographie nationale (Thiry, puis Bruylants et Christophe puis Bruylants [dir.] 1866-1986), la Nouvelle Biographie nationale (1988), la Bibliographie des écrivains francophones belges (Brucher puis Detemmerman [dir.] 1958-1988) ou le Dictionnaire des œuvres (Nachtergaele & Trousson 1988 ; Berg & Frickx 1988 ; De Grève, d’Heur, Pouilliart 1989 ; Frickx R. et alii 1994). De nombreuses monographies sur la littérature belge ont été dépouillées systématiquement, ainsi que des annuaires professionnels (Mayeur 2010)3, des listes de membres, des signataires de manifestes et d’autres textes collectifs. Des registres de naissance, de décès et de résidence ont fait l’objet d’enquêtes de première main, à Bruxelles et à Liège principalement, mais aussi ponctuellement dans d’autres villes de Belgique. Ces données sont structurées et mises en relation de manière raisonnée. La base reprend des données factuelles, non analysées et le moins possible formatées, c’est-à-dire que la saisie de ces données est divisée en deux temps : une première saisie conforme à la source, puis une deuxième, complémentaire, à visée analytique.

La constitution des bases de données s’appuie-t-elle sur un ancrage théorique et/ou disciplinaire précis ?

Lorsque l’on parle de bases de données en lettres, on pense souvent aux grands corpus littéraires numérisés, du type Frantext ou, pour la Belgique, « Beltext ». Ces bases de données sont surtout mobilisées par les linguistes. L’histoire de la littérature en fait peu d’usage, même si les choses évoluent, notamment avec les perspectives ouvertes par les travaux de Franco Moretti (2008). À côté de ces bases de données textuelles, l’histoire de la vie littéraire et la sociologie des écrivains a développé ses propres bases de données. La base de données du CIEL en constitue un exemple pionnier en la matière.

Quels logiciels avez-vous utilisés pour bâtir l’infrastructure des bases de données, et, le cas échéant, pour leur exploitation statistique ?

Le cœur de la base de données a été développé sous Microsoft Access, pour des raisons de facilité de déploiement et de possibilité de rapides amendements lors des premières phases du développement (allers-retours entre les chercheurs qui dépouillaient les sources et l’informaticien, avec un chercheur jouant le rôle d’interface entre les deux métiers). La montée en charge s’est bien déroulée : sur le réseau local de l’université, MS Access permettait l’encodage simultané au sein de la base de données de jusqu’à vingt personnes en même temps, via les formulaires spécifiques.

En revanche, quand il a fallu saisir de l’information à distance, via Internet, lors de dépouillement à plusieurs en bibliothèque par exemple, différentes pages web en ASP.NET ont dû être développées. Grâce à elles, il est possible de modifier la base de données à distance à plusieurs, sans souci de synchronisation de copies différentes. La seule nécessité était de disposer d’une connexion internet, ce qui est un enjeu mineur aujourd’hui.

Enfin, pour la base de données publique, nous avons choisi de transformer la base de données MS Access en une infrastructure plus robuste pour supporter de plus nombreuses connexions multiples, en utilisant Microsoft SQL, toujours avec une couche web ASP.NET4. Chaque nuit, la base de données MS Access (celle qui est modifiable en ligne) est d’une part sauvegardée et d’autre part dupliquée en MS SQL et écrase la version antérieure de la base de données publique (uniquement consultable en ligne).

Concernant l’exploitation statistique de la base de données, étant donné que nous travaillions dans l’environnement de Microsoft, nous avons eu recours, pour les analyses factorielles, à un plug-in payant pour Excel, XL-Stat, qui offre une interface assez claire et accessible. Pour l’analyse structurale de réseaux sociaux, nous avons utilisé le logiciel standard en 2005, Ucinet, et son pendant graphique, Netdraw. En revenant sur ces logiciels, vu de 2017, et en utilisant maintenant Gephi par exemple, on ne peut que constater que le temps passe…

Pouvez-vous donner en exemple un ou deux résultats scientifiques (attendu ou surprenant) obtenus à l’aide des bases de données ?

L’un des acquis majeurs de la base de données du CIEL fut la démonstration de l’importance des animateurs de la vie littéraire en Belgique francophone. Si l’intuition des chercheurs porteurs du projet au départ allait dans le sens d’une « institution littéraire faible » (Aron & Denis 2006), faisant une large place aux relations interpersonnelles dans la structuration du sous-champ littéraire belge francophone, la collecte systématique des données et leur mise en série permit de confirmer et d’expliciter cette intuition (Dozo 2011).

À partir de la reconstitution (reconstruction) du réseau des relations individuelles des écrivains, nous avons repéré les cas intéressants en utilisant des indicateurs de centralité pour chaque individu. Certains écrivains ont ainsi des indices de centralité très élevés, ce qui permet de les distinguer des autres. Parmi les écrivains qui se distinguent, certains étaient attendus, étant donné la connaissance préalable que l’on a de leur rôle au sein de l’histoire littéraire (Franz Hellens, Albert Mockel, etc.) ; d’autres l’étaient beaucoup moins, comme Gaston Pulings, Pierre Fontaine ou encore Paul Werrie. Ces écrivains au grand nombre de relations, ou à la position structurale relationnelle remarquable (voir le concept de trous structuraux), nous les avons nommés les animateurs de la vie littéraire (Dozo 2014).

Un autre usage de la base de données fut le portrait statistique de l’espace social et littéraire en Belgique francophone. Au moyen d’analyses factorielles, nous avons pu situer les générations littéraires actives et leurs traits significatifs (Dozo 2009), ou nous concentrer sur une profession et interroger son articulation avec la pratique de la littérature (Dozo 2010). On peut aussi citer la géolocalisation des résidences des écrivains bruxellois à différentes époques de développement de la ville (Debroux, Dozo, Vanderpelen 2015).

Qu’envisagez-vous pour la pérennité et l’accessibilité de ces données numérisées ?

La base de données est disponible dans une version publique à l’adresse ciel.philo.ulg.ac.be. Elle est accessible gratuitement sur inscription et offre une consultation par fiche « auteur », « œuvre » et « revue ». La section « revues » offre d’importantes ressources numérisées, fruit du deuxième projet ARC CIEL porté par l’Université libre de Bruxelles, sous la direction de Paul Aron. Quelques requêtes croisées sont également disponibles (événements sur une année, lieux, etc.).

1 Sur la genèse du projet CIEL, se reporter à l’article de Paul Aron, Benoît Denis et Jean-Marie Klinkenberg (2006).

2 Actuellement président du CIPL, et enseignant-chercheur chargé des cours de poésie francophone de Belgique. La direction du CIPL est assurée par

3 [En ligne] http://textyles.revues.org/113 [consulté le 12 février 2018].

4 À refaire, une solution à partir de logiciels libres serait sans doute envisagée, mais les compétences des informaticiens étaient du côté des

Aron Paul & Denis Benoît (2006). « Réseaux et institution faible ». In Marneffe (de) Daphné & Benoît Denis (éd.). Les Réseaux littéraires. Bruxelles, Le Cri/CIEL/ULB/ULg : 7-18.

Aron Paul, Denis Benoît, Klinkenberg Jean-Marie (2006). « Littérature belge et recherche collective ». Textyles, 29 : 90-97. [En ligne] http://textyles.revues.org/455 [consulté le 15 janvier 2018].

Berg Christian & Frickx Robert (dir.) (1988). Lettres françaises de Belgique. Dictionnaire des œuvres. II. La poésie. Louvain-la-Neuve, Duculot.

Brucher Roger puis Detemmerman Jacques (dir.) (1958-1988). Bibliographie des écrivains français de Belgique. Bruxelles, Palais des Académies, 5 vol.

Debroux Tatiana, Dozo Björn-Olav, Vanderpelen Cécile (2015). « Les lieux d’habitation des écrivains belges francophones à Bruxelles (1930-1960). Premiers jalons pour une histoire sociogéographique ». Textyles, 46 : 139-157.

De Grève Marcel, d’Heur Jean-Marie, Pouilliart Raymond (dir.) (1989). Lettres françaises de Belgique. Dictionnaire des œuvres. III. Le Théâtre et l’Essai. Louvain-la-Neuve, Duculot.

Dozo Björn-Olav (2009). « Sociabilités et réseaux littéraires au sein du sous-champ belge francophone de l’entre-deux-guerres ». Histoire & Mesure, XXIV(1) : 43-72.

Dozo Björn-Olav (2010). « Portrait statistique de l’écrivain journaliste en Belgique francophone entre 1920 et 1960 ». Textyles, 39 : 123-146.

Dozo Björn-Olav (2011). Mesures de l’écrivain. Profil socio-littéraire et capital relationnel dans l’entre-deux-guerres en Belgique francophone. Liège, Presses Universitaires de Liège – Sciences humaines.

Dozo Björn-Olav (2014). « Les animateurs de la vie littéraire en Belgique francophone : de leur rôle interne à leur position de médiateur transnational ». In Blanchard Nelly & Thomas Mannaig (dir.). Des littératures périphériques. Rennes, Presses Universitaires de Rennes : 251-263.

Frickx Robert et alii (1994). Lettres françaises de Belgique. Dictionnaire des œuvres. IV. 1981-1990. Louvain-la-Neuve, Duculot.

Mayeur Ingrid (2010). « Les écrivains-journalistes (1920-1960) ». Textyles, 39 : 145-168. [En ligne] http://textyles.revues.org/113 [consulté le 12 février 2018].

Moretti Franco (2008). Graphes, cartes et arbres. Modèles abstraits pour une autre histoire de la littérature. Traduit de l’anglais par Étienne Dobenesque. Paris, Les Prairies ordinaires.

Nachtergaele Vic & Trousson Raymond (dir.) (1988). Lettres françaises de Belgique. Dictionnaire des œuvres. I. Le roman. Louvain-la-Neuve, Duculot.

Nouvelle biographie nationale (1988-). Bruxelles, Académie royale des sciences, des lettres et des beaux-arts de Belgique, 6 vol.

Thiry H., puis Bruylants E. et Christophe Ch. puis Bruylants E. (dir.) (1866-1986). Biographie nationale publiée par l’Académie royale des sciences, des lettres et des beaux-arts de Belgique. Bruxelles, H. Thiry/van Buggenhoudt, 44 vol.

1 Sur la genèse du projet CIEL, se reporter à l’article de Paul Aron, Benoît Denis et Jean-Marie Klinkenberg (2006).

2 Actuellement président du CIPL, et enseignant-chercheur chargé des cours de poésie francophone de Belgique. La direction du CIPL est assurée par Björn-Olav Dozo depuis septembre 2016.

3 [En ligne] http://textyles.revues.org/113 [consulté le 12 février 2018].

4 À refaire, une solution à partir de logiciels libres serait sans doute envisagée, mais les compétences des informaticiens étaient du côté des solutions logicielles de Microsoft.

© Presses Universitaires de Vincennes 2018