Arpenter la vie littéraire

Les bases de données dans les études sociohistoriques sur l’imprimé et la littérature

Surveying Literary Life. The Use of Databases in Sociohistorical Studies of Print and Literature

Recorrer la vida literaria. Las bases de datos en los estudios socio-históricos sobre el impreso y la literatura

Claire Ducournau et Anthony Glinoer

Traduction(s) :
Surveying Literary Life

Citer cet article

Référence électronique

Claire Ducournau et Anthony Glinoer, « Arpenter la vie littéraire », Biens symboliques / Symbolic Goods [En ligne], 2 | 2018, mis en ligne le 12 avril 2018, consulté le 19 novembre 2018. URL : https://revue.biens-symboliques.net/211

À rebours des élans actuels en faveur du caractère soi-disant disruptif des « humanités numériques », ce dossier porte sur la manière dont les études sociohistoriques sur l’imprimé et le littéraire ont, hier comme aujourd’hui, construit et utilisé des bases de données. Le recours aux bases de données répond à des enjeux techniques et scientifiques décisifs : l’administration de la preuve ou la définition des objets et des problématiques de recherche. En ouvrant sur les coulisses de leur utilisation, ce dossier explore comment les données numériques, devenues essentielles dans bien des travaux, permettent d’arpenter la vie littéraire à différentes périodes (au double sens de la mesurer et de la revisiter, à plus ou moins grands pas). Cette mise au jour se fait selon trois axes de recherche : la conception des bases de données, leurs usages et leur stockage.

Against the current trend in favour of the so-called disruptive nature of the “digital humanities,” this dossier focuses on the way past and present specialists of sociohistorical studies on print and literature have designed and used databases. Working with databases responds to crucial challenges, both technical and scientific, about producing evidence or defining the subject and issue of a research. By shedding light on what happens behind the scenes when databases are mobilised, this second thematic dossier of Biens symboliques / Symbolic Goods explores how digital data have become essential in many studies, and have therefore allowed us to survey literary life (in terms of both measuring and re-evaluating it) in different periods. In this perspective, three lines of questioning are proposed in this introduction: how databases are designed; how they are used; and how they are stored.

Al contrario de los ímpetus actuales en favor del carácter supuestamente disruptivo de las “humanidades numéricas”, este dossier trata de cómo los estudios socio-históricos sobre el impreso y la literatura, hoy como ayer, han construido y utilizado las bases de datos. El uso de bases de datos responde a cuestiones técnicas y científicas decisivas: la administración de la prueba o la definición de los objetos y de las problemáticas de la investigación. Explorando en los detalles de su utilización, este dossier explora de qué manera los datos numéricos, que se han tornado esenciales para muchos trabajos, permiten recorrer la vida literaria en diferentes periodos (en el doble sentido de medirla y de reconsiderarla, con pasos mas o menos grandes*). Esta actualización se realiza según tres ejes de investigación: la concepción de las bases de datos, sus usos y almacenamiento (*arpenter en francés significa medir la superficie de un terreno y, en sentido figurado, recorrer a grandes y decididos pasos un terreno, calle etc.)

Introduction

À l’heure où les big data (ou données massives), les bases qui les accueillent et les programmes qui en permettent l’extraction prolifèrent, ce deuxième dossier de la revue Biens symboliques / Symbolic Goods propose de s’arrêter sur la conception, la conservation et les usages des bases de données conçues par ou pour les chercheur·se·s sur l’imprimé, la littérature et leur histoire. Qu’elles portent sur des mots, des références, des individus, des lieux, des événements, ou encore des objets matériels, les bases de données ont toujours existé dans la recherche en sciences humaines et sociales. Toutefois, le développement de logiciels spécialisés a permis de simplifier leur création et leur utilisation ainsi que leur croisement, tandis que, dans un nombre croissant de cas, l’Internet en a ouvert la consultation à qui veut bien s’y plonger.

Figure 1. Meuble de classement dans une bibliothèque

Image 100000000000046E00000352D916B781.jpg

Homestead1997.

Licence CC 0 Creative Commons (source : Pixabay).

Appelons ici bases de données des présentations structurées, interrogeables et significatives d’informations préalablement sélectionnées, catégorisées et harmonisées en vue d’un usage scientifique. Encore faut-il distinguer entre deux types de bases de données dans les sciences humaines et sociales : d’une part, la constitution d’un répertoire ou d’un catalogue d’informations, disponible à la consultation et à l’interrogation ; d’autre part, la structuration de ces informations en préparation à leur traitement statistique (du plus simple au plus complexe). La première possibilité a pu offrir aux spécialistes de littérature des matériaux, par exemple pour des expositions, des colloques, des livres, à l’instar de bases qui mettent en série des informations sur des parutions ou des auteurs, comme l’Index Translationum de l’Unesco qui a inventorié des titres traduits, ou Weblitaf qui recense les titres de littérature africaine francophone parus. Mais seul le second type de base implique des raisonnements quantitatifs et permet des représentations graphiques originales des données recueillies, moyennant les méthodes et les outils adaptés. Inversement, les approches quantitatives, qui ont permis de mieux comprendre les processus de production et de réception de la littérature (pour un bilan, voir Sapiro 2010) ne nécessitent pas toujours la production de bases de données, qu’il s’agisse par exemple de compter des items dispersés ou de manier des chiffres déjà existants (produits, par exemple, par des professionnel·le·s). Force est de constater cependant que ces approches quantitatives, y compris bibliométriques, mobilisant souvent des bases, ont été plus souvent le fait d’historien·ne·s et de sociologues, ou de linguistes, que de littéraires (Viala 1985, Vaillant 1992, Genet & Lafon 2003).

Dans les études littéraires proprement dites, la place des bases de données et des réflexions méthodologiques qui les accompagnent est au contraire longtemps restée très limitée. La raison principale de ce désintérêt est à chercher dans l’espace des études littéraires lui-même. Là, comme longtemps en histoire de l’art (Joyeux-Prunel 2010), l’étude (voire la simple conception) de bases de données a subi le discrédit symbolique dont sont souvent victimes les outils de recherche et les travaux quantitatifs. C’est aussi que le texte, placé au cœur des approches littéraires traditionnelles puis de la nouvelle critique des années 1960-1980, est une réalité analogique, qui impose une lecture continue, elle-même variable en fonction de la subjectivité, des outils herméneutiques et des caractéristiques sociales de celui ou de celle qui s’y adonne : son interprétation et sa compréhension ne vont pas traditionnellement de pair avec une retraduction numérique, qui l’encoderait sous forme de chiffres pour le rendre comparable à d’autres corpus. Les analyses textuelles et le textualisme, dominants dans les études littéraires à l’échelle mondiale depuis l’après-guerre jusqu’à la fin du xxe siècle, se sont généralement tenus en retrait de l’usage d’outils statistiques et même du recours à de vastes corpus, préférant concentrer leurs analyses sur des textes jugés majeurs ou représentatifs.

Si les travaux sociohistoriques sont venus relativement tard à l’informatisation des bases de données et ont longtemps accordé la préférence aux fiches manuscrites, les linguistes et les lexicologues ont au contraire, dès les années 1950, fait appel aux ordinateurs pour procéder au traitement statistique de leurs corpus de phonèmes, mots, syntagmes ou membres de phrases, dont ils ont pu ainsi analyser les concordances (classement par ordre alphabétique des mots, des expressions, des thèmes, etc., présents dans un texte). Coincée entre linguistique et littérature, la statistique textuelle est cependant restée, jusqu’à récemment, une branche assez isolée des études littéraires (Delcourt 1995 ; Morin, Bosc, Hebrail, Lebart 2002).

De nombreuses recherches en histoire du livre et en sociologie du littéraire se sont aussi parallèlement converties à la collecte et à l’organisation de données (biographiques, bibliographiques, contextuelles, textuelles). La première, telle qu’elle a été renouvelée par Roger Chartier et Robert Darnton1, a notamment pris en compte les supports matériels pour mieux étudier la production et la réception des textes. La construction de biographies collectives, depuis les travaux pionniers de Rémy Ponton (1977), Christophe Charle (1979) ou Alain Viala (1985), a permis de porter au jour des espaces de positions et d’interrelations, y compris en temps de crise (Sapiro 1999), de comparer des ressources sociales individuelles et collectives, de révéler l’existence de stratégies, d’analyser la hiérarchie sociale des genres littéraires, en déplaçant bien des questionnements usuels de l’histoire littéraire. D’autres travaux plus récents s’appuyant sur de telles bases de données prosopographiques se sont davantage intéressés au rôle des intermédiaires culturels et aux mécanismes d’accès à la consécration littéraire (Dubois 2008, Dozo 2011, Ducournau 2017).

Comme l’histoire de l’édition2, celle de la presse3 a grandement profité des travaux qui se sont adossés sur des bases de données pour décrire la vie littéraire à partir du traitement de larges corpus médiatiques ou de realia comme les catalogues des éditeurs et des bibliothécaires, ce qui a permis de renouveler des traditions historiographiques qui étaient avant tout monographiques. Des initiatives récentes se proposent d’étudier les pratiques de lecture à partir de bases répertoriant les traces textuelles de scènes de réception4 ou encore les réseaux de correspondances entre les hommes (et femmes) de lettres des Lumières.

L’affirmation de ce type de travaux, marqués par des collaborations accrues avec des littéraires, souvent situés dans des franges favorables aux sciences sociales, le recul du théorisme littéraire et des débats sur la théorie littéraire sur les campus américains et européens, l’éclatement des objets de recherche, l’accès plus aisé aux ordinateurs, aux outils numériques et à l’Internet, la tendance au sein des organismes subventionnaires à privilégier les projets pluridisciplinaires, comportant un volet quantitatif et un volet numérique, sont autant de facteurs qui peuvent contribuer à expliquer que depuis le début du xxie siècle, les lignes aient bougé. Dans les sciences humaines et sociales plus généralement, la multiplication des données numériques, rendues plus accessibles, a conduit à des réorganisations disciplinaires, favorisant les partenariats avec les sciences de l’informatique (Ollion & Boelaert 2015). Depuis une décennie a ainsi émergé et s’est institutionnalisé le champ dit des « humanités numériques », entendues comme une nouvelle épistémologie pour l’étude des cultures patrimoniales écrites, du fait des transformations que les outils et les méthodes informatiques imposent aux savoirs en sciences humaines. Leur rapide progrès a conduit certains à les célébrer comme une véritable révolution scientifique, d’autres à les dénoncer, dans le contexte anglo-américain tout du moins, comme une étiquette à la mode susceptible de nourrir le conservatisme des institutions universitaires, en allant par exemple à l’encontre des interprétations critiques des textes littéraires, qu’elles soient marxistes, féministes ou postcoloniales (Allington, Brouillette, Golumbia 2016). Dans le domaine des études littéraires francophones, pour mentionner quelques initiatives qui se revendiquent des humanités numériques, sont ainsi apparus le Labex Observatoire de la vie littéraire (OBVIL) en France, dont le site offre des textes numérisés et transcrits, à côté de catalogues de fonds d’archives, le laboratoire Ex situ, littérature et technologie au Québec, ou la Chaire de recherche du Canada sur les arts et les littératures numériques. L’une des plus abouties et la mieux connue de ces entreprises collectives est celle du Literary Lab fondé par Franco Moretti à l’université de Stanford (Moretti 2016). Les travaux qui en sont issus, publiés sous forme de plaquettes disponibles en accès libre, reposent sur une méthode d’analyse computationnelle qui implique d’importants corpus (en particulier sur le roman du xixe siècle européen), des analyses statistiques et des représentations graphiques (arbres, cartes, graphes, etc.). Ce dynamisme a fait des émules, comme le Bodmer Lab à l’université de Genève.

Au sein de ce courant, les études formalistes restent cependant les plus présentes, et s’étendent parfois du texte à ses avant- et après-textes. Les résultats qui en découlent, du point de vue de l’interprétation textuelle, se situent tantôt dans une continuité avec les approches traditionnelles, tantôt dans une rupture revendiquée (Alexandre 2016). Le monopole de l’autorité toute personnelle des critiques littéraires s’y efface en effet en partie devant la possibilité de faire intervenir d’autres médiateurs ou médiatrices, comme les informaticien·ne·s, au prix d’une transformation des représentations classiques du texte, devenu terrain d’expérimentation pour mettre à l’épreuve des hypothèses. La mise à disposition d’une quantité très importante de données permet par exemple de traiter également le corpus littéraire canonique et des textes méconnus, sans avaliser directement les différences de légitimité existant entre eux. Le distant reading, défendu par Franco Moretti, tente précisément de comparer les caractéristiques formelles de différents types de textes (le style, les régularités phonétiques et sémantiques), ce qui peut aplanir des hiérarchies littéraires pour mettre en évidence des proximités parfois étonnantes quant au lexique (Moretti 2016), quant aux motifs et quant aux structures narratives. Faire ainsi de la littérature un « discours parmi d’autres » (Gefen 2015 : 7) soumis à des protocoles de mesure quantitative à partir des seules données textuelles ne devrait cependant pas faire oublier les rapports de pouvoir et les hiérarchies sociales qui ont historiquement prévalu dans la vie littéraire (comme ailleurs), et qui déterminent en partie ces réalités textuelles, comme le montrent les travaux d’histoire sociale du littéraire. Ce tournant dit computationnel n’annule évidemment pas non plus la nécessité de l’interprétation patiente des résultats mathématiques ou graphiques obtenus, et, partant, le recours aux méthodes traditionnelles d’interprétation des textes, comprenant des approches de détail, le dépouillement de sources primaires et les efforts de contextualisation.

À l’heure des premiers bilans, force est ainsi de constater que l’accessibilité et la masse croissante des données numériques rendent d’autant plus nécessaire l’exercice de la vigilance méthodologique et épistémologique (Ollion & Boelaert 2015). La production de ces données, ni neutre ni transparente, repose souvent en effet sur « l’invisibilisation et [le] masquage des opérations dont elles dépendent et des petites mains qui les réalisent » (Jaton & Vinck 2016 : 496), sur des contraintes et sur des « biais considérables » (Gefen 2015 : 3-4), qui méritent d’être étudiés et restitués de manière réflexive. Malgré quelques travaux récents (Bernier & Couturier 2007 ; Vesna 2007 ; Flichy & Parasie 2013 ; Jaton & Vinck 2016), les bases de données restent en effet peu interrogées en tant que pratiques de recherche et dans les démarches méthodologiques concrètes qu’elles imposent, en particulier dans les études littéraires où elles viennent nourrir davantage de travaux et de problématiques.

La restitution des résultats dans les « humanités numériques » y voisine pourtant volontiers avec celle des cheminements suivis, sur le mode plus narratif du « journal de bord » comme le formule Franco Moretti (2016 : 11-12). La publication des tomes de La Vie littéraire au Québec, fondée sur des bases de données présentées dans ce dossier par Marie-Frédérique Desbiens et Chantal Savoie, est ainsi abordée dans ce qui l’a rendue possible, dans ses évolutions et son élaboration collective. Comme dans les recherches de Franco Moretti prônant « l’équipe de cinq à six chercheurs » (2016 : 8), la nécessité de la discussion et de l’argumentation à plusieurs s’y accompagne d’une division du travail permettant d’expérimenter plusieurs directions, ce que ne pourrait faire un·e chercheur·se isolé·e.

Ce dossier veut donc contribuer à rompre avec l’idée de rupture qui nourrit certains débats actuels, en insistant sur la manière dont les études sociohistoriques sur l’imprimé et le littéraire ont de plus longue date construit et utilisé des bases de données. Ce geste va en effet souvent de pair avec le recours à des concepts sociologiques tels que le champ et le réseau, mobilisant (et, parfois, revisitant) certaines approches théoriques. On le voit ici à l’œuvre dans la contribution de Marie-Frédérique Desbiens et Chantal Savoie, sur les méthodes de recherche permettant d’évaluer l’autonomisation d’un champ littéraire au Québec. C’est aussi le cas dans l’article de Florence Bonifay, qui questionne les conditions d’application de ce même concept dans l’histoire littéraire. À travers une déconstruction rigoureuse d’un certain nombre de représentations communes attachées au groupe abusivement dit de la « Pléiade », celui-ci fait ressortir les tensions qui traversent la vie poétique française dans la seconde moitié du xvie siècle, ainsi que l’importance des sociabilités et des échanges dans la construction sociale des carrières individuelles, mesurés ici de manière originale à partir d’un corpus de textes publiés.

Pour les études sociohistoriques sur l’imprimé et la littérature, de tels recours à des bases de données répondent, en conséquence, à des enjeux à la fois techniques, et, surtout, scientifiques aussi décisifs que l’administration de la preuve ou la définition des objets et des problématiques de recherche (que l’utilisation de bases de données contraint justement, dans bien des cas, à expliciter). En ouvrant sur les coulisses de leur utilisation, ce dossier explore, dès lors, comment ces données numériques, devenues essentielles dans bien des travaux, permettent d’arpenter la vie littéraire à différentes périodes (au double sens de la mesurer et de la revisiter, à plus ou moins grands pas). Cette mise au jour se fait selon trois axes de recherche : la conception des bases de données, leurs usages, et leur stockage.

La conception

Les choix méthodologiques en apparence anodins qu’engage la construction d’une base de données peuvent paradoxalement conduire à d’importantes questions d’ordre théorique, voire éthique et épistémologique. La machine, maniant des informations qui, par leur quantité même, peuvent sembler plus objectives et plus complètes que celles que peut traiter un esprit humain, effectue cependant des opérations qui dépendent toujours de choix et de questions de départ formulés par des chercheur·se·s. Comment, pour quelles raisons et par qui les bases de données sont-elles conçues ? Quelles relations, voire quelles négociations, s’établissent entre ceux ou celles (informaticien·ne·s, professionnel·le·s) qui en dessinent l’infrastructure (parfois par défaut) et les chercheur·se·s qui les utilisent, les mettent en rapport les unes avec les autres, les croisent avec d’autres données (textuelles, iconographiques, bibliographiques, archivistiques) afin de produire de nouveaux éléments de connaissance et de nouvelles problématiques ? La mise en tables et en catégories, l’ordonnancement même des données ne sont en effet jamais neutres, et dépendent des choix toujours situés de ceux ou celles qui les mettent en œuvre (Hayles 2012). L’abondance et la diversité des données disponibles sur certains objets, du fait notamment de l’Internet, peuvent conduire à une volonté d’intégrer un ensemble quasi illimité d’informations. Mais la qualité des sources et des matériaux mobilisés pour construire une base de données peut influer, comme des ingrédients en cuisine, sur celle des résultats. Il apparaît ainsi important de respecter l’hétérogénéité des sources et de permettre de s’y référer (Lemercier & Zalc 2008 : 50). Certaines données semblent plus fiables que d’autres, du fait de leurs récurrences, de leur cohérence ou de leurs régularités formelles sur la longue durée par exemple. Inversement, des données en apparence et en soi non significatives peuvent se révéler par la suite utiles. Où s’arrêter dans la délimitation d’un corpus en évitant l’écueil de l’arbitraire ? Comment sélectionner les données pertinentes en respectant un cadre législatif adéquat concernant les œuvres de l’esprit (dépôt légal, copyright) ? Certaines bases, comme l’Index Translationum de l’Unesco ou le catalogue Electre, nécessitent d’être replacées dans leurs conditions de production de manière à identifier les biais qui expliquent tel ou tel résultat chiffré (prise en compte, ou pas, des rééditions, variations de la déclaration des publications d’un pays de publication à l’autre, en fonction des politiques culturelles, etc.). C’est en particulier le cas lorsque ces bases ont été conçues pour répondre aux besoins de professionnel·le·s et non à des questions de recherche. La possibilité de croiser différentes sources et de mener des comparaisons internes semble en ce sens fructueuse, moyennant une approche critique et réflexive, comme le montrent les récents travaux dirigés par Gisèle Sapiro sur les flux de traductions (Bokobza & Sapiro 2008). Lorsqu’elle est une démarche individuelle, la constitution d’une base de données engage des difficultés de départ et des errances potentiellement décourageantes. Souvent chronophage, la conception de vastes bases de données mobilise la plupart du temps des équipes, ce qui impose une répartition des tâches, des plus simples en apparence (la saisie) aux plus chargées de sens (les codages, qui constituent déjà des interprétations, la construction de variables, puis les analyses). Quels sont les enjeux spécifiques de ce travail collectif, qui nécessite une réflexion préalable et, souvent, continue, sur chaque étape (Genet 2002) ? Comment réduire la marge de jeu et limiter les variations subjectives parfois importantes lorsque ces étapes sont réalisées par différents protagonistes aux interprétations divergentes (Merllié 1985) ? Idéalement, la division du travail doit favoriser l’érudition sur le cas abordé quant à l’organisation de la base, mais aussi le recul critique permettant de confronter différentes sources, d’identifier des doublons, de relativiser l’importance de matériaux. Enfin, certains projets incluent une démarche collaborative et invitent tout un chacun à venir enrichir de sa contribution la base de données constituée – quels sont les atouts et les écueils d’une telle démarche inscrite dans le mouvement de l’open access (ou accès ouvert) ?

Les usages

Si l’on peut céder à la fascination pour les gisements d’informations potentiellement illimitées que représentent les bases de données, ils ne constituent pas en eux-mêmes des garanties de rigueur scientifique. Les données assemblées dans une base peuvent, dans certains cas, donner lieu à des exploitations statistiques articulant différentes méthodes, des tris croisés à la régression logistique, en passant par diverses représentations graphiques. Ces démarches quantitatives, du comptage le plus basique aux analyses statistiques plus sophistiquées, s’articulent cependant le plus souvent à des présupposés, des définitions et des décisions d’ordre qualitatif, qui peuvent engager toute une vision du monde (délimitations géographiques ou historiques plus ou moins étendues, de l’événement ponctuel à la longue durée, représentation pacifiée ou conflictuelle des relations sociales, etc.). Qu’implique pour la recherche en études littéraires l’utilisation d’algorithmes et de programmes informatiques spécialisés dans le traitement des données ? Quel rôle accorder aux requêtes (simples ou croisées) qui sont souvent la voie d’accès principale aux bases de données ?

Au-delà de ces paramètres techniques, l’exploitation de telles bases de données informatisées peut conforter ou déplacer, de manière heuristique, les questions usuellement posées en histoire littéraire. Quelles (re)découvertes ces démarches permettent-elles ? Quelles lectures des événements, des textes, des trajectoires individuelles et de groupe suscitent-elles, voire forcent-elles ? À quelles conditions permettent-elles de soutenir une argumentation, de vérifier une intuition ou de suggérer une nouvelle piste ? Si la construction de bases de données peut sembler laborieuse et ingrate, leurs exploitations ne permettent-elles pas au contraire des explorations ludiques et originales, prenant à nouveaux frais certaines des notions majeures dans les études littéraires, telles que l’intertextualité ou l’événement littéraire ? Il peut s’agir de redessiner les chronologies habituelles en faisant ressortir certaines démarcations inaperçues à partir du corpus le plus légitime, de construire des générations d’auteur·e·s en partant d’indicateurs biographiques comme la date de la première publication, de faire apparaître des populations absentes du canon, féminines par exemple, comme le fait ici Florence Bonifay, mais aussi de s’intéresser aux possibles non advenus, d’examiner les distinctions admises entre le légitime et le populaire, le national et le transnational, etc.

Si la réalisation de ces bases impose bien souvent la prise en compte et l’interprétation de données empiriques (sur les producteur·rice·s et les biens littéraires, les localisations, les termes récurrents, etc.) en affinité avec les approches sociales et historiques de l’imprimé et du littéraire, elles permettent aussi de dialoguer avec la linguistique, l’économie ou la géographie par exemple. En quoi les bases de données nécessitent-elles ou favorisent-elles des perspectives interdiscursives ou interdisciplinaires (sciences sociales, histoire, sciences du langage, histoire de l’art) ?

Le stockage

De la même façon que les fiches réalisées à la main risquent de ne plus faire qu’un tas de papier dépourvu de signification après la retraite ou la mort de leur(s) concepteur(s) ou conceptrice(s), les bases de données informatisées peuvent devenir inutilisables faute de machine en état de les lire ou, pire, disparaître une fois le projet de recherche terminé. Quelle pérennité pour les bases de données après une première vie ? Comment les maintenir en tant qu’outils pertinents ? Peut-on envisager de vérifier, voire de nettoyer les données par exemple ? Comment les rendre interopérables et où les conserver pour permettre de nouvelles explorations qui croiseraient plusieurs bases de données ? Certain·e·s chercheur·se·s isolé·e·s ne rendent au contraire jamais accessibles les bases de données construites et exploitées pour leurs recherches, par souci de contrôle ou bien faute de temps et d’informations – d’importants progrès ayant été réalisés en ce domaine, du moins en France, avec la très grande infrastructure de recherche Huma-Num. Le coût d’accès aux données rassemblées, dont l’exploitation, le stockage et la sauvegarde peuvent dépendre de la détention d’outils informatiques et de la compétence pour les faire fonctionner, est en effet susceptible de renforcer les inégalités structurelles propres au monde de la recherche.

1 Qui a mis certains de ses matériaux de travail sur le monde du livre dans la France prérévolutionnaire en libre accès sur un site.

2 La somme de L’Histoire de l’édition littéraire au Québec au xxe siècle (Michon 1999, 2004, 2010) s’est ainsi largement appuyée sur des bases de

3 Voir les bases de données proposées sur le site du réseau international Transfopress, consacré à l’étude de la presse en langue étrangère, et sur la

4 Voir le site Reading Experience Database, 1450-1945, développé en accès ouvert au Royaume-Uni, à destination des enseignant·e·s et des chercheur·se·

Alexandre Didier (dir.) (2016). « Études littéraires et calcul numérique ». Revue d’histoire littéraire de la France, 116(3).

Allington Daniel, Brouillette Sarah, Golumbia David (2016). « Neoliberal Tools (and Archives) : A Political History of Digital Humanities ». Los Angeles Review of Books. [En ligne] https://lareviewofbooks.org/article/neoliberal-tools-archives-political-history-digital-humanities/ [consulté le 5 juin 2017].

Bernier Sylvie & Couturier Yves (2007). Les Banques de données numérisées dans la recherche en sciences humaines. Enjeux éthiques, juridiques et patrimoniaux. Sherbrooke, Université de Sherbrooke.

Bokobza Anaïs & Sapiro Gisèle (2008). « L’analyse des flux de traductions et la construction des bases de données ». In Sapiro Gisèle (dir.). Translatio. Le Marché de la traduction en France à l’heure de la mondialisation. Paris, CNRS Éditions : 45-64.

Charle Christophe (1979). La Crise littéraire à l’époque du naturalisme : roman, théâtre et politique. Essai d’histoire sociale des groupes et des genres littéraires. Paris, Presses de l’École normale supérieure.

Dozo Björn-Olav (2011). Mesures de l’écrivain. Profil socio-littéraire et capital relationnel dans l’entre-deux-guerres en Belgique francophone. Liège, Presses Universitaires de Liège, 2011.

Dubois Sébastien (2008). « Mesurer la réputation. Reconnaissance et renommée des poètes contemporains ». Histoire & Mesure, 23(2) : 103-143.

Ducournau Claire (2017). La Fabrique des classiques africains. Écrivains d’Afrique subsaharienne francophone (1960-2012). Paris, CNRS Éditions.

Flichy Patrice & Parasie Sylvain (dir.) (2013). « Sociologie des bases de données ». Réseaux, 178-179(2-3).

Gefen Alexandre (2015). « Les enjeux épistémologiques des humanités numériques ». Socio. La nouvelle revue des sciences sociales, 4 : 61-74.

Genet Jean-Philippe (2002). « Analyse factorielle et construction des variables. L’origine géographique des auteurs anglais (1300-1600) ». Histoire & Mesure, 17(1-2) : 87-108.

Genet Jean-Philippe & Lafon Pierre (2003). « Des chiffres et des lettres. Quelques pistes pour l’historien ». Histoire & Mesure, 18(3-4) : 215-223.

Hayles N. Katherine (2012). How We Think. Digital Media and Contemporary Technogenesis. Chicago/London, University of Chicago Press.

Jaton Florian & Vinck Dominique (2016). « Processus frictionnels de mises en bases de données ». Revue d’anthropologie des connaissances, 10(4) : 489-504.

Joyeux-Prunel Béatrice (dir.) (2008). « Art et mesure ». Histoire & Mesure, 23(2).

Joyeux-Prunel Béatrice (2010). « L’art et les chiffres : une mésentente historique ? Généalogie critique et tentatives de conciliation ». In Joyeux-Prunel Béatrice (dir.), avec la collaboration de Sigalo-Santos Luc. L’Art et la Mesure. Histoire de l’art et méthodes quantitatives : sources, outils, bonnes pratiques. Paris, Éditions Rue d’Ulm : 19-58.

Kalifa Dominique, Régnier Philipe, Thérenty Marie-Ève, Vaillant Alain (dir.) (2011). La Civilisation du journal. Histoire culturelle et littéraire de la presse française au xixe siècle. Paris, Nouveau Monde.

Lemercier Claire & Zalc Claire (2008). Méthodes quantitatives pour l’historien. Paris, La Découverte.

Merllié Dominique (1985). « ‟Comment vous êtes-vous connus ?” Une expérience de codification multiple ». Actes de la recherche en sciences sociales, 57 : 89-92.

Michon Jacques (dir.) (1999). Histoire de l’édition littéraire au Québec au xxe siècle. La naissance de l’éditeur. 1900-1939, volume 1. Montréal, Fides.

Michon Jacques (dir.) (2004). Histoire de l’édition littéraire au Québec au xxe siècle. Le temps des éditeurs. 1940-1959, volume 2. Montréal, Fides.

Michon Jacques (dir.) (2010). Histoire de l’édition littéraire au Québec au xxe siècle. La bataille du livre. 1960-2000, volume 3. Montréal, Fides.

Moretti Franco (dir.) (2016). La Littérature au laboratoire. Paris, Ithaque.

Morin Annie, Bosc Patrick, Hebrail Georges, Lebart Ludovic (2002). Bases de données et statistiques. Paris, Dunod.

Ollion Étienne & Boelaert Julien (2015). « Au-delà des big data. Les sciences sociales et la multiplication des données numériques ». Sociologie, 6(3). [En ligne], http://sociologie.revues.org/2613 [consulté le 6 février 2017].

Ponton Rémy (1977). Le Champ littéraire de 1865 à 1906. Recrutement des écrivains, structures des carrières et production des œuvres (thèse de doctorat en sociologie). Paris, Université de Paris V.

Sapiro Gisèle (1999). La Guerre des écrivains, 1940-1953. Paris, Fayard.

Sapiro Gisèle (2010). « Mesure du littéraire : approches sociologiques et historiques ». In Joyeux-Prunel Béatrice (dir.), avec la collaboration de Luc Sigalo-Santos. L’Art et la Mesure. Histoire de l’art et méthodes quantitatives : sources, outils, bonnes pratiques. Paris, Éditions Rue d’Ulm : 59-93.

Vaillant Alain (dir.) (1992). Mesure(s) du livre. Paris, Bibliothèque nationale.

Vesna Victoria (2007). Database Aesthetics : Art in the Age of Information Overflow. Minneapolis, University of Minnesota Press.

Viala Alain (1985). Naissance de l’écrivain. Sociologie de la littérature à l’âge classique. Paris, Minuit.

1 Qui a mis certains de ses matériaux de travail sur le monde du livre dans la France prérévolutionnaire en libre accès sur un site.

2 La somme de L’Histoire de l’édition littéraire au Québec au xxe siècle (Michon 1999, 2004, 2010) s’est ainsi largement appuyée sur des bases de données mises en place à l’université de Sherbrooke, comme le restitue, dans les présentations de bases de données jointes à ce dossier, le témoignage de Josée Vincent.

3 Voir les bases de données proposées sur le site du réseau international Transfopress, consacré à l’étude de la presse en langue étrangère, et sur la plateforme Médias 19 créée en 2011 sous la direction de Guillaume Pinson et de Marie-Ève Thérenty, consacrée à l’étude de la culture médiatique au xixe siècle, parallèlement à la publication d’un ouvrage scientifique décisif sur cette question (Kalifa, Régnier, Thérenty, Vaillant 2011) .

4 Voir le site Reading Experience Database, 1450-1945, développé en accès ouvert au Royaume-Uni, à destination des enseignant·e·s et des chercheur·se·s.

Figure 1. Meuble de classement dans une bibliothèque

Figure 1. Meuble de classement dans une bibliothèque

Homestead1997.

Licence CC 0 Creative Commons (source : Pixabay).

Claire Ducournau

Université Paul-Valéry-Montpellier 3 – RIRRA21

Articles du même auteur

Anthony Glinoer

Université de Sherbrooke – Chaire de recherche du Canada sur l'histoire de l'édition et la sociologie du littéraire

Articles du même auteur

© Presses Universitaires de Vincennes 2018