Corpus d’écrits phonétiques du xvie siècle

Dans le cadre d’un vaste mouvement de défense et d’illustration de la lange vulgaire s’engage, vers 1550, un débat à propos de l’orthographe du français, dont le caractère non phonétique est dénoncé par certains, d’autres valorisant au contraire les graphies grammaticales et étymologiques.

Les écrits présentés ici témoignent tous de cette première tendance : proposer, pour le français, une orthographe qui, dans l’idéal, reflète d’une manière parfaitement fidèle la prononciation des honnêtes gens et, par la même occasion, contribuer au débat ambiant.

Notre but est d’en présenter une édition électronique « brute » permettant leur lecture suivie, mais aussi un dictionnaire phonétique, reposant sur la lemmatisation des textes édités : cet outil de recherche permet, en entrant un mot ou fragment de mot en orthographe standard (dans la mesure du possible, on a recours à la graphie largement modernisée retenue pour les entrées du Dictionnaire du Moyen Français), de remonter à l’ensemble des graphies phonétiques correspondantes. Lorsque c’est possible, les résultats de recherche incluent un lien direct vers un abrégé de la notice correspondante du Dictionnaire du Moyen Français.

En grande partie phonétiques, mais reposant en plus sur une prosodie et une métrique extrêmement sophistiquées, les vers mesurés de Jean-Antoine Baïf font l’objet d’une édition dans une autre section de ce site. Ces vers ont également été inclus dans le dictionnaire phonétique, mais sans la mise en évidence de la métrique présente dans l’édition séparée.

À terme, ce corpus regroupera les écrits phonétiques de Louis Meigret, Jacques Peletier du Mans, Jean-Antoine de Baïf et Pierre de La Ramée (dit Ramus).

Note sur la lemmatisation

En plus de présenter les textes eux-mêmes, cette édition entend fournir une base de données facilement interrogeable renseignant sur la prononciation du français — ou tout au moins de sa variété la plus prestigieuse — dans la seconde moitié du xvie siècle. Dans le but de faciliter la recherche des termes et la disposition des résultats, chaque mot fait l’objet d’une lemmatisation : la forme présente dans les sources est associée à sa transcription en orthographe standard, ainsi qu’à une catégorisation grammaticale.

Faite à la main, cette opération prend comme unités de base les « mots » de l’original, par définition les entités graphiques délimitées par l’espace ou l’apostrophe. Cette délimitation ne correspond que partiellement à celle utilisée par les dictionnaires modernes : d’une part, les imprimeurs concernés ont une certaine tendance à agglutiner certains mots en « locutions » qui groupent plusieurs entités lexicales des dictionnaires (paraventure, ny pour n’y, trècontent, etc.) ; à l’inverse, et beaucoup plus fréquemment, les dictionnaires analysent comme des locutions (adverbiales, prépositionnelles, verbales, etc.) des groupes de mots figés par l’usage. Ici, chacun des mots constituant ces locutions reste analysé séparément. En effet, il n’est souvent pas possible de savoir jusqu’à quel point des expressions aujourd’hui figées l’étaient déjà dans la « grammaire personnelle » de locuteurs de la Renaissance. D’autre part, comme l’intérêt principal de cette lemmatisation est de permettre d’envisager de manière globale la phonétique par essence variable de mots individuels, il est primordial que chacun d’entre eux, qu’il fasse ou non partie d’une locution, soit analysé avec une granularité immuable.

La finesse de cette granularité conduit à des résultats qui peuvent surprendre. Ainsi, elle fait abstraction de la notion de « temps composé » : j’ai mangé, par exemple, est analysé comme un pronom suivi du verbe avoir au présent de l’indicatif et du participe passé de manger. De même, des locutions, par exemple, conjonctives (afin que, lors que, combien que) sont analysées comme un adverbe suivi de la conjonction que.

Pour le reste, la catégorisation repose sur un petit nombre d’items : le nom, l’adjectif, le pronom, le verbe, l’adverbe, la préposition, la conjonction, l’interjection et le déterminant, catégorie dans laquelle ont été regroupés les articles, les adjectifs démonstratifs et les adjectifs possessifs. Comme toujours lorsqu’il s’agit de classer de grandes quantités d’objets (ici, plusieurs centaines de milliers), il reste une place pour des décisions ad hoc qui peuvent conduire à des incohérences et des erreurs.


Contrat Creative Commons

Les textes présentés ici appartiennent au domaine public. Le travail éditorial est placé sous contrat Creative Commons.

© Olivier Bettens, 2017-2022