Chantez-vous français ?

Les consonnes prises isolément

L’ère des scribes

Parmi les consonnes occlusives, il n’y a pas grand-chose à dire des paires bilabiale (b – p) et interdentale (d – t), sinon que rien ne permet de penser que, pour la période qui nous intéresse, elles se soient jamais prononcées autrement qu’en français standard. Il en va de même pour les consonnes nasales (m et n), abstraction faite du cas où elles donnent naissance à une voyelle nasale, pour l, sauf quand, implosif, il se vélarise puis se vocalise (altre > autre), ainsi que pour les fricatives labio-dentales (f, v).

Les palato-vélaires :

En français « commun », c (k) et g ont conservé leur caractère occlusif devant o et u où ils sonnent [k] et [g]. Devant a, i et e, ils ont suivi un cheminement phonétique complexe et, après palatalisation, se sont transformés en affriquées (Footnote: Fouché, Phonétique historique, p. 552 et sq.) avant de se simplifier en constrictives (chuintantes ou sifflantes). Ainsi, on a [ka] > [tʃa] ou [tʃie] > [ʃa] ou [ʃie], la graphie ch étant utilisée pour noter le résultat de cette évolution (carbonum > charbon, caram > chiere), [ki] > [tsi] > [si] (ci(vi)tatem > cité), [ke] > [tse] > [se] (cervum > cerf). Pour g on a [ga] > [dʒa] ou [dʒie] > [ʒa] ou [ʒie] (gamba > jambe, mandugare > mangier), traditionnellement noté par i ou g, [ge] > [dʒe] > [ʒe] (genitum > gent). Des occlusives se sont maintenues devant a, i, e dans deux cas distincts : dans les mots dérivant d’un mot latin en qu- (quare > car, qui > ki, quaerere > querre) et dans des mots dérivant d’un mot germanique en w- (guérir, garder, guigner).

De plus, les écrits portent souvent la trace de particularités dialectales. Ainsi, la chanson de Roland (manuscrit d’Oxford) note-t-elle 97 fois Carle(s) ou Carlemagne(s) et 10 fois Karle(s) ou Karlemagne(s) conformément à l’usage dialectal normand, contre seulement 15 fois Charle(s) ou Charlemagne(s) conformément à l’usage « central » ou « commun ». Le normand partage cette caractéristique avec le picard qui, en plus, voit [ki]/[ke] se transformer non pas en [ts] > [s] mais en [tʃ] > [ʃ], comme en témoignent les graphies chi, che qui parsèment certains textes d’origine picarde comme les œuvres d’Adam de la Halle (Footnote: Pour une étude détaillée de ces phénomènes, cf. C. Gossen, Grammaire de l’ancien picard, p. 91 et sq.). Le picard a par contre kiere, keval là où le français a chiere, cheval, la voyelle originelle étant ici un a (caram, caballum) et gambe, menguier là où le français a jambe, mangier.

Le digramme ch est donc utilisé pour marquer le résultat de la palatalisation de k devant a, soit l’affriquée [tʃ] qui se simplifie en [ʃ]. Mais il est aussi employé pour transcrire le khi grec, par exemple dans Achille ou Achéron. En français standard, certains de ces ch grecs se prononcent [k], et sont parfois même transcrits par qu, comme dans Andromaque. Cela n’était probablement pas le cas à l’origine où la prononciation canonique de ch ([ʃ]) était de rigueur. On trouve par exemple, chez Ronsard, une rime hache : Andromache (Footnote: Ronsard, Les Amours, p. 454.) qui est sans équivoque, mais on a déjà Caos (pour chaos) chez Péletier et Sébillet, en donnant un exemple de « rime fratrisée », nous apprend qu’il prononce Charon comme Car on (Footnote: Peletier, L’Amour des Amours, p. 17. Goyet, Traités de poétique et de rhétorique de la Renaissance, p. 150). On peut postuler que l’usage actuel est dû à une influence italienne.

h :

Dans les textes les plus anciens, cette « consonne » est surtout utilisée pour signaler l’aspiration dans les mots d’origine germanique (honte, haine, etc.). Il n’est pas possible de savoir à quel degré l’aspiration se faisait sentir à telle ou telle période. Il est néanmoins probable que ce degré, significatif à l’origine, diminue avec le temps, jusqu’à atteindre la situation du français standard où il n’y a plus à proprement parler d’aspiration puisque la seule caractéristique qui distingue les mots dont l’h initial est dit aspiré de ceux dont l’initiale est une voyelle ou un h non aspiré est qu’ils n’autorisent ni liaison ni élision. Plus tard, des h, d’origine latine (hom, humble, etc.) ou non (huile, huître) se répandent dans la graphie : ils sont phonétiquement nuls et, en principe, non aspirés. Contrairement à ce qu’indiquent les dictionnaires modernes, l’h d’hélas ne s’est jamais aspiré, en tout cas dans les vers. On trouve, au Moyen Âge, la graphie alternative Elas (Footnote: Par exemple chez Pierre de Nesson, Vigiles, p. 29.) et des alexandrins classiques comme Hélas ! // Que cet hélas a de peine à sortir ou Belle Hermione, hélas ! puis-je estre heureux sans vous ? (Footnote: Corneille, Polyeucte, acte IV, sc. III. Quinault, Cadmus et Hermione, acte V, sc. I. Ce dernier vers est cité comme exemple de la non aspiration de l’h d’hélaspar le dictionnaire de Richelet.) le confirment. Lorsque Ma rebelle he bien est versifié en cinq syllabes (Footnote: Bataille, Septiesme livre, f° 10 v°.), on en conclut que le poète n’aspire pas plus l’h initial de l’interjection Hé !, ce qui ne semble pas être l’avis de tous les grammairiens. D’autres flottements dans l’usage peuvent ici ou là apparaître jusque dans les vers ; dans un air de Guédron, on rencontre Vostre Heros avec h non aspiré (Footnote: Bataille, Septiesme livre, f° 6 v°.).

il :

Déjà dans les plus anciens textes littéraires, ce digramme apparaît en des lieux où l’on s’attend à rencontrer un l palatal ou mouillé ([ʎ]). On rencontre, par exemple, dans les premiers vers de Saint Brandan, cunseil, voile, doile, orguil, escuil (Footnote: Le Voyage de Saint Brandan, vv. 6, 17, 18, 41, 67, 68.). Cette graphie sera d’une grande stabilité, même lorsque, tardivement, l palatal se transformera en yod ([j]). A la rime, l palatal reste en général bien distinct de l. Les entorses relevées, notamment par Châtelain (Footnote: Châtelain, Recherches sur le vers français, p. 59.) qui cite par exemple une rime belle : vermeille chez Machaut, restent trop rares pour qu’on puisse les considérer comme autre chose que des licences, probablement rendues possibles par certaines prononciations régionales.

gn :

Dès les premiers textes également, la graphie gn figure un n palatal ([ɲ]). Selon Lote (Footnote: Lote, Histoire du vers, III p. 237.), gn s’est toujours prononcé [n] dans les mots savants comme digne. Des rimes comme digne : pelerine chez Marot (Footnote: Marot, Œuvres lyriques, p. 122.) ou divine : digne et origine : digne chez Ronsard (Footnote: Ronsard, Les Amours, p. 109, 370.) le confirment. Dans ses vers phonétiques, Peletier, qui note très précisément n palatal, écrit avec n simple tous les mots de la famille de signe (« sinal, sinɇ, siniferɇ, sinifiɇ, insinɇ, assine, assineɇs, sineɇ ») (Footnote: Peletier, L’Amour des Amours, p. 19, 34, 37, 42, 80, 97, 112, 113, 122, 137, 149, 152, 154, 178, 196, 238.), de digne (« dinɇ, indinite, dinɇmant ») (Footnote: Peletier, L’Amour des Amours, p. 48, 178, 192, 246.)et de règne (« rę́nɇ, rę́ner ») (Footnote: Peletier, L’Amour des Amours, p. 16, 92, 177, 179, 180, 220.). Il écrit aussi « cinɇs » pour cygnes (Footnote: Peletier, L’Amour des Amours, p. 154.). Par ailleurs, l’opposition [n] / [ɲ] s’estompe très précocement en finale de mot. Devant e féminin, on notera aussi une tendance discrète à la confusion, révélée par la présence occasionnelle de licences du type semayne : enseigne.

r :

Il ne fait guère de doute que l’r originel du roman ait été un r apical (noté [r] dans sa variante vibrée ou « roulée ») : c’est celui dont ont hérité les langues romanes environnantes ; c’est celui que décrivent, fort précisément, les grammairiens latins, c’est celui, aussi, qu’on entendait, et qu’on entend encore chez les personnes âgées, dans de nombreuses régions périphériques ; c’est celui, enfin, qui s’est perpétué jusqu’au début du xx^e siècle dans la diction de certains comédiens, et jusqu’à nos jours dans le chant « académique », celui qu’enseigne le Conservatoire. En opposition, le français standard a choisi un r dorsal (parfois dit « grasseyé » ou « parisien », noté [ʁ] lorsqu’il est vibré), qui ne devrait pas, pour les périodes qui nous intéressent, avoir droit de cité en déclamation. Il faut néanmoins se poser la question de la transition entre ces deux r, ou de leur éventuelle cohabitation, histoire de mesurer la distance séparant le discours soutenu du discours spontané.

La graphie r, en elle-même, ne nous dit rien du point d’articulation, apical ou dorsal. En revanche, il existe un témoignage, aussi imagé qu’inespéré, sur la qualité de certains r français au Moyen Âge :

Au contraire, disoit-il que male chose estoit de penre de l’autrui; car li rendres estoit si griez, que, neis au nommer, li rendres escorchoit la gorge par les erres qui y sont, lequiex senefient les ratiaus au diable, qui touz jours tire arière vers li ceus qui l’autrui chatel weulent rendre. (Footnote: Joinville Histoire de Saint-Louis, p. 11.)

Cette boutade, attribuée par le chroniqueur Joinville au roi Saint Louis est probablement le premier témoignage existant sur la présence d’r grasseyés en français. Que nous dit le bon roi ? Qu’il est fort mal de prendre le bien d’autrui, car le rendre est alors si pénible que, à sa seule prononciation, ce mot rendre écorche la gorge par les r qu’il contient, symbolisant les râteaux du diable qui tire à lui ceux qui auraient des velléités de rendre un château pris à autrui. On peut donc supposer que, au début du xiii^e siècle, il existait déjà, dans un français qui était peut-être celui de l’Ile-de-France (Saint Louis a été baptisé à Poissy), une tendance à grasseyer certains r. Ce déplacement du point d’articulation serait ainsi bien plus précoce que ne le pense Straka, l’un des rares spécialistes à avoir consacré de longs développements à l’histoire de l’r français, et qui n’ose pas imaginer un grasseyement antérieur au xvii^e siècle (Footnote: Georges Straka, Les sons et les mots, p. 465.).

Un autre fait bien attesté est l’assibilation de l’r intervocalique en [z], qui frappe notamment les dialectes de l’Ile-de-France et touche par conséquent le parisien vulgaire. Le français en a gardé quelques traces, notamment les mots chaise (dont l’s provient de l’r de chaire < cathedram) et besicles (dont l’s provient de l’r de bericles), attestés depuis la fin du xiv^e siècle, ce qui indique que, dans les dialectes dont il est question, cette assibilation est bien plus ancienne. Fouché (Footnote: Fouché, Phonétique historique, p. 603.) en trouve la marque dans des toponymes dès le xiii^e siècle. Les traces qu’a laissées ce phénomène en français standard ne sont bien sûr que le sommet de l’iceberg. Les textes satiriques en patois de Saint-Ouen du xvii^e siècle en livrent par contre des centaines : pèze, mèze, cuzé, Pazi, Size, faize etc. pour père, mère, curé, Paris, Sire, faire (Footnote: Théodore Rosset, Les Origines, Appendice.).

Cette assibilation révèle en tout cas un fait : son r de départ ne peut être qu’un r apical, dont le lieu d’articulation est voisin de celui du [z]. On voit en effet mal par quel changement simple un r dorsal pourrait devenir un [z]. Comment, sur cette base, essayer de dégager une vision d’ensemble qui concilie le rendre de Saint Louis avec la chaise de Villon ?

« L’r initiale était sans doute prononcée de la gorge ou plutôt avec la luette, tandis que l’r médiale ou finale était prononcée avec la langue » a pressenti Thurot (Footnote: Thurot II, p. 270.). Pour rendre compte de tous ces phénomènes, il est bel et bien nécessaire, comme le propose Morin (Footnote: Morin, La naissance de la rime normande.), de postuler l’existence, en français médiéval, de deux r distincts :

Un r « faible » ([ɾ]), correspondant à l’r intervocalique latin (ou plutôt bas-latin), susceptible de rester intervocalique comme dans faire, chiere ou de se trouver en finale comme dans les infinitifs en -r. On postule que, au départ, cet r était battu — un seul coup de langue contre les alvéoles — et non « roulé ».
Un r « fort » ([r]), correspondant à tous les autres cas (notamment le double r de ferrum > fer ou de terram > terre, l’r initial, l’r implosif devenu final de infernum > enfer). Cet r, tout aussi apical à l’origine, était par contre vibré, ou « roulé ».

On peut imaginer que, peu avant le xiii^e siècle, r apical soit pour une raison ou pour une autre devenu incompatible avec les habitudes articulatoires dans la région la plus centrale du domaine d’oïl. Pour r « fort », le caractère vibrant se serait conservé, mais au prix d’un déplacement du point d’articulation vers l’arrière. Pour r « faible » et non vibrant, le point d’articulation serait resté antérieur, mais au prix d’une assibilation. En finale, cet r affaibli aurait plus rapidement que l’autre tendu à s’amuïr. Un r apical plus ou moins artificiellement roulé aurait quant à lui pu se maintenir dans le « bon usage », ou au moins le discours soutenu. La généralisation, dans la diction poétique, de cet r « artificiel » qui négligeait la distinction originelle entre r « fort » et r « faible » pourrait expliquer que, dès la fin du xv^e siècle, des mots en e ouvert suivi de r « fort » se soient mis à rimer avec des mots en e fermé suivi de r « faible » amuï comme des infinitifs (chauffer : enfer), licence qui a rétrospectivement été nommée « rime normande ».

w :

La graphie w apparaît dans deux situations complétement différentes :

Raccourci graphique pour la suite vu : il n’est pas rare de rencontrer, par exemple weil pour vueil (je veux). Dans ce cas-ci, il n’y a aucune raison de prononcer w autrement que vu.
Aboutissement de w germanique : en français, w initial germanique a donné [g] (par exemple dans le mot guerre, dérivé d’un probable *werra francique dont on trouve la trace jusque dans l’anglais war). En picard, par contre, ce w, qu’on imagine au départ proche du [w] anglais, s’est conservé. On note par exemples les graphies warder, walop, warniers, wautiers (pour garder, galop, Garnier, Gautier) et même walecome (pour souhaiter la bienvenue) dans le Jeu de Robin et Marion. Comme la graphie picarde alterne avec la graphie française, on dispose, pour ce qui est de la prononciation, d’une certaine marge de manœuvre.

s et z :

S, qui note à l’origine la sifflante sourde [s] a continué à noter la voisée [z] en position intervocalique, par exemple dans causa > chose. On situe ce changement vers le iv^e siècle (Footnote: Joly, Précis de Phonétique historique, p. 111.). Quant à elle, la lettre z note à l’origine, et jusqu’à sa simplification, l’affriquée [ts]. En position intervocalique, s peut aussi noter l’affriquée [dz] avant sa simplification, comme dans taise, plaise. Dans ce cas, la graphie ne distingue donc pas l’affriquée de la sifflante.

x :

Cette lettre, déjà considérée comme étrangère en latin, ne s’est transmise dans la graphie du français que pour certains noms propres d’origine étrangère. Comme on trouve, dans les plus anciens textes, l’alternance graphique x – ss (on a par exemple Alessis et Alexis dans certains manuscrits de la Vie de Saint Alexis), on conclut raisonnablement que, pour un lettré du xii^e siècle, la valeur phonétique fondamentale de cette lettre était non pas [ks] mais [s]. Il est probable que c’est cette valeur qui prévaut lorsque x se met à être utilisé dans des emprunts savants comme texte (Footnote: Beaulieux, Histoire de l’orghographe, p. 69.). On imagine donc que de tels x se sont amuïs tout comme les s implosifs. De manière générale, on ne trouve pas, avant le xvi^e siècle, d’indices pouvant faire penser que x ait pu représenter un son complexe comme [ks]. Assez précocement, les scribes se servent de la lettre x comme d’un raccourci graphique pour noter la suite -us. Ainsi, au xii^e siècle, on trouve souvent Dex, mortax, biax pour Deus, mortaus, biaus. Au siècle suivant, la consonne x s’installe en finale, mais on oublie de plus en plus la convention initiale, d’où l’apparition de formes comme Deux, mortaux, biaux qui se rapprochent de l’usage qui a finalement prévalu, dans lequel x final joue le rôle de s final dans un certain nombre de mots en -eux/-aux ainsi que dans les bijoux, cailloux et choux qu’on fait réciter aux enfants. Il est donc parfaitement évident que, emprunts tardifs, réfections ou néologismes mis à part (lynx, thorax, Styx, Linux), x final n’est rien d’autre qu’une variante graphique et n’a en aucun cas le son complexe qu’on attribue aujourd’hui à l’x.

Les affriquées et leur simplification

Déjà en bas latin, certaines consonnes occlusives ont eu tendance à se palataliser, c’est-à-dire à se « mouiller » (Footnote: Alors que le bon usage les exclut, certaines variétés de français populaire connaissent aujourd’hui des palatalisations. On pense par exemple à la manière dont le parisien vulgaire articule le c de mec, avec une palatalisation qui va parfois quasiment jusqu’à le faire suivre d’un yod). Le renforcement de l’accent tonique, en favorisant les « vagues » et les « creux » du mode décroissant, a entraîné certains glissements dans les points d’articulation des consonnes : l’occlusion cessant d’être totale, de l’air s’échappe et modifie les caractéristiques phonétiques des consonnes touchées. C’est le début d’une cascade de changements qui sont pour beaucoup dans la distance qui sépare le français du latin et des autres langues romanes, et qui conduisent assez rapidement (en peu de siècles !) à l’installation en roman de consonnes affriquées, c’est-à-dire combinant successivement une articulation occlusive et une articulation constrictive ou fricative ([tʃ], [dʒ]).

Pour faire bref — un tableau complet des palatalisations et de leurs conséquences serait hors de propos (Footnote: Voir Zink, Phonétique historique ou Joly, Précis de Phonétique historique.) — on se bornera à mentionner quelques exemples-types, pris parmi ceux que se repassent les traités de phonétique historique (tableau 1).

Latin	Pron. initiale	Avant ~ 1200	Dès ~ 1200	Français
jurare	[j]	[dʒ]	[ʒ]	jurer
fortia	[tj]	[ts]	[s]	force
rationem	[tj]	[dz]	[z]	raison
sabium	[bj]	[dʒ]	[ʒ]	sage
cervum	[k]	[ts]	[s]	cerf
gentem	[g]	[dʒ]	[ʒ]	gent
placere	[k]	[dz]	[z]	plaisir
castellum	[k]	[tʃ]	[ʃ]	chastel
gamba	[g]	[dʒ]	[ʒ]	jambe

Tableau 1. Exemples de simplification des affriquées

Ramenée à la pratique du chanteur qui n’aura jamais à aborder les textes les plus anciens, la prise en compte de cette chaîne évolutive se borne à en considérer le dernier maillon en posant la question : affriquée ou constrictive ? En effet, ce changement n’a le plus souvent pas affecté la graphie. Devant le ch de chastel, devant le c de cerf, devant le i consonne de iambe, aucun indice ne permet, dans l’absolu, de trancher entre l’affriquée ([tʃ], [ts] ou [dʒ]) et la constrictive ([ʃ], [s] ou [ʒ]). Cela n’est qu’en procédant par recoupements qu’on peut espérer en préciser la date. Celle de 1200, donnée en général par les ouvrages de phonétique historique, repose sur les indices suivants :

Les emprunts précoces de l’anglais ou d’autres langues au français.
L’étude des consonnes finales s et z.

Parmi les emprunts, ceux de l’anglais sont les plus fréquemment cités. En effet, ils sont d’une part nombreux et, d’autre part, on dispose pour eux d’un terminus post quem précis : la date de la conquête de l’Angleterre par les Normands (1066), avant laquelle il est extrêmement peu probable que des emprunts en série aient pu se produire. En ce qui concerne les affriquées, on peut citer Fitz (dans les patronymes comme Fitzwilliam, qui provient de fiz, le fils), chapel, chief, judge, jury. On peut donc affirmer que, vers la fin du xi^e sièlce, les affriquées étaient encore bien présentes en français. On trouve aussi, en mittelhochdeutsch, des emprunts comme tschevalier, tschapel, mütze (< almuce), schanze (Footnote: Pope, From Latin to Modern French, § 195.).

Les consonnes finales fournissent aussi des indices utiles. Dans cette position, l’affriquée [ts] traditionnellement notée z. Elle provient notamment (Footnote: Fouché, Phonétique historique, p. 775 et sq. ; Zink, Phonétique historique, p. 126 et sq.) :

d’une affriquée intérieure qui se retrouve en finale suite à la chute d’une voyelle finale atone : voce(m) > voiz, vice(m) > foiz, bracchiu(m) > braz
de la rencontre d’un d roman issu d’un t latin avec un s final : amatis > *ameds > amez (vous aimez), ad satis > assez. Les participes passés en -atus (amez, portez), -itus (finiz) et -utus (perduz, venduz) entrent dans cette catégorie.
de la rencontre de nn ou de l et n mouillés, articulés de manière renforcée, avec s final : conseuz < consilium, anz < annos, poinz < pugnos.

Par opposition, on trouve bien sûr de nombreuses formes avec s final qui, à l’origine, ne riment pas avec les formes en -z. Ainsi, des rimes comme braz : pas, perduz : plus, finiz : six, voiz : lois, si elles se rencontrent, devraient être le signe que, dans la langue du poète, les -z finaux ([ts]) se sont simplifiés en [s] et que, dans le même mouvement, toutes les affriquées se sont vraisemblablement aussi simplifiées. Les spéculations des historiens de la langue quant à la date de la simplification des -z finaux reposent en bonne partie sur la pratique de Chrétien de Troyes, actif entre 1160 et 1185 et qu’on considère, du fait que quelques-unes de ses chansons nous sont parvenues, comme le premier des trouvères. D’une manière générale, Chrétien respecte l’opposition -s/-z à la rime alors que, indépendamment de la rime, le fameux scribe Guiot, qui a copié ses romans, se montre fort consistant en la matière. Mais on trouve quelques notables exceptions à cette règle. Pope signale par exemples les rimes bou(t)s (de bouter) : rescos (de rescorre) et puissanz : sanz (mis pour sens, de sensus) (Footnote: Pope, From Latin to Modern French, § 195. Chrétien de Troyes, Erec et Enide, vv. 2193, 3849.). En cherchant un peu, on trouve aussi, dans Perceval : trez (pour trefs, les tentes) : letrez (litteratus), ou jors (les jours, qui rime assez systématiquement en -z chez Chrétien) : torz (de turris, la tour, clairement en -s) (Footnote: Chrétien de Troyes, Perceval, vv. 4149, 2503.).

On a donc, à la base, un système dans lequel -s et -z sont séparés à la rime. Chez Chrétien de Troyes, ce système se lézarde un peu puisque font leur apparition quelques rimes -s : -z. Comment interpréter cela ? Il n’est pas interdit de considérer ces exceptions comme de pures licences : bien qu’immergé dans une langue distinguant absolument -s et -z, Chrétien se serait accordé quelques facilités. On remarque toutefois que ces facilités vont dans le sens de l’évolution de la langue. Pourquoi alors ne pas admettre, avec Fouché (Footnote: Fouché, Phonétique historique, p. 780.) et quelques autres, que les rimes -s : -z de Chrétien traduisent un état de langue où [ts] a commencé à se simplifier en [s] et ou, peut-être, certains locuteurs ont déjà complètement oublié [ts] ?

D’un point de vue modestement qualitatif, l’hypothèse selon laquelle le français de 1160 voyait peu à peu disparaître ses affriquées est plutôt solide. Il faut toutefois observer une grande prudence face aux tentatives plus ambitieuses d’appliquer des méthodes quantitatives (ou statistiques) à l’analyse de telles formes dans les manuscrits littéraires (Footnote: Dees, la Reconstruction de l’ancien français parlé.). Une analyse de la distribution des rimes d’un manuscrit à l’autre pourrait avoir une chance de nous renseigner finement sur l’état de la langue en un lieu et en un instant donné si et seulement s’il pouvait être établi que le seul facteur déterminant l’appréciation des rimes est la langue du poète. Or, il semble bien que, en plus de rimer sur la langue (c’est-à-dire d’utiliser leur perception intime de la langue qu’ils parlent pour décider si une rime est ou non acceptable), les poètes riment sur un modèle, constitué par la connaissance, patiemment assimilée, du système de versification de leurs devanciers, avec ce qu’ils se sont permis et ce qu’ils ont évité. Bien sûr, ce modèle, ou ce système, ne peut être complètement dissocié de la langue du poète, mais il peut s’en écarter. Et surtout, il est susceptible de comporter des contraintes ou des libertés héritées ou non d’états de langue antérieurs.

Plus le poids — ou l’autorité — du système est important, plus il aura tendance à masquer, parfois pour longtemps, des évolutions phonétiques qui touchent la langue. En partant de l’hypothèse que l’« océan » des rimes -s : -s et des rimes -z : -z chez Chrétien de Troyes ne s’explique que par le poids du système, on arriverait à la conclusion que la « goutte d’eau » des quelques rimes -s : -z révèle un état de langue où l’affriquée [ts] s’est à cent pour cent simplifiée en [s]. Quant à estimer, pour un poète donné à un moment déterminé de sa carrière, les poids respectifs du système de versification et de la langue, c’est très certainement, en ce qui concerne le xii^e siècle, une gageure (Footnote: On a la tâche plus facile lorsque, par exemple au xvi^e siècle pour les rimes o : au, on dispose par ailleurs de témoignages sur la langue qui indiquent que la diphtongue au s’est complètement simplifiée.).

Un peu plus tard, Thibaut de Champagne sépare encore très systématiquement -s et -z à la rime, bien que ses scribes ne soient pas complètement consistants dans leur graphie. Il y a même, chez lui, une suite punais : enfançonès : nez (l’adjectif nets) : mauvès qui, ainsi que le réclame la structure de la strophe, entremêle deux rimes différentes, l’une en -ès, l’autre en -èz. Cela tend à prouver que, quelle que soit la langue qu’il pouvait parler, la distinction historique entre -z et -s existait encore dans son système de versification, ou, autrement dit était encore métriquement pertinente (Footnote: Sur cette notion de pertinence métrique, voir par exemple, Cornulier, L’Art poëtique, p. 210 et sq.) pour lui. En revanche, on trouve une rime pris (part. passé de prendre) : farcis (part. passé de farcir) qui est clairement une rime -s : -z (Footnote: Thibaut de Champagne, Chansons, p. 240, 180.). Il y a considérablement plus de rimes de ce type chez Gace Brulé : travauz et solaus, mots en -z figurant dans une série de mots rimant en -aus ; beneois et droiz (-z) rimant avec courtoiz, rois et même voirs, savoirs, avoirs (-s) ; une série de rimes mélangeant des mots en -iz comme esbahiz, floris, gueriz, diz avec des mots en -is comme ris, espris, amis (Footnote: Gace Brulé, The Lyrics, p. 122, 124, 186-190.).

Dans les Miracles de Nostre Dame, Gautier de Coinci observe encore, de manière générale, l’opposition -s : -z. Tout comme Thibaut de Champagne, il donne même la preuve qu’elle est encore, pour lui, métriquement pertinente : on trouve en effet, à la rime, la suite poz (pouls) : espoz (épous) : doz (doux) : toz (tous) (Footnote: Gautier de Coinci, Les Miracles de Nostre Dame III, p. 417.). Or, Gautier observe, tout au long des dizaines de milliers de vers que compte la partie narrative de son œuvre, un arrangement en distiques de rimes plates (aa) dans lequel une rime donnée ne se succède pas à elle-même. Dans ce contexte, une suite de quatre -oz consécutifs représenterait une irrégularité si l’on ne s’avisait que poz et epoz riment en s alors que doz et toz riment en z. En dépit de cela, Gautier s’accorde aussi quelques libertés : il fait à plusieurs reprises rimer puis (< puteum, le puits, donc z) avec je puis (s) (Footnote: Gautier de Coinci, Les Miracles de Nostre Dame I p. 116, II p. 92, 140, 251, III p. 247, IV p. 142, 528, 573.). On trouve aussi, plus ponctuellement, vaus (< vales, tu vaux, donc s) : hauz : portaus : consaus (tous trois en z), dois (doigts donc z) : dois (< debes, tu dois, donc s), diex (dieux, donc s) : dielz (de deuil, z), assaus (z) : faus (< falsus, faux donc s), nuiz (< noctem donc z) : anuis (ennui, s) , jors (diurnos, s) : sors (sourd, z) (Footnote: Gautier de Coinci, Les Miracles de Nostre Dame I p. 45, II p. 21, 41, III p. 91, 222, IV p. 551, 564, 573. Contrairement à la pratique de Chrétien de Troyes, jors rime avec amors, donc en s chez Gautier (I, p. 37).).

Chez Rutebeuf, l’opposition -s/-z persiste en gros, mais les exceptions deviennent plus nombreuses et plus variées : solas (-z) : affolas, Satans : tanz (< tantus), blanz : tans (temps), beaux (-s) : ribaux (-z), palais (-z) : mais, sainz (saints) : mains, pès (paix, -z) : jamais, et aussi Jhesucris et Jhesucriz, rimant alternativement en -s et en -z (Footnote: Rutebeuf, Œuvres complètes, vol. 1 p. 100-1143.). Un peu plus tard, et un peu plus au nord, Adam de la Halle mélange complètement -s et -z. Dans ses seules chansons, desquelles la graphie -z est complètement bannie, on trouve des séries entières de rimes qui mélangent des mots qui, traditionnellement, riment en -s et en -z : c’est le cas pour des mots en -is/z, en -ous, en -us, en -ans (Footnote: Adam de la Halle, Œuvres complètes, p. 14-15, 38, 43-46, 49, 98, 104-16, 111-113.). Chez Machaut, le seul examen du cycle de la Loenge des dames permet de se rendre compte que, totalement oubliée par la langue, la distinction -s/-z appartient désormais aussi au passé pour ce qui touche le système de versification (Footnote: Machaut, Poésies lyriques, p. 17-237.) : elle a perdu toute pertinence métrique.

En récapitulant du point de vue de l’interprète, l’alternative se pose de la manière suivante :

Un orateur ou un chanteur qui voudrait, dans sa diction, maintenir les anciennes affriquées et, partant, donner une réalité phonique à l’opposition -s/-z pourrait le faire sans gros problème chez Chrétien de Troyes, à condition d’adoucir ponctuellement l’affriquée -z dans les quelques rimes qui confondent les deux consonnes. Sa position deviendrait de moins en moins tenable au fur et à mesure que les poètes « oublient » l’opposition -s : -z.
À l’inverse, un interprète qui n’aurait aucun égard à l’opposition -s/-z et qui déclamerait dans un français sans affriquées (ou sans consonnes finales !) ne rencontrerait guère de problème, quelle que soit la pratique du poète.

Quoique tendant déjà à se simplifier, les affriquées restent donc historiquement plausibles dans la langue jusque vers 1200, c’est-à-dire pour la première génération des trouvères. Elles le deviennent de moins en moins après cette date, quoiqu’on en trouve encore des traces pour ainsi dire fossilisées durant quelques décennies dans le système de versification.

L’ère des grammairiens

En publiant, en 1529, son Champfleury, Geoffrey Tory ne prétend probablement pas faire œuvre de grammairien. Cependant, dans sa démarche empreinte d’humanisme, il ne peut appréhender les lettres de l’alphabet, leurs formes et leurs proportions sans placer l’« homme parlant » au centre de son discours. Ainsi, il parsème ses descriptions, censément typographiques, de remarques sur la prononciation, qui montrent qu’il a lu les théoriciens de l’Antiquité et qu’il a une bonne connaissance des langues modernes. Puisant aussi bien chez Priscien que chez Érasme, Tory se distingue par une appréciation très fine des particularités articulatoires des consonnes, essentiellement fondée sur les écrits du grand orateur carthaginois Martianus Capella. Le caractère comparatif de ses descriptions, et le fait qu’elles accordent une part à des prononciations dialectales du français, confèrent une valeur unique à son témoignage. Lorsque cela est nécessaire, je complète les descriptions de Tory par celles d’autres grammairiens.

b et p :

« Nous prononceons […] le B. de nos lefres sentreouurans de la force de lyssue de nostre alaine ». Le caractère bilabial et occlusif du b ressort bien de cette description. De plus, comme les Gascons confondent b et v et que les Allemands ont tendance à confondre b et p, on en déduit que b est déjà l’occlusive voisée que nous connaissons ([b]), par opposition à p qui n’est pas voisé ([p]). Pour p aussi, c’est, selon Martianus Capella, le souffle qui ouvre les lèvres. Tory remarque aussi que, quelquefois, les anciens aspirent le p « pour vser des dictions grecques qui sescriuent avec Phi » et il étend cet usage au français, pour les mots d’origine hellénique comme Philibert et philosophe, dans lesquels ph vaut pour f (Footnote: Tory, Champfleury, ff° xxxv r°, lii v.°).

d et t :

De d, Tory dit que « Les Latins lont figuree droicte par deuant comme vng I. & ronde par derriere comme vng O. pour monstrer quelle veult estre pronuncee en frapant de la langue contre les dents de deuant », et il donne quasiment la même description de t. Les Italiens se distinguent par une articulation forte et nette des d et t finaux en latin, ce qui n’est manifestement pas le cas des français, et encore moins celui des Lyonnais et des Picards, qui tendent à laisser tomber complètement ces consonnes finales en français (Footnote: Tory, Champfleury, ff° xxxviii r°, lxix v°.).

m et n :

« M doibt estre pronuncee en sorte que en la prouferant, & que le lon dicelle est en effect, fault imprimer, cest a dire, serrer les deux leures, lune auec laultre, sans que la langue soit remuee, ne quelle touche aux dents de deuant, ne de quelque couste que ce soit ».

« N veult estre pronuncee de la langue venant toucher contre les dents de dessus, & contre la partie du palais prouchaine aux dictes dents de dessus ».

Le point d’articulation de ces consonnes est donc fort précisément décrit. Leur caractère nasal ressort moins nettement, mais il se déduit de la description de l’m, dont Tory nous dit que le son se fait entendre alors même que les lèvres sont serrées. (Footnote: Tory, Champfleury, ff° l r° et sq.)

l :

« L. veult estre pronuncee de la langue & du palaix, qui est concauite superieure de la bouche, auec vn doulx esperit de voix ». Les Bourguignons tendent à prononcer r pour l (Footnote: Tory, Champfleury, ff° lxviii v°.).

f et v :

« F. est doulcement proferee de la langue touchant contre le palaix, & que les dents depriment vn peu la lefure de dessus ». Tory veut bien sûr dire « la lèvre de dessous », comme Martianus Capella qu’il cite. Les Allemands ont pour habitude de dire f pour v, ce dont on déduit que l’opposition voisée – non voisée est bien présente en français.

Pour v, la description de Martianus Capella citée par Tory correspond manifestement au [w] du latin classique, ce qui ne l’empêche pas de distinguer la « bonne » prononciation du v consonne français [v] à la fois du v des Allemands ([f]) et du u de l’italien aqua ([w]) (Footnote: Tory, Champfleury, ff° xlv v° et lix r°.).

s et z :

« Le S. est pronuncee en faisant vng sifflement entre les dents serrees. ». Par ailleurs, cette consonne est « exile » (faible) et « adoulcye » lorsqu’elle se trouve « entre deux vocales ». On trouve donc bien les deux sons [s] et [z] du français (Footnote: Tory, Champfleury, f° lvi.).

Les palato-vélaires :

De c, Tory dit, citant Martianus Capella, qu’elle « veut estre pronuncee, & exprimee en heurtant des deux costes de la langue contre les grosses dents, quon dit maschelieres ». Il s’agit bien sûr du [k] occlusif, qui est la seule prononciation que connaissent les grammairiens antiques. Il remarque ensuite que les Italiens prononcent le c « mol, & quasi comme si la syllabe ou il est, estoit escripte auec aspiration H » devant e et i, décrivant probablement la chuintante [ʃ], variante dialectale de l’affriquée [tʃ] de l’italien standard : Chesar et Chichero seraient donc, en latin, préférables au c « exile » du français ([s]). Les Picards prononcent donc « mieux » les c que le « bon François », puisque, non seulement, ils prononcent ci et ce comme les Italiens ([ʃ]), mais qu’ils rejoignent les anciens en prononçant Canoine, Cose, vng Quien ([k]) conformément au latin canonicus, causa, canis là où les Français prononcent « auec aspiration » ([ʃ]). Sans prétendre donner raison aux uns ou aux autres, on se bornera à noter que le « bon » français du xvi^e siècle ne se distingue pas du français standard du xxi^e siècle s’agissant de la distribution de l’occlusive [k], de la sifflante [s] et de la chuintante ([ʃ]).

g « veult estre pronunce de nostre voix issant par la concauite superieure de nostre bouche », dit Tory en paraphrasant Martianus Capella. La « concauite superieure » n’étant autre que le palais, cette définition fait bien apparaître le caractère palatal du son [g]. En outre, le caractère voisé ressort de l’observation selon laquelle les gens de Bourges tendent à prononcer c pour g et disent icnem [kn]. Tory distingue le son propre du g [g] de celui de l’ i consonne [ʒ] et il observe en particulier que les Picards prononcent le g en lieu de l’i consonne, en disant par exemple gambe pour iambe (Footnote: Tory, Champfleury, ff° xxxvi v° et xli v°.).

Dans certains usages, c est susceptible de se prononcer [g], comme c’est encore le cas pour second en français standard. Au nombre des mots concernés, on trouve Claude, siècle, second, secret, enclume (Footnote: On a par exemple la rime regle : siecle chez Pierre de Nesson, Vigiles, p. 30 ; Du Gardin, Les premieres addresses, p. 256, écrit englume ; voir aussi et surtout Thurot II, p. 203 et sq.). La rime regret : secret gagne ainsi en richesse.

Le digramme ch, qui transcrit la lettre khi dans les emprunts savants au grec (avec ou non passage par le latin), n’avait, à l’origine, aucune raison de se prononcer autrement que dans les mots indigènes ([ʃ]). Dès le xvi^e siècle, cependant, on se met ici ou là à le prononcer à l’italienne. Plus tard, Ménage essaiera de domestiquer un usage encore hésitant :

Le cha et le cho des Latins se prononcent toujours parmy nous ca & co. On dit caus, caractére, Caron, Carites, colére, corde, Eco, &c. Et cest pourquoy plusieurs écrivent ses mots sans h, pour empescher qu’on ne dise, à la Françoise, chaos, charactére, &c. ce que je ne desaprouve pas. Nous écrivons demesme Nicomaque & époque, & non pas Nicomache et époche. Pour le che, & le chi, ou le chy, ils se prononcent tantost par ch, & tantost par k. Voicy apeuprês les mots qui se prononcent par ch. Achelois, Achéron, Achille, anarchie, Anchise, Antioche, Archevesque, Archidiacre, Archiduc, Archiprestre, Archiméde, Architecte, cacochyme, Cathéchisme, Chérubin, Chimére, Chio, Chirurgien, (mais il faut dire Cirurgien) chyle, Chymie, Ezéchiel, hiérarchie, Michel, Monarchie, Patriarche, Psyché. Et à ce propos il est à remarquer que les Chartreux prononcent à la Françoise le ch de tous les mots Latins. Voicy apeuprês les François qui se prononcent par k. alchimie, Archéanasse, Archélaüs, Archestratus, Archiépiscopal, Archigenês, chélidoine, Chersonnése, chiragre, chirogrophaire, chiromance, Eschyle, Eschinês, Laschês, Melchisédéc, orchestre, trochée. Il est à remarquer, qu’il faut dire Mikel Ange, & non pas Michel Ange, quoyqu’on prononce Michel. Je remets à un autre lieu à en dire la raison. (Footnote: Ménage, Observations, p. 388-389.)

On devine que la raison en question n’est autre que l’origine italienne du nom.

h :

Plus préoccupé par le rôle de l’aspiration dans les langues antiques, Tory est ici peu informatif. Tout au plus remarque-t-il que les Allemands font une « aspiration double » lorsqu’ils lisent le latin, prononçant hheri, hhabui. On en conclut que les Français et les Italiens aspiraient déjà aussi peu qu’aujourd’hui lorsqu’ils disaient homme ou ha (il a) (Footnote: Tory, Champfleury, f° xliiii r°.). On ne trouve pas mention chez Tory de l’h « aspiré » du français.

Il faut, pour en trouver trace, consulter les grammairiens, par exemple Meigret (Footnote: Meigret, Traité touchant le commun usage de l’escriture françoise, f° F r°.), qui constate que h donne « vehemence » à une voix, comme dans « home » (probablement mis pour heaume comme le suggère Thurot, car il élide régulièrement lorsqu’il s’agit d’un être humain : « l’home, prud’home » (Footnote: Meigret, Grammere, ff° 2v°, 3, 3v°, 35 v°, etc. Il écrit bien « come // homes » (f° 4r°) sans élision, mais avec un retour à la ligne entre les deux mots, ce qui complique l’interprétation ! De plus, il refuse « ce home », « du home », « au home », « le home » et réclame « cet home » (f° 54r°, 120r°, 121 v°, 140 r°), ce qui est décisif. Je ne suis donc pas Morin lorsqu’il affirme que Meigret aspirait l’h initial de homme (La Variation dialectale, p. 209). Il semble du reste que, pour Meigret, les termes « aspiration », « aspiré » réfèrent à la présence d’un h initial dans la graphie d’usage et non à une aspiration phonétique. Ainsi admet-il (f° 140 v°) la présence d’une « aspiration » aussi bien dans « vne Haranjiere » que dans « vn’Hotęsse », alors même que, dans le second de ces exemples, l’e féminin qui précède est élidé.)), « hallebarde, hallecret », attestant que ces mots d’origine germanique avaient pu conserver un certain degré d’aspiration initiale jusqu’au xvi^e siècle. Meigret conserve dans sa graphie un certain nombre d’h dont il a bien de la peine à fournir une justification purement phonétique : « theolojíe, characther’ » (il écrirait « çha- » s’il prononçait [ʃ]), « aothorité, ethimolojíe, ao jourdhui, Mathieu » (Footnote: Meigret, Grammere, ff° 2r°, 2 v°, 9 r°, 13 r°, 22 r°.). Il reconnaît même que l’aspiration de ces consonnes, le plus souvent transcrite d’un idiome étranger, « ne nous ęt pas fort neçessęre : car le seul t ęt suffizant a la prononçíaçíon » (Footnote: Meigret, Grammere, f° 13r°.) et que « th ne sone non plus ęn nostre lange, ęn Mathieu q’ęn matin » (Footnote: Meigret, Grammere, f° 15 r°-v°.). S’il appliquait ses principes jusqu’au bout, il s’abstiendrait de toute « reueręnç’ a l’antiqité » (Footnote: Meigret, Grammere, f° 9 r°.) et supprimerait donc ces h de son système graphique.

Les grammairiens anglais sont bien placés pour attester d’une aspiration, comme Palsgrave (Footnote: Cf. Thurot II, p. 391 et 392, et Palsgrave, éd. Génin, p. 17 : « This letter h, where he is written in frenche wordes, hath somtyme suche a sounde as we use to gyve hym en thes wordes in our tong : “have, hatred, hens, hart, hurt, hobby”, and such lyke, and than he hath his aspiration : and somtyme he is written in frenche wordes an hath no sounde at all, no more than he hath with us in these wordes : “honest, honour, habundaunce, habitation”, and suche like, in whiche, h is written and nat sounded with us. Whiche thynge also happenneth in the frenche tongue, in all suche wordes as be deducted out of latin wordes whiche be written with h and sounde hym nat in that tong ».) qui donne deux listes de mots avec h aspiré ou non, l’h aspiré conférant un « stronger sounde » (Footnote: Palsgrave, éd. Génin, p. 30 : « Though it appere sufficiently, where as I spake of h before, that he is no consonant in the frenche tong, but onely an addynge of a stronger sounde to the vowell that followeth hym. ») à la voyelle qu’il précède. Mais il faut tempérer ces témoignages par celui de Théodore de Bèze : il distingue de manière très claire l’h aspiré de l’h « quiescent », relevant que l’aspiration n’a en général pas lieu pour les mots d’origine latine ou grecque. Il atteste que les mots hache, harpe, Henri et Hector, qu’il considère comme gréco-latins, font exception et ont l’h aspiré ; l’origine en fait germanique des trois premiers ne fait aujourd’hui plus de doute. Il note ensuite un certain nombre d’h qui ne sont pas d’origine gréco-latine et qui ne sont pas aspirés : huis, huict, huistre, dont il identifie les étymons (ostium, octo et ostrea), relevant même que la présence de l’h sert à désigner l’u voyelle, et donc à distinguer graphiquement huis de vis dans une graphie qui confond u et v. On retrouve cette explication jusque dans le Petit Robert qui, lui, considère l’h de huit comme aspiré, ce qui n’a à l’évidence pas toujours été vrai (dix-huit). Bèze relève aussi que les composés de hault, qu’il considère comme dérivés de altus, prennent un h aspiré, qu’on explique aujourd’hui, faute de mieux, par une influence germanique (Footnote: Bèze, De Francicae linguae recta pronuntiatione, p. 67-68.). Il se plaint finalement de l’habitude consistant à ne pas aspirer certains h aspirés, et à dire en ault, l’azard pour en hault, le hazard, qu’il a relevée chez les Bourguignons, les Berrichons, les Lyonnais et les Aquitains et il dresse une longue liste de mots dont l’h initial est aspiré, qui se révèle sans surprise eu égard à l’usage qui a prévalu.

C’est alors qu’il précise que les Français, autant que faire se peut, « adoucissent l’aspiration, afin qu’elle soit parfaitement audible, mais non exhalée de façon rude du fond de la gorge, comme c’est le cas chez les Allemands et des Italiens, particulièrement les Toscans » (Footnote: « Aspirationem Franci quantum fieri potest emolliunt, sic tamen vt omnino audiatur, at non asperè ex imo gutture efflata, quod est magnoperè Germanis & Italis praesertim Tuscis, obseruandum ». Bèze, de Francicae linguae recta pronuntiatione, p. 25. La mention des Toscans concerne peut-être la façon qu’ils ont d’aspirer certains c initiaux, prononçant a hasa mia pour a casa mia.). De par ses fonctions à Lausanne, puis à Genève, Bèze était en rapport constant avec des pasteurs bernois germanophones, et était donc bien placé pour mesurer le degré d’aspiration de leurs h. Cette remarque, extrêmement crédible, doit donc inciter à la prudence : il est vraisemblable qu’au xvi^e siècle encore l’aspiration ait été plus marquée que la simple disjonction qui est pratiquée aujourd’hui en français standard : du Gardin en témoigne encore lorsqu’il décrit h « Aleman » de hors, haulser, honte etc. comme ayant « vn accent aspre & aspiré, se faisant fort ouir » (Footnote: Du Gardin, Les premieres addresses, p. 64.). Il est par contre probable qu’elle n’atteignait le plus souvent pas l’intensité qu’elle a conservée dans les langues germaniques comme l’anglais ou l’allemand.

Alors que Palsgrave, seul de son espèce, range hélas parmi les mots dont l’h s’aspire, il est démenti tant par la pratique des poètes que par le témoignage de Bèze et, plus tard, par des autorités aussi solides que Vaugelas (Footnote: Vaugelas, Remarques, p. 200.) ou les dictionnaires de l’Academie et de Richelet (Footnote: Contrairement à Crevier, La liaison à la fin du xvii^e siècle, je ne pense pas que Milleran, Les deux grammaires fransaizes, II, p. 59, considère comme aspiré l’h de hélas. C’est l’expression « ha ! helas ! », prise globalement, dont il aspire l’h initial seul.). Tant Bèze que ces deux dictionnaires donnent par contre hé ! comme aspiré (Footnote: Palsgrave, éd. Génin, p. 18. Bèze, De Francicae linguae recta pronuntiatione, p. 27, 67.), ce que confirme, en 1650, Dobert, pour qui, dans ha !, hé ! et ho ! il faut « antieremant » aspirer, c’est-à-dire ne pas se limiter à la simple disjonction que connaissent les mots d’origine germanique (Footnote: Dobert, Recreations literales, p. 522.). Mais la pratique des poètes peut se révéler différente, comme en témoigne l’hémistiche « Hé bien, Madame, hé bien, » chez Racine (Footnote: Racine, Andromaque, Acte I, scène IV.). Richelet veut que l’h de hola soit aspiré et il reproche à Molière cet alexandrin : « Bon, je resve, hola, dis-je, hola quelqu’un hola » (Footnote: Richelet, La Versification françoise, p. 113.).

Le mot héros ne figure pas dans la liste des h aspirés de Palsgrave, ni dans celle de Oudin et un poète comme Baïf lie sans remords tùlez Érôs (tous les héros). Ce n’est qu’avec Vaugelas — lui-même considère la prononciation « irrégulière » de héros comme une contamination par héraut — qu’est consacré l’usage actuel, où héros est aspiré, mais pas héroïne ou héroïque (Footnote: Palsgrave, éd. Génin, p. 18 ; Oudin, Grammaire françoise, p. 17 ; Jean-Antoine de Baïf, Etrénes, f° 14 v° ; Vaugelas, Remarques, p. 3.).

Des graphies comme Hierusalem, Hierosme, hyacinthe, Hierico sont traditionnellement rendues par un « i consonne » ([ʒ]). Du Val le remarque déjà en 1604 : la graphie actuelle s’est adaptée à cet usage. L’usage hésitera en revanche longtemps pour le mot hiérarchie que Buffier, au xviii^e siècle, prononce encore Jérarchie (Footnote: Du Val, L’Eschole, p. 19. Buffier, Grammaire françoise, p. 376.).

l mouillé :

Tory ne mentionne pas ce son. Il est toutefois largement attesté par les grammairiens comme Meigret, qui imagine en 1542 de marquer d’un « poinct crochu » les l dont la prononciation est « molle » et correspond au double l de l’espagnol llano, pratique qui permettrait d’écrire « mełeur » au lieu de « meilleur » (Footnote: Meigret, Traité touchant le commun usage de l’escriture françoise, f° Gii v°.). Curieusement, dans sa Grammere de 1550, il change quelque peu son point de vue, puisqu’il écrit « oręlłe , falłions » et qu’il précise que ce dernier mot se fait « ęn amoullissant la seconde ł », ce qui confirme qu’il entend bien deux l dont seul le second est mouillé (Footnote: Meigret, Grammere, ff° 6 v°, 84 v°). On ne trouve nulle part de double l mouillé chez lui, alors qu’il distingue l simple de l double en écrivant, par exemple, « voulu » et « vallu ». Il écrit par contre « eguyłon » avec l mouillé non précédé de l (Footnote: Meigret, Grammere, f° 87 r°, Réponse à Peletier, f° 3 v°.). Peletier, quant à lui, utilise la graphie « lh » qui est en fait, comme il le note lui-même, celle des troubadours, pour figurer l’l mouillé. Il écrit « eulh » pour œil, mais « oreilhɇ », comme s’il entendait la dipthongue [ei̯] avant l’l mouillé. Il note par contre « veulhons » et « balhɇ » sans i (Footnote: Peletier, Dialogue, p. 110 et sq, 81, 129.).

Pour la quasi-totalité des grammairiens qui décrivent cette consonne, l’l mouillé apparaît comme un vrai l palatal ([ʎ]) et non tel qu’il est prononcé aujourd’hui, soit comme un simple yod ([j]). Ainsi, Bèze écrit-il que cet l « produit un son mou proche de celui de la syllabe li qui se fondrait dans la voyelle suivante, son noté gl par les Italiens dans figliuolo et ll par les Espagnols dans llamado qui se prononce à peu près comme on dirait liamado en trois syllabes » (Footnote: Bèze, De francicae linguae recta pronuntiatione, p. 29. « Ante [Post ?] i verò vocalem edit mollem quendam sonum Hebreae, Graecae, & Latinae linguae prorsus insuetum, proximè accedentem ad sonum syllabae li cum proxima vocali coalescentis, quem Itali quidem per gl scribunt, tum in initio, vt in gli articulo, tum intra ipsam dictionem, vt figliuolo : Hispani verò per duplex ll initio quoque vocabulorum notant, vt llamado quasi liamado trissyllaba dictione. ») Des signes d’un glissement de l palatal vers yod sont néanmoins perceptibles déjà au xvii^e siècle, par exemple chez Hindret qui, critiquant la prononciation de la « petite Bourgeoisie de Paris », lui reproche de dire batayon, postiyon là où il faudrait « des i accompagnez de deux ll moüillées » (Footnote: Hindret, L’art de bien prononcer, Discours initial). Peut-être marqué par cet usage parisien, le système phonétique de Vaudelin, publié en 1713, ne connaît ni l ni n « prétenduës mouillées », mais leur substitue la consonne sèche correspondante (l ou n) suivie d’une « diphtongue » i – e féminin. En translittérant le mot soleil, tel qu’il le graphie, en API, on obtiendrait quelque chose comme [sO.lɛ.liə], qui correspond plus probablement à [sOlɛlj], ou peut-être même à [sOlɛj] si l’on admet que la consonne, comme le dit Vaudelin à propos de la prononciation des artisans de Paris, devenait naturellement « un peu obscure ». Mais on pourrait tout aussi bien imaginer que, par économie, Vaudelin s’est dispensé de forger des caractères spécifiques et qu’il prononce en fait [sOlɛʎ] (Footnote: Vaudelin, Nouvelle maniere, p. 6 et 7, Instructions, p. 14. Voir aussi Cohen, Le français en 1700, p. 6.). Quoiqu’il en soit, la prononciation « parisienne » ne devrait guère avoir de répercussion dans le discours soutenu où l palatal s’est probablement maintenu jusqu’au xix^e siècle. Littré, en tous les cas, réclame encore qu’on prononce mouillage « avec ll mouillées et non mou-ya-j’ ».

Il existe aussi quelques indices de confusion de l palatal avec l, portant sur des mots comme jaillir, bouillir, taillis, juillet, œillet, gentille (Footnote: Turot, II, pp 300 et sq.). Deimier (Footnote: Deimier, L’Academie, p. 132.), par exemple, critique la rime gentile : coquille, ce qui semble bien traduire son insécurité de méridional.

n mouillé :

D’après Tory, « les Italiens prononcent le G. bien mol quant il est entre I. & N. », notamment dans le mot ignem. C’est probablement au n palatal ou mouillé ([ɲ]) qu’il fait allusion. En 1542, Meigret décrit bien en effet une « n molle » qui sonne entre g et n et pour laquelle il fait forger en 1550 un n particulier qu’il surmonte en plus d’une sorte de tilde ; il l’utilise par exemple pour « liŋ̃e, Espaŋ̃ols » (Footnote: Meigret, Traité touchant le commun usage de l’escriture, f° Fii v°. Grammère, ff° 13 v°.). S’il hésite entre « sinificaçíon » et « significaçíon », il écrit par contre « dine, dinité » et « sinifie » (Footnote: Meigret, Grammere, ff° 19 r°, 21 v°, 45 r°, Defenses, f° Aii v°.), ce qui correspond à un usage ancestral, en quoi il est rejoint par Peletier qui déclare aussi prononcer n non palatal dans « cognoętrɇ , signifier, regner, dignɇ » et qui, pour le reste, utilise le nh des troubadours pour noter n mouillé (Footnote: Peletier, Dialogue, p. 111.). En 1687, Hindret considère encore que signer, consigner, soubsigner etc. se prononcent « comme s’il n’y avoit qu’vne n » (Footnote: Hindret, L’Art de bien prononcer, p. 23).

N mouillé présente aussi des signes d’instabilité dans le parler des Parisiens, qui tendent à lui substituer la suite n-yod ([nj]) ou même ni ([ni]). Hindret figure au nombre des grammairiens qui relèvent ce défaut (Footnote: Hindret, L’Art de bien prononcer, discours initial.).

r :

« R, est pronuncee de la langue faisant strideur & son ronflant apertement » écrit Tory, en paraphrasant Martianus Capella qui, bien sûr, décrit l’r apical ou roulé du latin, mais il ajoute que « Quant les chiens se despitent lung contre lautre, auant quilz sentremordent, en renfroignant leur geulle/ & retraignant leurs dents, ilz semblent quilz pronuncent le R ». Ces chiens menaçants, retroussant les babines et serrant les dents, devaient avoir bien de la peine, même au xvi^e siècle et dans le Berry, à faire entendre un vrai r roulé ; il est probablement plus adéquat d’identifier le son produit au r « de gorge » dont parle déjà Saint Louis. Tory témoigne aussi du fait que l’assibilation d’r intervocalique était fréquente tant à Bourges, sa ville natale, qu’à Paris où il réside, puisque bon nombre de personnes disent « IERVS MASIA » au lieu de « IESVS, MARIA », pratique qu’il retrouve chez les anciens lorsqu’ils voulaient éviter « la rude asperite » de l’R. Il établit enfin un palmarès d’où il ressort que ce sont les Picards qui, le mieux, prononcent l’r en français.

En résumé, on trouve déjà, dans ces quelques paragraphes imprimés en 1529, une description très imagée de l’r et de ses avatars, d’où il ressort que :

l’r « canonique » est apical (ou roulé),
Un son vibrant évoquant le grondement d’un chien est identifié à l’r,
R est souvent assibilé en [z] à Paris.

Plusieurs grammairiens du xvi^e siècle établissent une nette distinction entre r « faible » et r « fort ». C’est déjà le cas de Meigret en 1550 :

Or qant a la voęs de r, je treuue qe lę’ Françoęs la prononçet plus fort ao double, tenant le premier lieu du vocable, q’ęs aotres lieus : come rire, rare, çe qe non seulemęnt nou’ gardons ęs simples, mę́s aosi ę’compozez. tęllemęnt qe r seul’ ęn contrerolle son’ aotant qe lę’ deus ęn courrouçé. (Footnote: Meigret, Grammere, f° 14r°.)

Ainsi, on pourrait avoir, dans rire, r roulé en position initiale et r battu en position intervocalique. Bèze remarque, de manière analogue, que la langue française note r simple pour la prononciation « molle » et rr pour la prononciation « forte », comme dans terre, dont on imagine qu’il ne doit pas être confondu avec taire (Footnote: Bèze, De francicae linguae recta pronuntiatione, p. 34. « Immò quamuis sit omnium litterarum asperrima, ideóque apud Hebraeos nunquam daghessetur, & Francicam linguam constet molitiem pronuntiationis in primis captare, tamen quum geminatur, fortiter est efferenda, vna quidem priorem syllabam finiente, altera verò sequentem inchoante. »). Il fait de plus partie de ceux qui ont noté chez les Parisiens, mais aussi à Auxerre et à Vezelay où il est né, une tendance à assibiler r faible (Footnote: Bèze, De francicae linguae recta pronuntiatione, p. 34. Parisienses autem, ac multo etiam magis Altissiodorenses & mei Vezelij simplicem etiam in s vertunt, vt courin, Masie, pese, mese, Theodose pro cousin, Marie, pere, mere, Theodore).

En 1620, Du Gardin décrit de manière particulièrement précise la distinction r « faible » - r « fort » en finale de mot :

I’ay dict ia deux ou trois fois (er doux) D’autant qu’en aucuns mots l’(er) rude, comme en Iupiter, enfer, Luther, Lucifer, ou l’(er) se prononce rudement. Vous diriés que fer en Lucifer, enfer, sonne comme la premiere en ferrum: pareillement la derniere en Iupiter & Luther, sonne comme la premiere en terror. Mais les dernieres en chausser, taster ; & quasi tous autres mots en er sonnent plus doucement, tout ainsi comme la premiere en fero, tero. esquels mots on entr’oit tant seulement vn peu l’(er) qui se ioinct quasi comme à l’o & à l’e en prononçant, de sorte que ter en tero, & ter en taster donnent la mesme resonnance. (Footnote: Du Gardin, Les premieres addresses, p. 87.)

Un peu plus tard, Chifflet (1659) reste dans la même ligne :

L’r simple, a un son fort different de la double, laquelle est beaucoup plus rude. Considerez le en ces mots ; la guerre ne dura guere. Cette difference estant bien entendue, il faut observer que l’r, quoy que seule, sonne comme la double au commencement des mots : comme ; rrare, rrire. Deplus l’r après b, c, d, f, g, p, t, se prononce comme double : brave, crier, drap, froid, grand, prendre, triste &c. Prononcez comme s’il y auoit, brrave, crrier &c. Enfin l’r seule n’a le son de la simple, que quand elle est entre deux voyelle : comme, charité, pour eux, heureux &c. Par tout ailleurs elle a le son de la double. (Footnote: Chifflet, Essay d’une parfaite grammaire, p. 225)

Plus tard, alors que certains auteurs, comme Renaud (Footnote: Renaud, Manière de parler, p. 574.), tiennent encore à cette distinction, d’autres, comme Lartigaut, excluent r double du champ de la grammaire :

L’-r ne se prononce que d’une maniére. On ne le doit jamês doubler ; si ce n’et à deus ou trois tams des verbes en -rir ; come - je courré, is aquerrêent, nous secourrons, &c, & peutêtre aus mos e’trangers […] Que s’il y-a des mos, où il sanble que l’on prononce deus - rr ; come - orreur, terrible, &c- souvenez-vous que c’et une pure figure de Re’torique, qui tache d’exprimer tous les mouvemans de l’ame ; afin de toucher pluz sansiblemant les queurs qu’èle veut gagner par les orèlles : mês hor de là, à parler nature’lemant & danz la conversacion ordinêre, il n’et rien de pluz constant que l’on n’an prononce qu’un. (Footnote: Lartigaut, Principes, p. 28-29.)

En 1685, Mourgues critique Boileau pour une rime terre : chaire, mais il reconnaît par ailleurs que « ; la double r & la simple, ont une même prononciation dans la bouche de ceux qui sçavent parler François, quoy qu’elles en ayent de fort differentes dans quelques Provinces ». Pour Brumoy, qui remanie le traité de Mourgues en 1724, « la double r rend toûjours ouvert l’e qui précede ; au lieu que celui qui précede la simple r est toûjours fermé » (Footnote: Mourgues, Traité de la poësie françoise, éd. 1685, p. 55, éd. 1724, p. 58.). Il entend donc une différence de timbre là où d’autres notent une opposition de quantité.

À la fin du siècle, Dangeau atteste la disparition d’r « fort » :

Prèmièrement on dit que dans les mots où l’E est suivi de deus R. comme terre, verra, ferrer, si l’on ne met pas deus R. celui qui lira poura se tromper sur la prononciation, & ne prononcera pas l’E. qui prècède l’R. come il le doit prononcer, il ne le prononcera pas come un E. ouvert, & ne le prononcera pas long. Cet inconvenient me paroît considerable, mais j’y remedie aisémant, parequ’en ces ocasions je mets sur ces E. un accent circonflexe ^, qui marque, & qu’il le faut prononcer come un E. ouvert, & qu’il le faut prononcer long, ainsi j’écris, têre, vêra, fêrer. Le double R. sert quelquefois simplemant à alonger la voyèle qui prècède, come dans pourra, mourrai, en ces ocasions je retranche un des R. & pour marquer que la voyèle est longue, j’y mets un accent circonflexe ^, & j’écris poûra, moûrai. (Footnote: Dangeau, Opuscules, p. 41)

Même si la perspective est ici orthographique, le témoignage est intéressant car il révèle que, tout comme l’amuïssement des s implosifs six ou sept siècles plus tôt, l’affaiblissement d’r « fort » a pu, au moins transitoirement, provoquer un allongement de la voyelle précédente.

Si l’assibilation d’r en s est fort bien attestée par de nombreux témoignages concordants (Footnote: Thurot, II p. 271 et sq.), on constate au contraire que la question du grasseyement est extrêmement peu abordée par les grammairiens. Peut-être Pillot y fait-il allusion : estimant que le son de l’r est à peine supportable pour les oreilles françaises, il constate que les « petites femmes de Paris » assibilent cette consonne en disant peze et meze. Il ajoute : « mais ceux qui veulent parler de manière particulièrement distinguée modèrent sa rudesse de la moitié du son, ou en tout cas l’adoucissent au point qu’on ne l’entende qu’à peine, ce qui cependant n’a d’habitude pas lieu au milieu du mot » (Footnote: Pillot, Gallicae linguae institutio, p. 37-38. « Verùm qui egregiè loqui volunt, aut medio quodam sono asperitatem ipsius temperant, aut certè adeò leniter exprimunt, ut vix audiatur, quod tamen in media dictione fieri non solet. »). Il décrit donc une manière d’adoucir les r qui n’est pas une assibilation et qui ne touche pas, probablement, r intervocalique. Est-ce déjà un grasseyement ?

La définition même du terme de grasseyer, reste longtemps assez floue. On le rencontre, et c’est probablement sa première attestation, chez Palsgrave où, sous la forme « Je grassie », il est donné comme traduction de l’anglais « to lyspe », équivalant à to lisp, mot que les dictionnaires modernes traduisent par « zézayer ». Palsgrave donne l’exemple suivant : « Il grassie ung petit, mays cela luy siet bien » (Footnote: Palsgrave, éd. Génin, p. 612). Indépendamment de sa traduction phonétique exacte, qu’il n’est pas possible de déterminer à ce stade, le grasseyement apparaît déjà, en 1530, comme un défaut, mais un défaut qui peut avoir son charme. En 1611, on retrouve grassier avec le sens de to lispe dans le dictionnaire de Cotgrave. Dans son édition de 1690, le dictionnaire de Furetière précise quelque peu la définition : il s’agit toujours d’un défaut de prononciation, mais consistant à « parler gras, ne pouvoir pas bien prononcer certaines lettres et entre autres l’r ». C’est exactement cette acception qu’on trouve quelques années plus tôt chez Hindret qui recommande de patients exercices correctifs « à ceux qui grassayent & qui ont de la peine à prononcer nos r » (Footnote: Hindret, L’Art de bien prononcer, discours initial). La première édition du Dictionnaire de l’Académie, datant de 1694, donne : « Grasseier. v. n. Parler gras, prononcer certaines consonnes, & principalement l’R avec difficulté. Cette femme grasseïe agréablement. il luy sied bien de grasseïer. » alors que le Dictionnaire de la langue françoise de Richelet donne « Grasseïer : c’est parler gras (Elle grasseïe un peu, & cela ne lui messied pas) » et « Grasseïement : Maniere de prononcer d’une personne qui grasseïe (Le grasseïement affecté est désagréable. Acad. Fr.) ». On voit que tant l’Académie que Richelet reprennent l’exemple déjà donné par Palsgrave, à la nuance que, dans les deux cas, il est mis au féminin : toujours considéré comme un défaut qui peut être charmant, le grasseyement semble l’apanage des femmes. Apparaît de plus la notion de grasseyement « affecté » qui évoque les précieuses.

Le caractère vague de ces définitions peut étonner, mais il représente une tendance assez générale : les grammairiens du xvii^e siècle fournissent en fait très peu de descriptions phonétiquement précises des consonnes, comme si leur prononciation était trop évidente pour devoir être explicitée. Et même ceux qui, par souci pédagogique, détaillent quelque peu leur articulation, restent le plus souvent muets sur celle de l’r, ainsi Maupas qui écrit, très adéquatement, que « L s’exprime plainement du bout de la langue » et qui se tait du tout au tout s’agissant de l’r (Footnote: Maupas, Grammaire (1625), p. 17 et 20.). C’est donc, paradoxalement, ailleurs que chez les grammairiens qu’on trouve les meilleures descriptions :

Et l’R, en portant le bout de la langue jusqu’au haut du palais : de sorte qu’estant frolée par l’air qui sort avec force, elle luy cede, & revient toûjours au mesme endroit, faisant une maniere de tremblement. (Footnote: Molière, Le Bourgeois gentilhomme, Acte II, scène IV.)

Molière avait-il, comme l’imagine Straka (Footnote: Straka, Les Sons et les mots, p. 466.), une intention particulière en décrivant un r incontestablement apical devant un public de courtisans dont certains s’étaient éventuellement mis à grasseyer ? Je ne le pense pas, pas plus que cette tirade ne nous renseigne sur la prononciation qu’adoptait Molière dans sa vie quotidienne. Indépendamment de toute considération sociale, et de l’usage réel qui pouvait prévaloir à la Ville, dans les faubourgs ou à la Cour, l’r canonique était l’r apical, c’était le seul qu’un maître pouvait enseigner, le seul qu’un acteur pouvait, parodie mise à part, employer sur une scène. On peut imaginer par contre que la maladresse avec laquelle Monsieur Jourdain qui, peut-être, grasseyait dans son parler naïf, s’efforçait de produire un r roulé à la suite du maître était, elle, de nature à déclencher l’hilarité. Comme l’a aussi relevé Straka, Molière reprend mot pour mot la description de l’r donnée par Géraut de Cordemoy en 1668 (Footnote: Cordemoy, Discours physique de la parole, p. 77.), mais le fait que Cordemoy décrive un r apical ne saurait non plus nous apprendre quoi que ce soit sur l’articulation pratiquée par Cordemoy dans son enfance ou dans sa vie domestique d’adulte. L’approche de Cordemoy n’est pas grammaticale mais philosophique (c’est bien le moins s’agissant de celui qui sert de modèle au maître de philosophie); de plus Cordemoy est aussi et d’abord avocat, donc orateur : l’r apical qu’il décrit, sans exprimer le moindre doute métaphysique, n’est peut-être autre que celui du barreau.

Plus authentique apparaît le témoignage de Dobert (1650), lui aussi en marge des grammairiens, qui relève que, parmi les liquides, r est celle qui sonne le mieux toute seule (c’est-à-dire sans l’aide d’une voyelle), « kand on remuë la langue de je ne [sais] kele fason fretillante brizant l’ęr antre les dans avec activité : vû ke pour lors on ne dit pas son nom ki ęt er ou erre, męs on exprime son son ki ęt r ». Et de brocarder ensuite un prédicateur venant de Paris et qui dirait : « Arristote dans sa morrale se rand currieux » etc. ou une Dame qui mignarderait : « Pięre s’aręte » etc. (Footnote: Dobert, Recreations literales, p. 544.) Dans le cas du prédicateur, on croit reconnaître un assibileur (ou un grasseyeur) né qui, parce qu’il parle en public, roule exagérément tous ses r intervocaliques les faisant paraître « forts » ; dans celui de la Dame, on est en face de quelqu’un qui adoucit tous les r « forts », peut-être en les grasseyant.

Le grammairien Dangeau, à la fin du siècle, sera un des seuls à donner d’r (apical) une description phonétiquement évocatrice, lui pour qui les « liquides » (l et r) « se forment en approchant la langue du palais, & faisant couler doucement la vois antre la langue & le palais » (Footnote: Dangeau, Opuscules, p. 24.).

En fin de compte, la conviction de Straka selon laquelle la Cour s’était, dans son ensemble et vers la fin du xvii^e siècle, mise à grasseyer semble reposer sur le seul témoignage d’Andry de Boisregard :

Il est bon de faire sonner un peu les R, cela donne de la grace au langage ; mais il ne faut pas se régler sur le peuple de Paris, qui les prononce jusqu’à écorcher les oreilles, mon perre entend-on quelquefois, ma merre, mon frerre ; ce n’est pas ainsi qu’on prononce à la Cour, l’on doit un peu faire entendre l’R, mais il faut que ce soit d’une manière douce, & qui n’ait rien de grossier ny de badaut. (Footnote: Andry, Réflexions sur l’usage, p. 466.)

L’indice est on ne peut plus ténu… Andry, il faut bien l’admettre, ne dit strictement rien de précis quant à l’articulation qu’il prête aux courtisans et aux badauds : il se place exclusivement sur le terrain de la douceur et de la rudesse. À partir de là, on peut tout imaginer : des courtisans qui grasseyent délicatement, ou de manière affectée, opposés à des badauds qui roulent grossièrement, mais aussi des courtisans dont l’r apical est délicat (cela serait le cas s’ils ont conservé l’r apical battu ancestral pour leurs r intervocaliques) opposés à des badauds qui, soit, grasseyent sans vergogne à la manière d’Édith Piaf, soit essaient de corriger l’assibilation de leurs r en roulant de manière maladroite et exagérée.

Pour L. Biedermann (Footnote: Biedermann, Les grands courants orthographiques, p. 164.), une phrase d’un traité anonyme de 1669, relevant que les précieuses « à peine prononcent l’r », serait le signe que celles-ci ont passé d’r roulé à r grasseyé. Ne disant rien du lieu d’articulation, ce témoignage n’est pas en lui-même plus déterminant que celui d’Andry. On le rapproche toutefois de celui des dictionnaires qui mettent grasseyement au féminin et attestent qu’il peut être une marque d’affectation.

Dans une comédie de 1670, Le Boulanger de Chalussay figure la prononciation de la précieuse Alphée en substituant l à r :

Mais, de glace, Monsieul, quelle est la Comedie,

Encol qu’il n’en ait fait aucune où l’on de die

Qu’il faut clevel de lile, où l’on puisse tlouuel

Le moindle tlait d’esplit que l’on doiue admilel (Footnote: Le Boulanger de Chalussay, Elomire hypocondre, Acte III, sc. II.)

La confusion d’r avec l est un phénomène qui est déjà décrit au xvi^e siècle (Footnote: Thurot II, p. 274 et sq.) et qui n’équivaut pas forcément à un grasseyement. Rien ne dit donc absolument qu’Alphée grasseyait. Dans une autre comédie, cependant, L’Après-soupé des Auberges, due à Raymond Poisson, on a confirmation que cette substitution peut rendre une prononciation affectée, comme celle de cette vicomtesse, qualifiée de « grasseyeuse » par Dangeau (Footnote: Dangeau, Opuscules, p. 20.), qui écartèle de manière beaucoup plus marquée la phonétique du français, ce qui fait se « pâmer » la belle Climène :

Me fais-ze entendle au moins, & mon glasseyement

Ne m’oblize-t’il point d’auoil un Tlucement ?

Teltes-vns de mes mots vous essape, ze daze. […]

Et moy, ze ne voudles zamais ouulil la bouce,

Tomme le pallé gueas est tout à fait salmant ?

Zay toûzoul, touzoul peul de pecel en pallant  (Footnote: « Me fais-je entendre au moins, et mon grasseyement / Ne m’oblige-t’il point d’avoir un Truchement ? / Quelques-uns de mes mots vous echappe, je gage. / Et moi, je ne voudrais jamais ouvrir la bouche, / Comme le parlé gras est tout à fait charmant ? » Poisson, L’Après-soupé, sc. III.)

On note au passage que le mot « gras » n’est pas rendu par glas mais par gueas, ce qui pourrait évoquer certains accents créoles.

Si l’on admet donc, sur la base d’un faisceau d’indices, que les précieuses s’étaient, vers 1670, mises à grasseyer, cela n’impliquerait pas pour autant que la Cour dans son ensemble leur ait emboîté le pas.

Hors de ce contexte parodique, r grasseyé est probablement resté fort longtemps encore exclu du théâtre, et donc du chant :

Je condamne au silence une Actrice profane,

Qui change en cris aigus les soupirs d’Ariane,

Celle qui ne formant qu’un bruit vague & confus,

Laisse expirer ses tons, avec peine entendus,

Ou qui, les yeux en pleurs, de deüil enveloppée,

Evoque, en grasseyant, les manes de Pompée. (Footnote: Dorat, La déclamation, p. 76.)

Ces vers de Dorat montrent en tout cas que, dans les années 1770, le grasseyement faisait encore figure de défaut rédhibitoire sur une scène.

L’r dorsal ou grasseyé est-il, comme l’écrit Straka (Footnote: Straka, Les Sons et les mots, p. 468.), une création de la haute société de la seconde moitié du xvii^e siècle ? Rien n’est moins sûr. Les documents sont rares et peu clairs, ce qui cache peut-être une réalité plus complexe qu’on ne l’imagine. Comparé à celui d’Andry, le témoignage de Saint Louis est d’une précision confondante. Si l’on reçoit celui-là, on pourra donc difficilement rejeter celui-ci. Et si l’on accepte que c’est bien du grasseyement qu’a voulu parler Andry, on doit aussi recevoir le témoignage de Pillot, plus ancien d’un bon siècle. La haute société du xvii^e siècle, qui n’a donc vraisemblablement rien créé, a pu néanmoins sélectionner, à un moment qu’il est difficile de déterminer précisément, la variante grasseyée d’r, déjà présente de manière plus ou moins diffuse dans le parler parisien et, peut-être sous l’impulsion des précieuses, contribuer à ce qu’elle se répande dans les centres urbains.

Sur la base de tous les indices existants, on peut donc, quoique de manière hypothétique, dresser le scénario suivant, qui reprend et précise celui que l’ère des scribes a déjà permis d’ébaucher :

Les deux r originels du français sont apicaux. R « fort » est roulé alors qu’r « faible » intervocalique est simplement battu.
Au Moyen Âge, peut-être vers la fin du xii^e siècle, dans une zone géographique qui englobe Paris, r « faible » s’assibile en [z] et commence à s’amuïr lorsqu’il est en finale (infinitifs). L’articulation d’r « fort » se déplace quant à elle vers l’arrière : c’est à ce moment-là qu’apparaissent, sans distinction nette de classe sociale, des r dorsaux ou grasseyés.
R apical, qui s’est maintenu dans bien des régions, est retenu à Paris (et à la Cour) comme marque de bon usage mais la distinction entre r battu et r roulé tend à se perdre, en particulier chez les Parisiens de naissance, pour qui cette articulation est devenue artificielle.
À partir de la fin du xvi^e siècle, certains Parisiens tentent de corriger l’assibilation d’r « faible » qu’on leur reproche, ce qui peut donner des r exagérément roulés, ou alors précipiter l’apparition d’r grasseyés en position intervocalique.
À un moment qu’il n’est pas possible de déterminer, r grasseyé qui s’est infiltré dans la prononciation quotidienne d’un nombre important de courtisans, prend le dessus à la Cour. Cette variante acquiert de fait valeur de norme pour la conversation familière et elle s’exporte dans les principaux centres urbains.
R roulé se maintient envers et contre tout dans le discours soutenu (chaire, barreau, théâtre, chant), ainsi que dans la plupart des terroirs.
Jusque dans la seconde moitié du xvii^e siècle, les principaux grammairiens prescrivent de marquer la différence entre r « faible » intervocalique et r « fort ».

Le grasseyement, quoique tendant a se répandre, est resté très longtemps stigmatisé par les arbitres de la belle prononciation. Même s’il correspond probablement à un combat d’arrière-garde, le témoignage de Lesaint, datant de la fin du xix^e siècle, mérite d’être cité car on le croirait avoir été écrit cent cinquante ans plus tôt :

R. Cette consonne linguale s’entend dans rabais, régiment, rigide, robuste, fer, pur, etc. L’r s’articule assez fortement au commencement : rapidité, — et légèrement dans le corps des mots entre deux voyelles : parole, ou précédée d’une consonne : brosse. Le grasseyement de l’r, défaut très commun aux Parisiens et qui consiste à supprimer plus ou moins cette lettre dans la prononciation, devient insupportable dans le chant. Dans la conversation, lorsqu’il est peu sensible, on lui trouve généralement quelque chose de doux et d’agréable, qui paraît sourtout plus gracieux dans la bouche d’une femme. — La véritable prononciation de l’r est parfaitement indiquée par Molière dans le Bourgeois Gentilhomme. (Footnote: Lesaint, Traité complet, p. 236-7.)

x :

« X. vaut en vertus & en pronunciation autant que C. & S. » dit Tory, citant Martianus Capella. C’est un apport de l’humanisme que d’avoir attiré l’attention sur la prononciation antique de l’x. Cette découverte semble avoir eu des effets douloureux. Bèze, lui-même distingué helléniste, constate presque à regret que cette lettre, « par une nécessité qui fait violence à la douceur de la langue française, se prononce comme un double c dans les emprunts étrangers ». Mais il relève que le second x de Xerxes et Artaxerxes ne fait entendre qu’un seul c, comme si l’on écrivait Xerces, Artaxerces : c’était trop demander aux palais français que de leur faire prononcer deux x dans deux syllabes consécutives (Footnote: Bèze, De francicae linguae recta pronuntiatione, p. 36. « Haec litera in peregrinis dictionibus, necessitate quadam Francicae linguae suauitati veluti vim afferente, pronuntiatur pro duplici cc vt xerxes, Artaxerxes, sic tamen vt in poeteriore istorum nominum syllaba audiatur alterum c duntaxat, quasi scribatur xerces, Artaxerces »). Bèze prononce aussi le double cc dans exercer, exemple, executer, exces, excessif. Aux siècles précédents, cette lettre n’avait que la valeur d’un s ([s] ou [z]) et personne ne s’en plaignait. Les grammairiens vont donc avoir fort à faire pour rétablir le « vrai » son de l’x dans les emprunts : si l’on en juge par l’usage actuel, ils y sont parvenus, en tout cas en partie.

Alors qu’au xv^e siècle on prononçait encore ezemple, esperience ou peut-être même eperience, ce dont on trouve quelques souvenirs chez Palsgrave, qui prétend que x ne doit jamais être prononcé en français comme il sonne en latin ou en anglais, mais plutôt comme un s entre deux voyelles (Footnote: Palsgrave, éd. Génin, p. 38), on trouve une belle unanimité chez les grammairiens du xvi^e siècle pour rendre à l’x sa sonorité canonique. On peut penser que le discours soutenu s’est plié à cette nouvelle tendance d’autant plus facilement que les mots concernés étaient savants. L’affaiblissement de [ks] en [gz] est déjà attesté par Meigret qui, par ailleurs, note « siste » mais « sęxtuple », hésite entre « ezęmple » et « exęmple », entre ezpedié et « ęxpedié » mais écrit « ęxçedant, exçępter, exęrçiçe » et « exterieur, extręt, excluzif, extraordinęre, exactemęnt, maxime » (Footnote: Meigret, Grammere, ff° 14 r°, 15 v°, 17 r°, 17 v°, 23 r°, 23 v°, 29 r°, 34 v°, 35 r°, 41 r°, 42 r°, 42 v°, 45 r°, 46 r°, 46 v°.). Henri Estienne, qui défend dans tous les cas la prononciation humaniste([ks]) témoigne de la peine que ses contemporains avaient à se conformer à cette règle lorsqu’ils se laissaient aller à articuler Gsenophon, ezemple ou Alessandre (Footnote: Henri Estienne, Hypomneses, p. 73-74.).

Dans les mots les plus usités, comme excuse, exemple, exquis, extase, texte, sexte, extreme, dextre, expliquer, c’est s qui prédomine jusqu’au xviii^e siècle au moins dans le bon usage. Rien n’indique qu’il en ait été autrement dans le discours soutenu.

L’ère des chanteurs

Pour Baïf (Footnote: Jean-Antoine de Baïf, Etrénes, p. 7 (ma numérotation) de l’introduction.), dont le projet vise à construire en français des vers mesurés à l’antique (Footnote: Voir Le Songe de Scazon, prochainement en ligne sur ce site.), les consonnes posent avant tout un problème métrique : s’il conservait la graphie usuelle, un bon nombre de syllabes recevraient le statut de longues par le seul fait qu’elles contiennent, graphiquement parlant, une syllabe implosive (Footnote: En métrique antique, toute consonne implosive rend longue la syllabe qui la contient). Ainsi, la première syllabe de fasse, par la simple présence du double s, devrait être comptée comme longue, alors que celle de face pourrait rester brève. Baïf ne peut se satisfaire de cette fiction, et il doit donc épurer la graphie de manière qu’à chaque consonne corresponde un signe graphique et un seul. Son système graphique compte 19 consonnes, qui résultent d’une analyse phonétique cohérente de la langue du xvi^e siècle. Par exemple, la consonne [k] est toujours rendue par k (jamais par c ou q), la consonne [ʒ] par j (jamais par g), la consonne [s] par s (jamais par c ou ss). Il existe deux signes particuliers, £ et ñ, traduisant l et n mouillés ([ʎ], [ɲ]) ; v (consonne) est très strictement distinct de u (voyelle) ; h n’est utilisé que dans les situations de h « aspiré » et il existe un caractère ad hoc, ç (ç dans les Etrénes et les Chansonnettes) pour noter [ʃ]. Enfin, il n’existe pas de caractère unique équivalant à x. Baïf le transcrira tantôt par ks (éksès, ékspìåér, éksèrsitez), tantôt par sa forme adoucie gz (égzaltant, égzôsse), tantôt même par un simple s (ésplikerè, éskìîz’, éspôÎz’) (Footnote: Jean-Antoine de Baïf, Etrénes, f° 14 r°, psaumes 45, 49, 51, 55, 59, 64, 78.).

Mersenne, même s’il est moins rigoureux en termes de graphie, reprend le même système de 19 consonnes que Baïf (Footnote: Mersenne, Embellissement des Chants, p. 379-381, in Harmonie universelle, vol. 2 du facsimilé.). De sa description de leur articulation, on comprend notamment qu’il se sert d’un r apical, ce d’autant plus qu’il reproche à ceux qui « parlent gras » de changer tr en dl :

Toutes les autres consones se forment par le mouuement de la pointe de la langue, qui fait l, n, et r en se retirant en arriere, quoy que ce retirement soit fort petit; elle s’aduance vn peu en-deuant pour c, g, et t par le mouuement qu’elle fait de sa pointe vers les dents; elle frappe le palais pour faire l, et pour faire r elle frappe le palais et les dents superieures; elle se meut quasi de mesme façon en se pliant contre le palais pour l et pour n, mais elle se tire et se plie vn peu dauantage pour n. (Footnote: Mersenne, Traitez de la voix et des chants, p. 58, in Harmonie universelle, vol. 2 du facsimilé.)

Il écrira aussi :

L’vne des grandes perfections du chant consiste à bien prononcer les paroles, & à les rendre si distinctes, que les auditeurs n’en perdent pas vne seule syllabe ; ce que l’on remarque aux recits de Baillif, qui prononce fort distinctement, & qui fait sonner toutes les syllabes, au lieu que la plus part des autres les étouffent dans la gorge, & les levres, que l’on n’entend quasi rien de ce qu’ils recitent, soit faute de n’ouurir pas assez la bouche, ou de ne remuer pas la langue comme il faut. C’est a quoy les Maistres se doiuent estudier, afin que leurs escoliers leurs facent de l’honneur, & que les Pages & autres enfans qui doiuent chanter deuant le Roy, & dans les Eglises, prononcent aussi bien en chantant, comme s’ils parloient simplement, & que leurs recits ayent mesme effet qu’vne harangue distinctement prononcée. (Footnote: Mersenne, Embellissement des Chants, p. 356, in Harmonie universelle, vol. 2 du facsimilé.)

Puis, se référant à Caccini, il louera la manière dont les Italiens, qui « animent » leurs récits plus puissamment que ne le font « nos Chantres ». Ces pages sont intéressantes et nouvelles. D’une part, elles placent on ne peut plus clairement le chant dans le domaine de l’art oratoire. D’autre part, et peut-être pour la première fois en France, elles réclament des chanteurs un effort expressif que Mersenne réduit au rendu de trois passions principales : la colère, la joie et la tristesse (Footnote: Mersenne, Embellissement des Chants, p. 369, in Harmonie universelle, vol. 2 du facsimilé.). Même s’ils ne touchent pas spécifiquement les consonnes, ces développements annoncent les écrits d’autres théoriciens du chant qui, eux, feront porter sur les consonnes une bonne partie de l’effort expressif exigé des chanteurs.

C’est bien le cas de Bacilly qui, dans le chapitre qu’il consacre au mouvement et à l’expression, et parmi d’autres procédés et ornements destinés à exprimer les affects, mentionne « certaines Prononciations particulières au Chant & à la Declamation », et notamment le fait de « suspendre » ou de faire « gronder » certaines consonnes (Footnote: Bacilly, Remarques, p. 201.). Il sera beaucoup plus explicite quant à ces renforcements expressifs dans les chapitres qu’il consacrera spécifiquement aux consonnes, et qu’il introduit de la manière suivante :

Ie ne parleray point icy de la maniere que se forment les Consones chacune en particulier, puis que ce seroit prendre la chose de trop loin. Ie les distingueray seulement par leurs qualitez, pour ce qui concerne le Chant François ; C’est à dire ie parleray de celles qui ont plus ou moins de force ou de douceur dans le Chant, & qui demandent d’estre plus appuyées, & prononcées auec plus de poids que les autres ; De celles qui sont jointes dans vne mesme syllabe à d’autres Consonnes, que l’on appelle vulgairement liquides, pourueu qu’elles soient apres les Consonnes, & non pas deuant ; Des finales qui se prononcent auec fermeté, & de celles qui se prononcent legerement, ou point du tout ; De celles qui suspendent quelque temps la prononciation de la Voyelle auant que de la faire sonner, de ce que l’on appelle communément gronder ; C’est par ces qualitez, & par ces circonstances que ie les excepte d’auec celles, qui n’ont rien de particulier en elles & qui ne demandent autre obseruation que le soin general qu’il faut auoir de les bien faire entendre, & auoir toûjours dans l’idée qu’à moins d’vn soin & d’vne exactitude fort grande, ceux qui vous écoutent ne distinguent pas assez les paroles que vous leur chantez, lesquelles sont souuent embarrassez par les traits du Chant, & dont les syllabes sont separées & éloignées les vnes des autres par la Note & par la maniere de Chanter qui les y oblige.

En un mot, il faut que celuy qui chante soit toûjours en crainte de ne pas assez articuler les syllabes, & qu’ainsi les Auditeurs ne goustent qu’à demy le plaisir du Chant, & que ce plaisir ne soit troublé par le chagrin de n’entendre pas assez distinctement les Paroles, & pour ainsi dire par le soin de les deuiner. (Footnote: Bacilly, Remarques, p. 289-290.)

Voilà donc le chanteur qui, en plus de faire entendre distinctement les paroles (tout bon professeur l’y enjoindrait), doit établir une balance extrêmement subtile entre la force de son expression et cette douceur, amplement célébrée, qui participe de l’essence de la langue française. Le meilleur orateur, on le devine, est non pas celui qui force le plus le trait, mais celui qui trouve l’équilibre le plus heureux entre douceur et force.

Laissant ce soin aux grammairiens, Bacilly ne détaille pas le mode d’articulation de chaque consonne. Il limite ses préceptes aux consonnes r, l et n.

r :

Il ne dit rien de précis sur le lieu d’articulation de cette consonne (apical ou dorsal) mais, lorsqu’il met en garde sur la prononciation de la suite -rl- du mot parlons, « qui donne de la difficulté à plusieurs pour bien prononcer l’r » (Footnote: Bacilly, Remarques, p. 293.), on comprend bien que c’est l’agilité de la pointe de la langue, et donc la transition de [r] à [l] qui peut présenter des difficultés (surtout chez un Parisien qui grasseyerait dans son parler quotidien). La transition de [ʁ] à [l] ne poserait pas ce problème. De plus, il reste attaché à la distinction traditionnelle entre r « faible » et r « fort » :

Premierement, il faut tenir pour maxime, que toute r, qui est entre deux Voyelles ne se doit prononcer que simplement & sans affectation, & tout au contraire toute r qui n’est point entre deux Voyelles, mais qui suit immediatement vne Consone, ou qui la precede, doit estre prononcée auec plus de force, & comme s’il y en auoit deux, ou mesmes plusieurs, selon que le mot demande plus ou moins d’expression ; de sorte que l’r de mortel se doit prononcer auec poids, là ou celle de mourir (c’est à dire la premiere & non la derniere, dont ie parleray dans le Chapitre des Finales) qui semble demander la mesme expresion, puis que c’est en quelque façon le mesme mot, ne se doit prononcer que fort legerement, parce que celle-là precede une Consone, & celle-cy est entre deux Voyelles. (Footnote: Bacilly, Remarques, p. 292.)

[…]

Il faut encore prononcer l’r auec assez de force lors qu’elle est Capitale, ie veux dire qu’elle commence le mot, comme Rien, Respect, Rendons, & toûjours auec la mesme précaution que dans les r qui sont jointes aux autres Consones, c’est à dire plus ou moins, selon que l’expresssion le merite, comme il arriue dans les mots de rigueur, reuolte, & autres qui ont plus de poids (pourueu que le sens ne s’y oppose pas comme j’ay dit) que ceux-cy, reciter, ranger, raison, rappeller, redire, raconter, &c. (Footnote: Bacilly, Remarques, p. 294-295.)

Autrement dit, r « faible », simplement battu et non roulé, ne souffre aucun renforcement affectif. Par contre, r « fort », manifestement roulé, peut être « surroulé » lorsque l’expression le réclame. À ce propos, Bacilly précise on ne peut plus clairement que c’est le sens général de l’énoncé et non le mot pris pour lui-même qu’il faut prendre en compte : dans, « Mon cœur ne sent plus de tourment », ce serait bien sûr une faute de goût que de surrouler l’r de tourment (Footnote: Bacilly, Remarques, p. 294.).

l :

Il insiste surtout sur l’absence de double l en français : les l de cruelle et de belle sont à passer aussi légèrement que celui de celer, l intervocalique ne souffrant donc pas plus qu’r « faible » les renforcements expressifs. Par contre, on ne saurait trop appuyer les l implosifs de malgré, reuolter (Footnote: Bacilly, Remarques, p. 298.).

n :

« De toutes les consonnes, il n’y en a point qui contribuë dauantage à l’agrément du Chant que l’n », s’étonne-t-il. En effet, le caractère nasal qui, d’ordinaire, est tout sauf gracieux, apparaît comme un agrément s’agissant de l’n. Mais cet agrément, qui caractérise avant tout n suivi d’une voyelle, n’en est un que « pourueu qu’on ne l’appuye pas auec fermeté (comme font certains Prouinciaux) & qu’on ne fasse que l’effleurer, comme si on la vouloit cajoler, cette Consone voulant estre traitée auec flatterie & douceur » (Footnote: Bacilly, Remarques, p. 302-306.). On remarque en particulier que cette consonne, au contraire de certains r et l, ne semble pas particulièrement se prêter aux renforcement expressifs.

Les renforcements expressifs

Bacilly consacre ensuite un chapitre à « la Suspension des Consones, auant que de faire sonner la Voyelle qui les suit » :

Il y a vne Prononciation qui est tout à fait particuliere au Chant & a la Declamation, qui se fait lors que pour donner plus de force à l’Expression, on appuye de certaines Consones, auant que de former la Voyelle qui les suit ; ce que l’on a bien voulu nommer, gronder.

De toutes les Consones qui se grondent (pour se seruir de ce mot) l’m est la plus considerable, & dans laquelle cette espece de Prononciation paroist dauantage, à cause qu’elle se prononce tout à fait des levres, lesquelles on tient quelque temps assemblées, auant que de faire sonner la Voyelle dans ces mots, mourir, malheureux, miserable, lesquels mots sont tres-frequens dans le Chant François. (Footnote: Bacilly,Remarques, p. 307-308.)

Ici aussi, il précise que c’est le sens général de l’énoncé qui dicte le recours au grondement. Faire gronder l’m de « Ie ne veux mourir, ny changer » serait une insulte au bon goût. Puis il donne quelques exemples de suspensions d’autres consonnes, comme l’f des mot infidele ou enfin, l’n de non, l’s de seuere, le j de jamais (Footnote: Bacilly,Remarques, p. 308-311.).

En somme, si Bacilly connaît, et réclame, pour la déclamation et le chant, un certain nombre de renforcement expressifs, ceux-ci restent assez peu nombreux et ne touchent qu’un nombre restreint de consonnes. Chez lui, l’expressivité, même si elle est revendiquée, reste très précisément contrôlée et strictement limitée par le bon goût. L’emphase selon Bacilly reste strictement codifiée et ne saurait déferler à bride abattue.

On ne pourra probablement jamais tracer, de manière linéaire, une histoire de l’emphase entre le xvii^e et le xviii^e siècle. Les témoignages sont difficilement comparables les uns aux autres et, quelle que soit la période, l’emphase prête le flanc à la caricature. Ainsi, lorsque Molière se moque des comédiens de l’Hôtel de Bourgogne (Footnote: Molière, L’Impromptu de Versailles, in Œuvres complètes, I p. 669 et sq.), cela ne signifie nullement que l’emphase était alors passée de mode ou en voie de disparition : les mêmes spectateurs qui hurlaient de rire en voyant Molière imiter Montfleury pouvaient s’être pâmés la veille en voyant le même Montfleury en proie aux transes de la tragédie. En aucun cas, Molière, en prônant le « naturel », n’a pu infléchir en profondeur le cours de l’histoire de la déclamation. Vue sous l’angle étroit des renforcements de consonnes, l’emphase connaît même une singulière inflation entre Bacilly et Bérard, soit entre 1668 et 1755.

Pour Bérard, en effet, « on doit doubler les lettres dans tous les endroits marqués au coin de la passion ». Ce principe est mis en application dans des exemples si explicites qu’ils seront repris tels quels par des traités ultérieurs (Footnote: Notamment Raparlier et L’Ecuyer.) (je note en gras les consonnes qui doivent ou peuvent être doublées) :

Plus on connoît l’amour, & plus on le déteste :

Détruisons son pouvoir funeste.

Rompons ses nœuds, déchirons son bandeau,

Brulons ses traits, éteignons son flambeau. (Footnote: Bérard, L’Art du Chant, p. 96)

Dans cet extrait d’Armide, « on ne sçauroit trop s’attacher à doubler fortement les lettres, & à prononcer avec beaucoup de dureté & d’obscurité ». On n’a pas de peine à imaginer que cette profusion extrême de renforcement affectifs aurait été jugée de fort mauvais goût par Bacilly. En particulier, Bacilly s’abstient totalement de préconiser le doublement (ou la suspension) des occlusives (b, c, p, d, t, etc.). Bérard donne deux autres exemples de passages dans lesquels « il faut doubler les lettres foiblement, & ne se permettre qu’une prononciation douce & claire, comme dans cet extrait de Psyché :

J’éprouve comme vous un embarras extrême,

De quelle vive ardeur ne suis-je pas touché ?

Que de choses à dire ? & cependant, Psyché,

Cependant, je ne puis que dire, je vous aime. (Footnote: Bérard, L’Art du Chant, p. 97.)

Ou dans ce fragment des Fêtes de l’Hymen :

Ma Bergere fuyoit l’amour,

Mais elle écoutoit ma musette,

Ma bouche discrette

Pour ma flamme parfaite

N’osoit demander du retour :

Ma Bergere auroit craint l’amour,

Mais je fis parler ma musette,

Ses sons plus tendres chaque jour

Lui peignoient mon ardeur secrette,

Si ma bouche étoit muette,

Mes yeux s’expliquoient sans détour,

Ma Bergére écouta l’amour,

Croyant écouter ma musette. (Footnote: Bérard, L’Art du Chant, p. 98.)

Ce qui frappe ici est que, en nombre, il y a en tout cas autant de consonnes doublées dans les deux derniers exemples que dans le premier. On peut imaginer que c’est dans l’intensité du doublement (ou dans la durée de la suspension) que se marquait la différence entre la prononciation « dure obscure » du premier et la prononciation « douce et claire » des derniers. On peut aussi penser que, dans ses exemples, Bérard marque toutes les consonnes qui, pour lui, peuvent supporter d’être doublées, le chanteur restant libre de faire son choix parmi elles, et donc d’en retenir un plus grand nombre lorsqu’il veut exprimer une passion violente. Bérard rend d’ailleurs les chanteurs attentifs au fait que, indépendamment de tout affect, l’articulation doit être plus ou moins exagérée en fonction de la distance des auditeurs (et donc, probablement, de la taille et de l’acoustique de la salle) (Footnote: Bérard, L’Art du Chant, p. 92.).

S’agissant des occlusives, il faut aussi se poser la question de la nature exacte de ce « doublement ». Il est hautement probable en effet qu’il ne consiste pas à forcer sur l’explosion des occlusives comme on le ferait dans une langue germanique, en produisant un bruit de « soupape » assimilable, pour toute oreille francophone de l’époque, à une « cacophonie ». Au contraire, le doublement à la française consiste en une anticipation de l’occlusion, introduisant un silence d’une durée plus ou moins grande avant une explosion dont l’intensité reste parfaitement contrôlée et ne produit pas de bruit adventice.

Tout comme Molière caricature Montfleury, l’emphase sera raillée au xviii^e siècle. La carricature que donne, en 1776 et avec quelques années de recul, Fuel de Méricourt de la déclamation du grand comédien Lekain est irrésistible :

….?!!!?::? Qu’ai.-.je … vu ??? …….. Ciel !!!!! où .. sont ::: ces … échaf fff..ffauds ??? …. .

!!!! Cet… app..pareil… de mort.::. , ce.. glai..ve..?!!!:. ces.. bour..reaux…:;.

Ce… peu.ple… qui… m’in.sul.te…!! & .!! que… ma… hhhonte.. att.tire..rre

chaque point est une demi-seconde de silence ; chaque point d’exclamation est un tournoiement d’yeux vers le Ciel : à chaque point d’interrogation on jette ses bras de côté & d’autre & souvent l’on ferme ses poings en se mordant les levres. Quand il y a des points entrelacés de virgules, c’est le Parterre ou les Loges que l’on fixe. (Footnote: Le Fuel de Méricourt, Le Nouveau Spectateur, 1776, cité par Rougemont, La Déclamation tragique.)

Mais avant de se préoccuper d’expression, Bérard cherche aussi à décrire la prononciation de chaque consonne. Brèves et pas toujours très claires, ses descriptions n’ajoutent pas grand-chose à l’apport des grammairiens. On notera toutefois qu’il décrit un h dont l’aspiration est plus que virtuelle :

L’h se prononce en serrant un peu le gosier ; & par une petite secousse de poitrine qui le rend aspiré ; cette lettre est gutturale & douce. (Footnote: Bérard, L’Art du Chant, p. 57-58.)

Quant à l’r, celui de Bérard est indéniablement apical ([r]) et roulé. Il est probable qu’il ne fasse plus la distinction entre r « faible » et r « fort » :

Il faut porter la langue au-dessous des dents supérieures, & pousser l’air du gosier, de sorte que cet air réfléchi par le palais, détermine la langue à une espèce de tremblement, c’est pourquoi l’r doit être appellée dentale & linguale. (Footnote: Bérard, L’Art du Chant, p. 61.)

En pratique

Apparemment, tout est simple : pour la période qui nous intéresse, la prononciation des consonnes n’a guère évolué. Tout au plus faudra-t-il choisir, pour les œuvres antérieures à 1200, entre affriquées et constrictives. Dans quelques cas, on pourra hésiter, pour des textes médiévaux à forte coloration normande ou picarde, quant au rendu des palato-vélaires. H pourra être, ici ou là, aspiré (un peu) et r, systématiquement s’agissant de chant ou de déclamation, sera articulé de la pointe de la langue. Enfin, on marquera le discours de toute l’emphase nécessaire en renforçant certaines consonnes. Rien de bien effrayant au premier abord. C’est de la mise en pratique que naîtront les difficultés : un chanteur ou un orateur, même aguerri, en se mettant à prononcer à l’ancienne, sombrera presque inévitablement dans la caricature. Quoi de plus facile que d’aspirer un h ? Encore faudra-t-il savoir demeurer en retrait des langues germaniques. Est-il difficile de rouler les r ? Guère… Mais, dans la bouche d’un grasseyeur né – ce que presque tout francophone est aujourd’hui – les r apicaux risquent bien d’apparaître ridiculement surroulés : la production d’r « faibles » simplement battus nécessitera un long apprentissage. N’est-il pas amusant de suspendre, ou de faire « gronder » les consonnes ? Certes, mais encore faut-il le faire à bon escient et avec mesure : au détour de chaque vers, le mauvais goût, l’excès, l’enflure maladroite menacent la belle emphase.

Bref, celui qui se satisferait d’avoir appris à articuler, puis à « surarticuler » s’arrêterait au dixième du chemin. Car encore faut-il apprendre à surarticuler avec grâce : c’est cet apprentissage qui représente à lui seul les neuf dixièmes restants. Concilier la diction forte qui sied à l’orateur avec la douceur emblématique du français, avec ce « négligé » plus qu’étudié qui est la marque suprême de l’élégance, voilà bien la rude tâche qui attend les passionnés qui, patiemment, apprivoiseront l’art oratoire du passé.

Footnotes: