
Parmi les consonnes occlusives, il n'y a pas grand-chose à dire des paires bilabiale (b – p) et interdentale (d – t), sinon que rien ne permet de penser que, pour la période qui nous intéresse, elles se soient jamais prononcées autrement qu'en français standard. Il en va de même pour les consonnes nasales (m et n), abstraction faite du cas où elles donnent naissance à une voyelle nasale, pour l, sauf quand, implosif, il se vélarise puis se vocalise (altre > autre), ainsi que pour les fricatives labio-dentales (f, v).
En français « commun », c (k) et g ont conservé leur caractère occlusif devant o et u où ils sonnent [k] et [g]. Devant a, i et e, ils ont suivi un cheminement phonétique complexe et, après palatalisation, se sont transformés en affriquées1 avant de se simplifier en constrictives (chuintantes ou sifflantes). Ainsi, on a [ka]> [tÇa] ou [tÇie] > [Ça] ou [Çie], la graphie ch étant utilisée pour noter le résultat de cette évolution (carbonum > charbon, caram > chiere), [ki] > [tsi] > [si] (ci(vi)tatem > cité), [ke] > [tse] > [se] (cervum > cerf). Pour g on a [ga] > [dJa] > [Ja] (gamba > jambe), traditionnellement noté par i, [ge] > [dJe] > [Je] (genitum > gent). Des occlusives se sont maintenues devant a, i, e dans deux cas distincts : dans les mots dérivant d'un mot latin en qu- (quare > car, qui > ki, quaerere > querre) et dans des mots dérivant d'un mot germanique en w- (guérir, garder, guigner).
De plus, les écrits portent souvent la trace de particularités dialectales. Ainsi, la chanson de Roland (manuscrit d'Oxford) note-t-elle 97 fois Carle(s) ou Carlemagne(s) et 10 fois Karle(s) ou Karlemagne(s) conformément à l'usage dialectal normand, contre seulement 15 fois Charle(s) ou Charlemagne(s) conformément à l'usage « central » ou « commun ». Le normand partage cette caractéristique avec le picard qui, en plus, voit [ki]/[ke] se transformer non pas en [ts] > [s] mais en [tÇ]> [Ç], comme en témoignent les graphies chi, che qui parsèment certains textes d'origine picarde comme les œuvres d'Adam de la Halle2. Le picard a par contre kiere, keval là où le français a chiere, cheval, la voyelle originelle étant ici un a (caram, caballum) et gambe là où le français a jambe.
Le digramme ch est donc utilisé pour marquer le résultat de la palatalisation de k devant a, soit l'affriquée [tÇ]qui se simplifie en [Ç]. Mais il est aussi employé pour transcrire le khi grec, par exemple dans Achille ou Achéron. En français standard, certains de ces ch grecs se prononcent [k], et sont parfois même transcrits par qu, comme dans Andromaque. Cela n'était probablement pas le cas à l'origine où la prononciation canonique de ch ([Ç]) était de rigueur. On trouve par exemple, chez Ronsard, une rime hache : Andromache3 qui est sans équivoque, mais on a déjà Caos (pour chaos) chez Péletier et Sébillet, en donnant un exemple de « rime fratrisée », nous apprend qu'il prononce Charon comme Car on4. On peut postuler que l'usage actuel est dû à une influence italienne.
Dans les textes les plus anciens, cette « consonne » est surtout utilisée pour signaler l'aspiration dans les mots d'origine germanique (honte, haine, etc.). Il n'est pas possible de savoir à quel degré l'aspiration se faisait sentir à telle ou telle période. Il est néanmoins probable que ce degré, significatif à l'origine, diminue avec le temps, jusqu'à atteindre la situation du français standard où il n'y a plus à proprement parler d'aspiration puisque la seule caractéristique qui distingue les mots dont l'h initial est dit aspiré de ceux dont l'initiale est une voyelle ou un h non aspiré est qu'ils n'autorisent ni liaison ni élision. Plus tard, des h, d'origine latine (hom, humble, etc.) ou non (huile, huître) se répandent dans la graphie : ils sont phonétiquement nuls et, en principe, non aspirés. Contrairement à ce qu'indiquent les dictionnaires modernes, l'h d'hélas ne s'est jamais aspiré, en tout cas dans les vers. On trouve, au Moyen Age, la graphie alternative Elas5 et des alexandrins classiques comme Hélas ! // Que cet hélas a de peine à sortir ou Belle Hermione, hélas ! puis-je estre heureux sans vous ?6 le confirment. Lorsque Ma rebelle he bien est versifié en cinq syllabes7, on en conclut que le poète n'aspire pas plus l'h initial de l'interjection Hé !, ce qui ne semble pas être l'avis de tous les grammairiens. D'autres flottements dans l'usage peuvent ici ou là apparaître jusque dans les vers ; dans un air de Guédron, on rencontre Vostre Heros avec h non aspiré8.
Déjà dans les plus anciens textes littéraires, ce digramme apparaît en des lieux où l'on s'attend à rencontrer un l palatal ou mouillé ([L]). On rencontre, par exemple, dans les premiers vers de Saint Brandan, cunseil, voile, doile, orguil, escuil9. Cette graphie sera d'une grande stabilité, même lorsque, tardivement, l palatal se transformera en yod ([j]). A la rime, l palatal reste en général bien distinct de l. Les entorses relevées, notamment par Châtelain10 qui cite par exemple une rime belle : vermeille chez Machaut, restent trop rares pour qu'on puisse les considérer comme autre chose que des licences, probablement rendues possibles par certaines prononciations régionales.
Dès les premiers textes également, la graphie gn figure un n palatal ([ñ]). Selon Lote11, gn s'est toujours prononcé [n] dans les mots savants comme digne. Des rimes comme digne : pelerine chez Marot12 ou divine : digne et origine : digne chez Ronsard13 le confirment. Dans ses vers phonétiques, Peletier, qui note très précisément n palatal, écrit avec n simple tous les mots de la famille de signe (sinal, sine/, sinifere/, sinifie/, insine/, assine, assinee/s, sinee/)14, de digne (dine/, indinite, dine/mant)15et de règne (réne/, réner)16. Il écrit aussi cine/s pour cygnes17. Par ailleurs, l'opposition [n] / [ñ]s'estompe très précocement en finale de mot. Devant e féminin, on notera aussi une tendance discrète à la confusion, révélée par la présence occasionnelle de licences du type semayne : enseigne.
Il ne fait guère de doute que l'r originel du roman ait été un r apical (noté [r] dans sa variante vibrée ou « roulée ») : c'est celui dont ont hérité les langues romanes environnantes ; c'est celui que décrivent, fort précisément, les grammairiens latins, c'est celui, aussi, qu'on entendait, et qu'on entend encore chez les personnes âgées, dans de nombreuses régions périphériques ; c'est celui, enfin, qui s'est perpétué jusqu'au début du XXe siècle dans la diction de certains comédiens, et jusqu'à nos jours dans le chant « académique », celui qu'enseigne le Conservatoire. En opposition, le français standard a choisi un r dorsal (parfois dit « grasseyé » ou « parisien », noté [R] lorsqu'il est vibré), qui ne devrait pas, pour les périodes qui nous intéressent, avoir droit de cité en déclamation. Il faut néanmoins se poser la question de la transition entre ces deux r, ou de leur éventuelle cohabitation, histoire de mesurer la distance séparant le discours soutenu du discours spontané.
La graphie r, en elle-même, ne nous dit rien du point d'articulation, apical ou dorsal. En revanche, il existe un témoignage, aussi imagé qu'inespéré, sur la qualité de certains r français au Moyen Age :
Au contraire, disoit-il que male chose estoit de penre de l'autrui; car li rendres estoit si griez, que, neis au nommer, li rendres escorchoit la gorge par les erres qui y sont, lequiex senefient les ratiaus au diable, qui touz jours tire arière vers li ceus qui l'autrui chatel weulent rendre.18
Cette boutade, attribuée par le chroniqueur Joinville au roi Saint Louis est probablement le premier témoignage existant sur la présence d'r grasseyés en français. Que nous dit le bon roi ? Qu'il est fort mal de prendre le bien d'autrui, car le rendre est alors si pénible que, à sa seule prononciation, ce mot rendre écorche la gorge par les r qu'il contient, symbolisant les râteaux du diable qui tire à lui ceux qui auraient des velléités de rendre un château pris à autrui. On peut donc supposer que, au début du XIIIe siècle, il existait déjà, dans un français qui était peut-être celui de l'Ile-de-France (Saint Louis a été baptisé à Poissy), une tendance à grasseyer certains r. Ce déplacement du point d'articulation serait ainsi bien plus précoce que ne le pense Straka, l'un des rares spécialistes à avoir consacré de longs développements à l'histoire de l'r français, et qui n'ose pas imaginer un grasseyement antérieur au XVIIe siècle19.
Un autre fait bien attesté est l'assibilation de l'r intervocalique en [z], qui frappe notamment les dialectes de l'Ile-de-France et touche par conséquent le parisien vulgaire. Le français en a gardé quelques traces, notamment les mots chaise (dont l's provient de l'r de chaire < cathedram) et besicles (dont l's provient de l'r de bericles), attestés depuis la fin du XIVe siècle, ce qui indique que, dans les dialectes dont il est question, cette assibilation est bien plus ancienne. Fouché20 en trouve la marque dans des toponymes dès le XIIIe siècle. Les traces qu'a laissées ce phénomène en français standard ne sont bien sûr que le sommet de l'iceberg. Les textes satiriques en patois de Saint-Ouen du XVIIe siècle en livrent par contre des centaines : pèze, mèze, cuzé, Pazi, Size, faize etc. pour père, mère, curé, Paris, Sire, faire21.
Cette assibilation révèle en tout cas un fait : son r de départ ne peut être qu'un r apical, dont le lieu d'articulation est voisin de celui du [z]. On voit en effet mal par quel changement simple un r dorsal pourrait devenir un [z]. Comment, sur cette base, essayer de dégager une vision d'ensemble qui concilie le rendre de Saint Louis avec la chaise de Villon ?
« L'r initiale était sans doute prononcée de la gorge ou plutôt avec la luette, tandis que l'r médiale ou finale était prononcée avec la langue » a pressenti Thurot22. Pour rendre compte de tous ces phénomènes, il est bel et bien nécessaire, comme le propose Morin23, de postuler l'existence, en français médiéval, de deux r distincts :
On peut imaginer que, peu avant le XIIIe siècle, r apical soit pour une raison ou pour une autre devenu incompatible avec les habitudes articulatoires dans la région la plus centrale du domaine d'oïl. Pour r « fort », le caractère vibrant se serait conservé, mais au prix d'un déplacement du point d'articulation vers l'arrière. Pour r « faible » et non vibrant, le point d'articulation serait resté antérieur, mais au prix d'une assibilation. En finale, cet r affaibli aurait plus rapidement que l'autre tendu à s'amuïr. Un r apical plus ou moins artificiellement roulé aurait quant à lui pu se maintenir dans le « bon usage », ou au moins le discours soutenu. La généralisation, dans la diction poétique, de cet r « artificiel » qui négligeait la distinction originelle entre r « fort » et r « faible » pourrait expliquer que, dès la fin du XVe siècle, des mots en e ouvert suivi de r « fort » se soient mis à rimer avec des mots en e fermé suivi de r « faible » amuï comme des infinitifs (chauffer : enfer), licence qui a rétrospectivement été nommée « rime normande ».
La graphie w apparaît dans deux situations complétement différentes :
S, qui note à l'origine la sifflante sourde ([s]) a continué à noter la voisée ([z]) en position intervocalique, par exemple dans causa > chose. On situe le changement [s] > [z]vers le IVe siècle24 alors que la lettre z note à l'origine, et jusqu'à sa simplification, l'affriquée [ts]. En position intervocalique, s peut aussi noter l'affriquée [dz] avant sa simplification, comme dans taise, plaise. Dans ce cas, la graphie ne distingue donc pas l'affriquée de la sifflante.
Cette lettre, déjà considérée comme étrangère en latin, ne s'est transmise dans la graphie du français que pour certains noms propres d'origine étrangère. Comme on trouve, dans les plus anciens textes, l'alternance graphique x – ss (on a par exemple Alessis et Alexis dans certains manuscrits de la Vie de Saint Alexis), on conclut raisonnablement que, pour un lettré du XIIe siècle, la valeur phonétique fondamentale de cette lettre était non pas [ks] mais [s]. Il est probable que c'est cette valeur qui prévaut lorsque x se met à être utilisé dans des emprunts savants comme texte25. On imagine donc que de tels x se sont amuïs tout comme les s implosifs. De manière générale, on ne trouve pas, avant le XVIe siècle, d'indices pouvant faire penser que x ait pu représenter un son complexe comme [ks]. Assez précocement, les scribes se servent de la lettre x comme d'un raccourci graphique pour noter la suite -us. Ainsi, au XIIe siècle, on trouve souvent Dex, mortax, biax pour Deus, mortaus, biaus. Au siècle suivant, la consonne x s'installe en finale, mais on oublie de plus en plus la convention initiale, d'où l'apparition de formes comme Deux, mortaux, biaux qui se rapprochent de l'usage qui a finalement prévalu, dans lequel x final joue le rôle de s final dans un certain nombre de mots en -eux ainsi que dans les bijoux, cailloux et choux qu'on fait réciter aux enfants. Il est donc parfaitement évident que, emprunts ou réfection tardifs mis à part (lynx, thorax, Styx, Linux), x final n'est rien d'autre qu'une variante graphique et n'a en aucun cas le son complexe qu'on attribue aujourd'hui à l'x.
Déjà en bas latin, certaines consonnes occlusives ont eu tendance à se palataliser, c'est-à-dire à se « mouiller »26. Le renforcement de l'accent tonique, en favorisant les « vagues » et les « creux » du mode décroissant, a entraîné certains glissements dans les points d'articulation des consonnes : l'occlusion cessant d'être totale, de l'air s'échappe et modifie les caractéristiques phonétiques des consonnes touchées. C'est le début d'une cascade de changements qui sont pour beaucoup dans la distance qui sépare le français du latin et des autres langues romanes, et qui conduisent assez rapidement (en peu de siècles !) à l'installation en roman de consonnes affriquées, c'est-à-dire combinant successivement une articulation occlusive et une articulation constrictive ou fricative ([tÇ], [dJ]).
Pour faire bref – un tableau complet des palatalisations et de leurs conséquences serait hors de propos27 – on se bornera à mentionner quelques exemples-types, pris parmi ceux que se repassent les traités de phonétique historique :
|
Latin |
Prononciation initiale |
Affriquée (avant ~ 1200) |
Constrictive (dès ~ 1200) |
Français |
|---|---|---|---|---|
|
jurare |
[j] |
[dJ] |
[J] |
jurer |
|
fortia |
[tj] |
[ts] |
[s] |
force |
|
rationem |
[tj] |
[dz] |
[z] |
raison |
|
sabium |
[bj] |
[dJ] |
[J] |
sage |
|
cervum |
[k] |
[ts] |
[s] |
cerf |
|
gentem |
[g] |
[dJ] |
[J] |
gent |
|
placere |
[k] |
[dz] |
[z] |
plaisir |
|
castellum |
[k] |
[tÇ] |
[Ç] |
chastel |
|
gamba |
[g] |
[dJ] |
[J] |
jambe |
Ramenée à la pratique du chanteur qui n'aura jamais à aborder les textes les plus anciens, la prise en compte de cette chaîne évolutive se borne à en considérer le dernier maillon en posant la question : affriquée ou constrictive ? En effet, ce changement n'a le plus souvent pas affecté la graphie. Devant le ch de chastel, devant le c de cerf, devant le i consonne de iambe, aucun indice ne permet, dans l'absolu, de trancher entre l'affriquée ([tÇ], [ts] ou [dJ]) et la constrictive ([Ç], [s] ou [J]). Cela n'est qu'en procédant par recoupements qu'on peut espérer en préciser la date. Celle de 1200, donnée en général par les ouvrages de phonétique historique, repose sur les indices suivants :
Parmi les emprunts, ceux de l'anglais sont les plus fréquemment cités. En effet, ils sont d'une part nombreux et, d'autre part, on dispose pour eux d'un terminus post quem précis : la date de la conquête de l'Angleterre par les Normands (1066), avant laquelle il est extrêmement peu probable que des emprunts en série aient pu se produire. En ce qui concerne les affriquées, on peut citer Fitz (dans les patronymes comme Fitzwilliam, qui provient de fiz, le fils), chapel, chief, judge, jury. On peut donc affirmer que, vers la fin du XIe sièlce, les affriquées étaient encore bien présentes en français. On trouve aussi, en mittelhochdeutsch, des emprunts comme tschevalier, tschapel, mütze (< almuce), schanze 28.
Les consonnes finales fournissent aussi des indices utiles. Dans cette position, l'affriquée [ts] traditionnellement notée z. Elle provient notamment29 :
Par opposition, on trouve bien sûr de nombreuses formes avec s final qui, à l'origine, ne riment pas avec les formes en -z. Ainsi, des rimes comme braz : pas, perduz : plus, finiz : six, voiz : lois, si elles se rencontrent, devraient être le signe que, dans la langue du poète, les -z finaux ([-ts]) se sont simplifiés en [-s] et que, dans le même mouvement, toutes les affriquées se sont vraisemblablement aussi simplifiées. Les spéculations des historiens de la langue quant à la date de la simplification des -z finaux reposent en bonne partie sur la pratique de Chrétien de Troyes, actif entre 1160 et 1185 et qu'on considère, du fait que quelques-unes de ses chansons nous sont parvenues, comme le premier des trouvères. D'une manière générale, Chrétien respecte l'opposition -s/-z à la rime alors que, indépendamment de la rime, le fameux scribe Guiot, qui a copié ses romans, se montre fort consistant en la matière. Mais on trouve quelques notables exceptions à cette règle. Pope signale par exemples les rimes bou(t)s (de bouter) : rescos (de rescorre) et puissanz : sanz (mis pour sens, de sensus)30. En cherchant un peu, on trouve aussi, dans Perceval : trez (pour trefs, les tentes) : letrez (litteratus), ou jors (les jours, qui rime assez systématiquement en -z chez Chrétien) : torz (de turris, la tour, clairement en -s)31.
On a donc, à la base, un système dans lequel -s et -z sont séparés à la rime. Chez Chrétien de Troyes, ce système se lézarde un peu puisque font leur apparition quelques rimes -s : -z. Comment interpréter cela ? Il n'est pas interdit de considérer ces exceptions comme de pures licences : bien qu'immergé dans une langue distinguant absolument -s et -z, Chrétien se serait accordé quelques facilités. On remarque toutefois que ces facilités vont dans le sens de l'évolution de la langue. Pourquoi alors ne pas admettre, avec Fouché32 et quelques autres, que les rimes -s : -z de Chrétien traduisent un état de langue où [ts] a commencé à se simplifier en [s] et ou, peut-être, certains locuteurs ont déjà complètement oublié [ts] ?
D'un point de vue modestement qualitatif, l'hypothèse selon laquelle le français de 1160 voyait peu à peu disparaître ses affriquées est plutôt solide. Il faut toutefois observer une grande prudence face aux tentatives plus ambitieuses d'appliquer des méthodes quantitatives (ou statistiques) à l'analyse de telles formes dans les manuscrits littéraires33. Une analyse de la distribution des rimes d'un manuscrit à l'autre pourrait avoir une chance de nous renseigner finement sur l'état de la langue en un lieu et en un instant donné si et seulement s'il pouvait être établi que le seul facteur déterminant l'appréciation des rimes est la langue du poète. Or, il semble bien que, en plus de rimer sur la langue (c'est-à-dire d'utiliser leur perception intime de la langue qu'ils parlent pour décider si une rime est ou non acceptable), les poètes riment sur un modèle, constitué par la connaissance, patiemment assimilée, du système de versification de leurs devanciers, avec ce qu'ils se sont permis et ce qu'ils ont évité. Bien sûr, ce modèle, ou ce système, ne peut être complètement dissocié de la langue du poète, mais il peut s'en écarter. Et surtout, il est susceptible de comporter des contraintes ou des libertés héritées ou non d'états de langue antérieurs.
Plus le poids – ou l'autorité – du système est important, plus il aura tendance à masquer, parfois pour longtemps, des évolutions phonétiques qui touchent la langue. En partant de l'hypothèse que l'« océan » des rimes -s : -s et des rimes -z : -z chez Chrétien de Troyes ne s'explique que par le poids du système, on arriverait à la conclusion que la « goutte d'eau » des quelques rimes -s : -z révèle un état de langue où l'affriquée [ts]s'est à cent pour cent simplifiée en [s]. Quant à estimer, pour un poète donné à un moment déterminé de sa carrière, les poids respectifs du système de versification et de la langue, c'est très certainement, en ce qui concerne le XIIe siècle, une gageure34.
Un peu plus tard, Thibaut de Champagne sépare encore très systématiquement -s et -z à la rime, bien que ses scribes ne soient pas complètement consistants dans leur graphie. Il y a même, chez lui, une suite punais : enfançonès : nez (l'adjectif nets) : mauvès qui, ainsi que le réclame la structure de la strophe, entremêle deux rimes différentes, l'une en -ès, l'autre en -èz. Cela tend à prouver que, quelle que soit la langue qu'il pouvait parler, la distinction historique entre -z et -s existait encore dans son système de versification, ou, autrement dit était encore métriquement pertinente35 pour lui. En revanche, on trouve une rime pris (part. passé de prendre) : farcis (part. passé de farcir) qui est clairement une rime -s : -z 36. Il y a considérablement plus de rimes de ce type chez Gace Brulé : travauz et solaus, mots en -z figurant dans une série de mots rimant en -aus ; beneois et droiz (-z) rimant avec courtoiz, rois et même voirs, savoirs, avoirs (-s) ; une série de rimes mélangeant des mots en -iz comme esbahiz, floris, gueriz, diz avec des mots en -is comme ris, espris, amis37.
Dans les Miracles de Nostre Dame, Gautier de Coinci observe encore, de manière générale, l'opposition -s : -z. Tout comme Thibaut de Champagne, il donne même la preuve qu'elle est encore, pour lui, métriquement pertinente : on trouve en effet, à la rime, la suite poz (pouls) : espoz (épous) : doz (doux) : toz (tous)38. Or, Gautier observe, tout au long des dizaines de milliers de vers que compte la partie narrative de son œuvre, un arrangement en distiques de rimes plates (aa) dans lequel une rime donnée ne se succède pas à elle-même. Dans ce contexte, une suite de quatre -oz consécutifs représenterait une irrégularité si l'on ne s'avisait que poz et epoz riment en s alors que doz et toz riment en z. En dépit de cela, Gautier s'accorde aussi quelques libertés : il fait à plusieurs reprises rimer puis (< puteum, le puits, donc z) avec je puis (s)39. On trouve aussi, plus ponctuellement, vaus (< vales, tu vaux, donc s) : hauz : portaus : consaus (tous trois en z), dois (doigts donc z) : dois (< debes, tu dois, donc s), diex (dieux, donc s) : dielz (de deuil, z), assaus (z) : faus (< falsus, faux donc s), nuiz (< noctem donc z) : anuis (ennui, s) , jors (diurnos, s) : sors (sourd, z) 40.
Chez Rutebeuf, l'opposition -s/-z persiste en gros, mais les exceptions deviennent plus nombreuses et plus variées : solas (-z) : affolas, Satans : tanz (< tantus), blanz : tans (temps), beaux (-s) : ribaux (-z), palais (-z) : mais, sainz (saints) : mains, pès (paix, -z) : jamais, et aussi Jhesucris et Jhesucriz, rimant alternativement en -s et en -z41. Un peu plus tard, et un peu plus au nord, Adam de la Halle mélange complètement -s et -z. Dans ses seules chansons, desquelles la graphie -z est complètement bannie, on trouve des séries entières de rimes qui mélangent des mots qui, traditionnellement, riment en -s et en -z : c'est le cas pour des mots en -is/z, en -ous, en -us, en -ans42. Chez Machaut, le seul examen du cycle de la Loenge des dames permet de se rendre compte que, totalement oubliée par la langue, la distinction -s/-z appartient désormais aussi au passé pour ce qui touche le système de versification43 : elle a perdu toute pertinence métrique.
En récapitulant du point de vue de l'interprète, l'alternative se pose de la manière suivante :
Quoique tendant déjà à se simplifier, les affriquées restent donc historiquement plausibles dans la langue jusque vers 1200, c'est-à-dire pour la première génération des trouvères. Elles le deviennent de moins en moins après cette date, quoiqu'on en trouve encore des traces pour ainsi dire fossilisées durant quelques décennies dans le système de versification.
En publiant, en 1529, son Champfleury, Geoffrey Tory ne prétend probablement pas faire œuvre de grammairien. Cependant, dans sa démarche empreinte d'humanisme, il ne peut appréhender les lettres de l'alphabet, leurs formes et leurs proportions sans placer l'« homme parlant » au centre de son discours. Ainsi, il parsème ses descriptions, censément typographiques, de remarques sur la prononciation, qui montrent qu'il a lu les théoriciens de l'Antiquité et qu'il a une bonne connaissance des langues modernes. Puisant aussi bien chez Priscien que chez Erasme, Tory se distingue par une appréciation très fine des particularités articulatoires des consonnes, essentiellement fondée sur les écrits du grand orateur carthaginois Martianus Capella. Le caractère comparatif de ses descriptions, et le fait qu'elles accordent une part à des prononciations dialectales du français confèrent une valeur unique à son témoignage. Lorsque cela est nécessaire, je complète les descriptions de Tory par celles d'autres grammairiens.
« Nous prononceons [...] le B. de nos lefres sentreouurans de la force de lyssue de nostre alaine ». Le caractère bilabial et occlusif du b ressort bien de cette description. De plus, comme les Gascons confondent b et v et que les Allemands ont tendance à confondre b et p, on en déduit que b est déjà l'occlusive voisée que nous connaissons ([b]), par opposition à p qui n'est pas voisé ([p]). Pour p aussi, c'est, selon Martianus Capella, le souffle qui ouvre les lèvres. Tory remarque aussi que, quelquefois, les anciens aspirent le p « pour vser des dictions grecques qui sescriuent avec Phi » et il étend cet usage au français, pour les mots d'origine hellénique comme Philibert et philosophe, dans lesquels ph vaut pour f 44.
De d, Tory dit que « Les Latins lont figuree droicte par deuant comme vng I. & ronde par derriere comme vng O. pour monstrer quelle veult estre pronuncee en frapant de la langue contre les dents de deuant », et il donne quasiment la même description de t. Les Italiens se distinguent par une articulation forte et nette des d et t finaux en latin, ce qui n'est manifestement pas le cas des français, et encore moins celui des Lyonnais et des Picards, qui tendent à laisser tomber complètement ces consonnes finales en français 45.
« M doibt estre pronuncee en sorte que en la prouferant, & que le lon dicelle est en effect, fault imprimer, cest a dire, serrer les deux leures, lune auec laultre, sans que la langue soit remuee, ne quelle touche aux dents de deuant, ne de quelque couste que ce soit ».
« N veult estre pronuncee de la langue venant toucher contre les dents de dessus, & contre la partie du palais prouchaine aux dictes dents de dessus ».
Le point d'articulation de ces consonnes est donc fort précisément décrit. Leur caractère nasal ressort moins nettement, mais il se déduit de la description de l'm, dont Tory nous dit que le son se fait entendre alors même que les lèvres sont serrées.46
« L. veult estre pronuncee de la langue & du palaix, qui est concauite superieure de la bouche, auec vn doulx esperit de voix ». Les Bourguignons tendent à prononcer r pour l47.
« F. est doulcement proferee de la langue touchant contre le palaix, & que les dents depriment vn peu la lefure de dessus ». Tory veut bien sûr dire « la lèvre de dessous », comme Martianus Capella qu'il cite. Les Allemands ont pour habitude de dire f pour v, ce dont on déduit que l'opposition voisée – non voisée est bien présente en français.
Pour v, la description de Martianus Capella citée par Tory correspond manifestement au [w] du latin classique, ce qui ne l'empêche pas de distinguer la « bonne » prononciation du v consonne français [v] à la fois du v des Allemands ([f]) et du u de l'italien aqua ([w])48.
« Le S. est pronuncee en faisant vng sifflement entre les dents serrees. ». Par ailleurs, cette consonne est « exile » (faible) et « adoulcye » lorsqu'elle se trouve « entre deux vocales ». On trouve donc bien les deux sons [s] et [z] du français49.
De c, Tory dit, citant Martianus Capella, qu'elle « veut estre pronuncee, & exprimee en heurtant des deux costes de la langue contre les grosses dents, quon dit maschelieres ». Il s'agit bien sûr du [k] occlusif, qui est la seule prononciation que connaissent les grammairiens antiques. Il remarque ensuite que les Italiens prononcent le c « mol, & quasi comme si la syllabe ou il est, estoit escripte auec aspiration H » devant e et i, décrivant probablement la chuintante [Ç], variante dialectale de l'affriquée [tÇ]de l'italien standard : Chesar et Chichero seraient donc,en latin, préférables au c « exile » du français ([s]). Les Picards prononcent donc « mieux » les c que le « bon François », puisque, non seulement, ils prononcent ci et ce comme les Italiens ([Ç]), mais qu'ils rejoignent les anciens en prononçant Canoine, Cose, vng Quien ([k]) conformément au latin canonicus, causa, canis là où les Français prononcent « auec aspiration » ([Ç]). Sans prétendre donner raison aux uns ou aux autres, on se bornera à noter que le « bon » français du XVIe siècle ne se distingue pas du français standard du XXIe siècle s'agissant de la distribution de l'occlusive [k], de la sifflante [s] et de la chuintante ([Ç]).
g « veult estre pronunce de nostre voix issant par la concauite superieure de nostre bouche », dit Tory en paraphrasant Martianus Capella. La « concauite superieure » n'étant autre que le palais, cette définition fait bien apparaître le caractère palatal du son [g]. En outre, le caractère voisé ressort de l'observation selon laquelle les gens de Bourges tendent à prononcer c pour g et disent icnem [kn]. Tory distingue le son propre du g [g] de celui de l' i consonne [J] et il observe en particulier que les Picards prononcent le g en lieu de l'i consonne, en disant par exemple gambe pour iambe50.
Dans certains usages, c est susceptible de se prononcer [g], comme c'est encore le cas pour second en français standard. Au nombre des mots concernés, on trouve Claude, siècle, second, secret, enclume51. La rime regret : secret gagne ainsi en richesse.
Le digramme ch, qui transcrit la lettre khi dans les emprunts savants au grec (avec ou non passage par le latin), n'avait, à l'origine, aucune raison de se prononcer autrement que dans les mots indigènes ([Ç]). Dès le XVIe siècle, cependant, on se met ici ou là à le prononcer à l'italienne. Plus tard, Ménage essaiera de domestiquer un usage encore hésitant :
Le cha et le cho des Latins se prononcent toujours parmy nous ca & co. On dit caus, caractére, Caron, Carites, colére, corde, Eco, &c. Et cest pourquoy plusieurs écrivent ses mots sans h, pour empescher qu'on ne dise, à la Françoise, chaos, charactére, &c. ce que je ne desaprouve pas. Nous écrivons demesme Nicomaque & époque, & non pas Nicomache et époche. Pour le che, & le chi, ou le chy, ils se prononcent tantost par ch, & tantost par k. Voicy apeuprês les mots qui se prononcent par ch. Achelois, Achéron, Achille, anarchie, Anchise, Antioche, Archevesque, Archidiacre, Archiduc, Archiprestre, Archiméde, Architecte, cacochyme, Cathéchisme, Chérubin, Chimére, Chio, Chirurgien, (mais il faut dire Cirurgien) chyle, Chymie, Ezéchiel, hiérarchie, Michel, Monarchie, Patriarche, Psyché. Et à ce propos il est à remarquer que les Chartreux prononcent à la Françoise le ch de tous les mots Latins. Voicy apeuprês les François qui se prononcent par k. alchimie, Archéanasse, Archélaüs, Archestratus, Archiépiscopal, Archigenês, chélidoine, Chersonnése, chiragre, chirogrophaire, chiromance, Eschyle, Eschinês, Laschês, Melchisédéc, orchestre, trochée. Il est à remarquer, qu'il faut dire Mikel Ange, & non pas Michel Ange, quoyqu'on prononce Michel. Je remets à un autre lieu à en dire la raison.52
On devine que la raison en question n'est autre que l'origine italienne du nom.
Plus préoccupé par le rôle de l'aspiration dans les langues antiques, Tory est ici peu informatif. Tout au plus remarque-t-il que les Allemands font une « aspiration double » lorsqu'ils lisent le latin, prononçant hheri, hhabui. On en conclut que les Français et les Italiens aspiraient déjà aussi peu qu'aujourd'hui lorsqu'ils disaient homme ou ha (il a)53.On ne trouve pas mention chez Tory de l'h « aspiré » du français.
Il faut, pour en trouver trace, consulter les grammairiens, par exemple Meigret54, qui constate que h donne « vehemence » à une voix, comme dans home (probablement mis pour heaume comme le suggère Thurot, car il élide régulièrement lorsqu'il s'agit d'un être humain : l'home, prud'home55), hallebarde, hallecret, attestant que ces mots d'origine germanique avaient pu conserver un certain degré d'aspiration initiale jusqu'au XVIe siècle. Meigret conserve dans sa graphie un certain nombre d'h dont il a bien de la peine à fournir une justification purement phonétique : theolojíe, characther' (Il écrirait çha- s'il prononçait [Ç]), aothorité, ethimolojíe (sic !), ao jourdhui, Mathieu56. Il reconnaît même que l'aspiration de ces consonnes, le plus souvent transcrite d'un idiome étranger, « ne nous et pas fort neçessere : car le seul t et suffisant a la prononçíaçíon »57 et que « th ne sone non plus en nostre lange, en Mathieu q'en matin »58. S'il appliquait ses principes jusqu'au bout, il s'abstiendrait de toute « reuerenç'a l'antiqité »59 et supprimerait donc ces h de son système graphique.
Les grammairiens anglais sont bien placés pour attester d'une aspiration, comme Palsgrave60 qui donne deux listes de mots avec h aspiré ou non, l'h aspiré conférant un « stronger sounde »61 à la voyelle qu'il précède. Mais il faut tempérer ces témoignages par celui de Théodore de Bèze : il distingue de manière très claire l'h aspiré de l'h « quiescent », relevant que l'aspiration n'a en général pas lieu pour les mots d'origine latine ou grecque. Il atteste que les mots hache, harpe, Henri et Hector, qu'il considère comme gréco-latins, font exception et ont l'h aspiré ; l'origine en fait germanique des trois premiers ne fait aujourd'hui plus de doute. Il note ensuite un certain nombre d'h qui ne sont pas d'origine gréco-latine et qui ne sont pas aspirés : huis, huict, huistre, dont il identifie les étymons (ostium, octo et ostrea), relevant même que la présence de l'h sert à désigner l'u voyelle, et donc à distinguer graphiquement huis de vis dans une graphie qui confond u et v. On retrouve cette explication jusque dans le Petit Robert qui, lui, considère l'h de huit comme aspiré, ce qui n'a à l'évidence pas toujours été vrai (dix-huit). Bèze relève aussi que les composés de hault, qu'il considère comme dérivés de altus, prennent un h aspiré, qu'on explique aujourd'hui, faute de mieux, par une influence germanique62. Il se plaint finalement de l'habitude consistant à ne pas aspirer certains h aspirés, et à dire en ault, l'azard pour en hault, le hazard, qu'il a relevée chez les Bourguignons, les Berrichons, les Lyonnais et les Aquitains et il dresse une longue liste de mots dont l'h initial est aspiré, qui se révèle sans surprise eu égard à l'usage qui a prévalu.
C'est alors qu'il précise que les Français, autant que faire se peut, « adoucissent l'aspiration, afin qu'elle soit parfaitement audible, mais non exhalée de façon rude du fond de la gorge, comme c'est le cas chez les Allemands et des Italiens, particulièrement les Toscans »63. De par ses fonctions à Lausanne, puis à Genève, Bèze était en rapport constant avec des pasteurs bernois germanophones, et était donc bien placé pour mesurer le degré d'aspiration de leurs h. Cette remarque, extrêmement crédible, doit donc inciter à la prudence : il est vraisemblable qu'au XVIe siècle encore l'aspiration ait été plus marquée que la simple disjonction qui est pratiquée aujourd'hui en français standard : du Gardin en témoigne encore lorsqu'il décrit h « Aleman » de hors, haulser, honte etc. comme ayant « vn accent aspre & aspiré, se faisant fort ouir »64. Il est par contre probable qu'elle n'atteignait le plus souvent pas l'intensité qu'elle a conservée dans les langues germaniques comme l'anglais ou l'allemand.
Alors que Palsgrave, seul de son espèce, range hélas parmi les mots dont l'h s'aspire, il est démenti tant par la pratique des poètes que par le témoignage de Bèze et, plus tard, par des autorités aussi solides que Vaugelas65 ou les dictionnaires de l'Academie et de Richelet66. Tant Bèze que ces deux dictionnaires donnent par contre hé ! comme aspiré67, ce que confirme, en 1650, Dobert, pour qui, dans ha !, hé ! et ho ! il faut « antieremant » aspirer, c'est-à-dire ne pas si limiter à la simple disjonction que connaissent les mots d'origine germanique68. Richelet veut que l'h de hola soit aspiré et il reproche à Molière cet alexandrin : « Bon, je resve, hola, dis-je, hola quelqu'un hola »69.
Le mot héros ne figure pas dans la liste des h aspirés de Palsgrave, ni dans celle de Oudin et un poète comme Baïf lie sans remords lez Ér<au>s. Ce n'est qu'avec Vaugelas – lui-même considère la prononciation « irrégulière » de héros comme une contamination par héraut – qu'est consacré l'usage actuel, où héros est aspiré, mais pas héroïne ou héroïque70.
Des graphies comme Hierusalem, Hierosme, hyacinthe, Hierico sont traditionnellement rendues par un « i consonne » ([J]). Du Val le remarque déjà en 1604 : la graphie actuelle s'est adaptée à cet usage. L'usage hésitera en revanche longtemps pour le mot hiérarchie que Buffier, au XVIIIe siècle, prononce encore Jérarchie71.
Tory ne mentionne pas ce son. Il est toutefois largement attesté par les grammairiens comme Meigret, qui imagine en 1542 de marquer d'un « poinct crochu » les l dont la prononciation est « molle » et correspond au double l de l'espagnol llano, pratique qui permettrait d'écrire meleur au lieu de meilleur72. Curieusement, dans sa Grammere de 1550, il change quelque peu son point de vue, puisqu'il écrit orelle, fallions et qu'il précise que ce dernier mot se fait « en amoullissant la seconde l », ce qui confirme qu'il entend bien deux l dont seul le second est mouillé73. On ne trouve nulle part de double l mouillé chez lui, alors qu'il distingue l simple de l double en écrivant, par exemple, voulu et vallu. Il écrit par contre eguylon avec l mouillé non précédé de l74. Peletier, quant à lui, utilise la graphie lh, qui est en fait, comme il le note lui-même, celle des troubadours, pour figurer l'l mouillé. Il écrit eulh pour œil, mais oreilhe/ comme s'il entendait la dipthongue ei avant l'l mouillé. Il note par contre veulhons et balhe/ sans i 75.
Pour la quasi-totalité des grammairiens qui décrivent cette consonne, l'l mouillé apparaît comme un vrai l palatal ([L]) et non tel qu'il est prononcé aujourd'hui, soit comme un simple yod ([j]). Ainsi, Bèze écrit-il que cet l « produit un son mou proche de celui de la syllabe li qui se fondrait dans la voyelle suivante, son noté gl par les Italiens dans figliuolo et ll par les Espagnols dans llamado qui se prononce à peu près comme on dirait liamado en trois syllabes »76 Des signes d'un glissement de l palatal vers yod sont néanmoins perceptibles déjà au XVIIe siècle, par exemple chez Hindret qui, critiquant la prononciation de la « petite Bourgeoisie de Paris », lui reproche de dire batayon, postiyon là où il faudrait « des i accompagnez de deux ll moüillées »77. Peut-être marqué par cet usage parisien, le système phonétique de Vaudelin, publié en 1713, ne connaît ni l ni n « prétenduës mouillées », mais leur substitue la consonne sèche correspondante (l ou n) suivie d'une « diphtongue » i – e féminin. En translittérant le mot soleil, tel qu'il le graphie, en API, on obtiendrait quelque chose comme [sO-lè-lië], qui correspond plus probablement à [sOlèlj], ou peut-être même à [sOlèj] si l'on admet que la consonne, comme le dit Vaudelin à propos de la prononciation des artisans de Paris, devenait naturellement « un peu obscure ». Mais on pourrait tout aussi bien imaginer que, par économie, Vaudelin s'est dispensé de forger des caractères spécifiques et qu'il prononce en fait [sOlèL]78. Quoiqu'il en soit, la prononciation « parisienne » ne devrait guère avoir de répercussion dans le discours soutenu où l palatal s'est probablement maintenu jusqu'au XIXe siècle. Littré, en tous les cas, réclame encore qu'on prononce mouillage « avec ll mouillées et non mou-ya-j' ».
Il existe aussi quelques indices de confusion de l palatal avec l, portant sur des mots comme jaillir, bouillir, taillis, juillet, œillet, gentille 79. Deimier 80, par exemple, critique la rime gentile : coquille, ce qui semble bien traduire son insécurité de méridional.
D'après Tory, « les Italiens prononcent le G. bien mol quant il est entre I. & N. », notamment dans le mot ignem. C'est probablement au n palatal ou mouillé ([ñ]) qu'il fait allusion. En 1542, Meigret décrit bien en effet une « n molle » qui sonne entre g et n et pour laquelle il fait forger en 1550 un caractère qui ressemble plus ou moins à l'n palatal de l'alphabet phonétique international ; il l'utilise par exemple pour line, Espanols81. S'il hésite entre sinificaçíon et significaçíon, il écrit par contre dine, dinité et sinifie82, ce qui correspond à un usage ancestral, en quoi il est rejoint par Peletier qui prononce aussi n non palatal dans cognoetre, signifier, regner et digne et qui, pour le reste, utilise le nh des troubadours pour noter n mouillé83. En 1687, Hindret considère encore que signer, consigner, soubsigner etc. se prononcent « comme s'il n'y avoit qu'vne n »84.
N mouillé présente aussi des signes d'instabilité dans le parler des Parisiens, qui tendent à lui substituer la suite n-yod ([nj]) ou même ni ([ni]). Hindret figure au nombre des grammairiens qui relèvent ce défaut85.
« R, est pronuncee de la langue faisant strideur & son ronflant apertement » écrit Tory, en paraphrasant Martianus Capella qui, bien sûr, décrit l'r apical ou roulé du latin, mais il ajoute que « Quant les chiens se despitent lung contre lautre, auant quilz sentremordent, en renfroignant leur geulle/ & retraignant leurs dents, ilz semblent quilz pronuncent le R ». Ces chiens menaçants, retroussant les babines et serrant les dents, devaient avoir bien de la peine, même au XVIe siècle et dans le Berry, à faire entendre un vrai r roulé ; il est probablement plus adéquat d'identifier le son produit au r « de gorge » dont parle déjà Saint Louis. Tory témoigne aussi du fait que l'assibilation d'r intervocalique était fréquente tant à Bourges, sa ville natale, qu'à Paris où il réside, puisque bon nombre de personnes disent « IERVS MASIA » au lieu de « IESVS, MARIA », pratique qu'il retrouve chez les anciens lorsqu'ils voulaient éviter « la rude apserite » de l'R. Il établit enfin un palmarès d'où il ressort que ce sont les Picards qui, le mieux, prononcent l'r en français.
En résumé, on trouve déjà, dans ces quelques paragraphes imprimés en 1529, une description très imagée de l'r et de ses avatars, d'où il ressort que :
Plusieurs grammairiens du XVIe siècle établissent une nette distinction entre r « faible » et r « fort ». C'est déjà le cas de Meigret en 1550 :
Or qant a la voes de r, je treuue qe le' Francoes la prononcet plus fort ao double, tenant le premier lieu du vocable, q'es aotres lieus: come rire, rare, ce qe non seulement nou'gardons es simples, més aosi e'compozez. tellement qe r seul'en contrerolle son'aotant qe le'deus en courroucé.86
Ainsi, on pourrait avoir, dans rire, r roulé en position initiale et r battu en position intervocalique. Bèze remarque, de manière analogue, que la langue française note r simple pour la prononciation « molle » et rr pour la prononciation « forte », comme dans terre, dont on imagine qu'il ne doit pas être confondu avec taire87. Il fait de plus partie de ceux qui ont noté chez les Parisiens, mais aussi à Auxerre et à Vezelay où il est né, une tendance à assibiler r faible88.
En 1620, Du Gardin décrit de manière particulièrement précise la distinction r « faible » - r « fort » en finale de mot :
I'ay dict ia deux ou trois fois (er doux) D'autant qu'en aucuns mots l'(er) rude, comme en Iupiter, enfer, Luther, Lucifer, ou l'(er) se prononce rudement. Vous diriés que fer en Lucifer, enfer, sonne comme la premiere en ferrum: pareillement la derniere en Iupiter & Luther, sonne comme la premiere en terror. Mais les dernieres en chausser, taster ; & quasi tous autres mots en er sonnent plus doucement, tout ainsi comme la premiere en fero, tero. esquels mots on entr'oit tant seulement vn peu l'(er) qui se ioinct quasi comme à l'o & à l'e en prononçant, de sorte que ter en tero, & ter en taster donnent la mesme resonnance.89
Un peu plus tard, Chifflet (1659) reste dans la même ligne :
L'r simple, a un son fort different de la double, laquelle est beaucoup plus rude. Considerez le en ces mots ; la guerre ne dura guere. Cette difference estant bien entendue, il faut observer que l'r, quoy que seule, sonne comme la double au commencement des mots : comme ; rrare, rrire. Deplus l'r après b, c, d, f, g, p, t, se prononce comme double : brave, crier, drap, froid, grand, prendre, triste &c. Prononcez comme s'il y auoit, brrave, crrier &c. Enfin l'r seule n'a le son de la simple, que quand elle est entre deux voyelle : comme, charité, pour eux, heureux &c. Par tout ailleurs elle a le son de la double.90
Plus tard, alors que certains auteurs, comme Renaud91, tiennent encore à cette distinction, d'autres, comme Lartigaut, excluent r double du champ de la grammaire :
L'-r ne se prononce que d'une maniére. On ne le doit jamês doubler ; si ce n'et à deus ou trois tams des verbes en - rir ; come - je courré, is aquerrêent, nous secourrons, &c, & peutêtre aus mos e'trangers [...] Que s'il y-a des mos, où il sanble que l'on prononce deus - rr ; come - orreur, terrible, &c- souvenez-vous que c'et une pure figure de Re'torique, qui tache d'exprimer tous les mouvemans de l'ame ; afin de toucher pluz sansiblemant les queurs qu'èle veut gagner par les orèlles : mês hor de là, à parler nature'lemant & danz la conversacion ordinêre, il n'et rien de pluz constant que l'on n'an prononce qu'un. 92En 1685, Mourgues critique Boileau pour une rime terre : chaire, mais il reconnaît par ailleurs que « la double r & la simple, ont une même prononciation dans la bouche de ceux qui sçavent parler François, quoy qu'elles en ayent de fort differentes dans quelques Provinces ». Pour Brumoy, qui remanie le traité de Mourgues en 1724, « la double r rend toûjours ouvert l'e qui précede ; au lieu que celui qui précede la simple r est toûjours fermé »93. Il entend donc une différence de timbre là où d'autres notent une opposition de quantité.
A la fin du siècle, Dangeau atteste la disparition d'r « fort » :
Prèmièrement on dit que dans les mots où l'E est suivi de deus R. comme terre, verra, ferrer, si l'on ne met pas deus R. celui qui lira poura se tromper sur la prononciation, & ne prononcera pas l'E. qui prècède l'R. come il le doit prononcer, il ne le prononcera pas come un E. ouvert, & ne le prononcera pas long. Cet inconvenient me paroît considerable, mais j'y remedie aisémant, parequ'en ces ocasions je mets sur ces E. un accent circonflexe ^, qui marque, & qu'il le faut prononcer come un E. ouvert, & qu'il le faut prononcer long, ainsi j'écris, têre, vêra, fêrer. Le double R. sert quelquefois simplemant à alonger la voyèle qui prècède, come dans pourra, mourrai, en ces ocasions je retranche un des R. & pour marquer que la voyèle est longue, j'y mets un accent circonflexe ^, & j'écris poûra, moûrai. 94
Même si la perspective est ici orthographique, le témoignage est intéressant car il révèle que, tout comme l'amuïssement des s implosifs six ou sept siècles plus tôt, l'affaiblissement d'r « fort » a pu, au moins transitoirement, provoquer un allongement de la voyelle précédente.
Si l'assibilation d'r en s est fort bien attestée par de nombreux témoignages concordants95, on constate au contraire que la question du grasseyement est extrêmement peu abordée par les grammairiens. Peut-être Pillot y fait-il allusion : estimant que le son de l'r est à peine supportable pour les oreilles françaises, il constate que les « petites femmes de Paris » assibilent cette consonne en disant peze et meze. Il ajoute : « mais ceux qui veulent parler de manière particulièrement distinguée modèrent sa rudesse de la moitié du son, ou en tout cas l'adoucissent au point qu'on ne l'entende qu'à peine, ce qui cependant n'a d'habitude pas lieu au milieu du mot »96. Il décrit donc une manière d'adoucir les r qui n'est pas une assibilation et qui ne touche pas, probablement, r intervocalique. Est-ce déjà un grasseyement ?
La définition même du terme de grasseyer, reste longtemps assez floue. On le rencontre, et c'est probablement sa première attestation, chez Palsgrave où, sous la forme « Je grassie », il est donné comme traduction de l'anglais « to lyspe », équivalant à to lisp, mot que les dictionnaires modernes traduisent par « zézayer ». Palsgrave donne l'exemple suivant : « Il grassie ung petit, mays cela luy siet bien »97. Indépendamment de sa traduction phonétique exacte, qu'il n'est pas possible de déterminer à ce stade, le grasseyement apparaît déjà, en 1530, comme un défaut, mais un défaut qui peut avoir son charme. En 1611, on retrouve grassier avec le sens de to lispe dans le dictionnaire de Cotgrave. Dans son édition de 1690, le dictionnaire de Furetière précise quelque peu la définition : il s'agit toujours d'un défaut de prononciation, mais consistant à « parler gras, ne pouvoir pas bien prononcer certaines lettres et entre autres l'r ». C'est exactement cette acception qu'on trouve quelques années plus tôt chez Hindret qui recommande de patients exercices correctifs « à ceux qui grassayent & qui ont de la peine à prononcer nos r »98. La première édition du Dictionnaire de l'Académie, datant de 1694, donne : « Grasseier. v. n. Parler gras, prononcer certaines consonnes, & principalement l'R avec difficulté. Cette femme grasseïe agréablement. il luy sied bien de grasseïer. » alors que le Dictionnaire de la langue françoise de Richelet donne « Grasseïer : c'est parler gras (Elle grasseïe un peu, & cela ne lui messied pas) » et « Grasseïement : Maniere de prononcer d'une personne qui grasseïe (Le grasseïement affecté est désagréable. Acad. Fr.) ». On voit que tant l'Académie que Richelet reprennent l'exemple déjà donné par Palsgrave, à la nuance que, dans les deux cas, il est mis au féminin : toujours considéré comme un défaut qui peut être charmant, le grasseyement semble l'apanage des femmes. Apparaît de plus la notion de grasseyement « affecté » qui évoque les précieuses.
Le caractère vague de ces définitions peut étonner, mais il représente une tendance assez générale : les grammairiens du XVIIe siècle fournissent en fait très peu de descriptions phonétiquement précises des consonnes, comme si leur prononciation était trop évidente pour devoir être explicitée. Et même ceux qui, par souci pédagogique, détaillent quelque peu leur articulation, restent le plus souvent muets sur celle de l'r, ainsi Maupas qui écrit, très adéquatement, que « L s'exprime plainement du bout de la langue » et qui se tait du tout au tout s'agissant de l'r99. C'est donc, paradoxalement, ailleurs que chez les grammairiens qu'on trouve les meilleures descriptions :
Et l'R, en portant le bout de la langue jusqu'au haut du palais : de sorte qu'estant frolée par l'air qui sort avec force, elle luy cede, & revient toûjours au mesme endroit, faisant une maniere de tremblement.100
Molière avait-il, comme l'imagine Straka101, une intention particulière en décrivant un r incontestablement apical devant un public de courtisans dont certains s'étaient éventuellement mis à grasseyer ? Je ne le pense pas, pas plus que cette tirade ne nous renseigne sur la prononciation qu'adoptait Molière dans sa vie quotidienne. Indépendamment de toute considération sociale, et de l'usage réel qui pouvait prévaloir à la Ville, dans les faubourgs ou à la Cour, l'r canonique était l'r apical, c'était le seul qu'un maître pouvait enseigner, le seul qu'un acteur pouvait, parodie mise à part, employer sur une scène. On peut imaginer par contre que la maladresse avec laquelle le Bourgeois qui, peut-être, grasseyait dans son parler naïf, s'efforçait de produire un r roulé à la suite du maître était, elle, de nature à déclencher l'hilarité. Comme l'a aussi relevé Straka, le Bourgeois reprend mot pour mot la description de l'r donnée par Géraut de Cordemoy en 1668102, mais le fait que Cordemoy décrive un r apical ne saurait non plus nous apprendre quoi que ce soit sur l'articulation pratiquée par Cordemoy dans son enfance ou dans sa vie domestique d'adulte. L'approche de Cordemoy n'est pas grammaticale mais philosophique (c'est bien le moins s'agissant de celui qui sert de modèle au maître de philosophie); de plus Cordemoy est aussi et d'abord avocat, donc orateur : l'r apical qu'il décrit, sans exprimer le moindre doute métaphysique, n'est peut-être autre que celui du barreau.
Plus authentique apparaît le témoignage de Dobert (1650), lui aussi en marge des grammairiens, qui relève que, parmi les liquides, r est celle qui sonne le mieux toute seule (c'est-à-dire sans l'aide d'une voyelle), « kand on remuë la langue de je ne [sais] kele fason fretillante brizant l'er antre les dans avec activité : vû ke pour lors on ne dit pas son nom ki et er ou erre, mes on exprime son son ki et r ». Et de brocarder ensuite un prédicateur venant de Paris et qui dirait : « Arristote dans sa morrale se rand currieux » etc. ou une Dame qui mignarderait : « Piere s'arete » etc.103 Dans le cas du prédicateur, on croit reconnaître un assibileur (ou un grasseyeur) né qui, parce qu'il parle en public, roule exagérément tous ses r intervocaliques les faisant paraître « forts » ; dans celui de la Dame, on est en face de quelqu'un qui adoucit tous les r « forts », peut-être en les grasseyant.
Le grammairien Dangeau, à la fin du siècle, sera un des seuls à donner d'r (apical) une description phonétiquement évocatrice, lui pour qui les « liquides » (l et r) « se forment en approchant la langue du palais, & faisant couler doucement la vois antre la langue & le palais »104.
En fin de compte, la conviction de Straka selon laquelle la Cour s'était, dans son ensemble et vers la fin du XVIIe siècle, mise à grasseyer semble reposer sur le seul témoignage d'Andry de Boisregard :
Il est bon de faire sonner un peu les R, cela donne de la grace au langage ; mais il ne faut pas se régler sur le peuple de Paris, qui les prononce jusqu'à écorcher les oreilles, mon perre entend-on quelquefois, ma merre, mon frerre ; ce n'est pas ainsi qu'on prononce à la Cour, l'on doit un peu faire entendre l'R, mais il faut que ce soit d'une manière douce, & qui n'ait rien de grossier ny de badaut.105
L'indice est on ne peut plus ténu... Andry, il faut bien l'admettre, ne dit strictement rien de précis quant à l'articulation qu'il prête aux courtisans et aux badauds : il se place exclusivement sur le terrain de la douceur et de la rudesse. A partir de là, on peut tout imaginer : des courtisans qui grasseyent délicatement, ou de manière affectée, opposés à des badauds qui roulent grossièrement, mais aussi des courtisans dont l'r apical est délicat (cela serait le cas s'ils ont conservé l'r apical battu ancestral pour leurs r intervocaliques) opposés à des badauds qui, soit, grasseyent sans vergogne à la manière d'Edith Piaf, soit essaient de corriger l'assibilation de leurs r en roulant de manière maladroite et exagérée.
Pour L. Biedermann106, une phrase d'un traité anonyme de 1669, relevant que les précieuses « à peine prononcent l'r », serait le signe que celles-ci ont passé d'r roulé à r grasseyé. Ne disant rien du lieu d'articulation, ce témoignage n'est pas en lui-même plus déterminant que celui d'Andry. On le rapproche toutefois de celui des dictionnaires qui mettent grasseyement au féminin et attestent qu'il peut être une marque d'affectation.
Dans une comédie de 1670, Le Boulanger de Chalussay figure la prononciation de la précieuse Alphée en substituant l à r :
Mais, de glace, Monsieul, quelle est la Comedie,
Encol qu'il n'en ait fait aucune où l'on de die
Qu'il faut clevel de lile, où l'on puisse tlouuel
Le moindle tlait d'esplit que l'on doiue admilel107
La confusion d'r avec l est un phénomène qui est déjà décrit au XVIe siècle108 et qui n'équivaut pas forcément à un grasseyement. Rien ne dit donc absolument qu'Alphée grasseyait. Dans une autre comédie, cependant, L'Après-soupé des Auberges, due à Raymond Poisson, on a confirmation que cette substitution peut rendre une prononciation affectée, comme celle de cette vicomtesse, qualifiée de « grasseyeuse » par Dangeau109, qui écartèle de manière beaucoup plus marquée la phonétique du français, ce qui fait se « pâmer » la belle Climène :
Me fais-ze entendle au moins, & mon glasseyement
Ne m'oblize-t'il point d'auoil un Tlucement ?
Teltes-vns de mes mots vous essape, ze daze. [...]
Et moy, ze ne voudles zamais ouulil la bouce,
Tomme le pallé gueas est tout à fait salmant ?
Zay toûzoul, touzoul peul de pecel en pallant ;110
On note au passage que le mot « gras » n'est pas rendu par glas mais par gueas, ce qui pourrait évoquer certains accents créoles.
Si l'on admet donc, sur la base d'un faisceau d'indices, que les précieuses s'étaient, vers 1670, mises à grasseyer, cela n'impliquerait pas pour autant que la Cour dans son ensemble leur ait emboîté le pas.
Hors de ce contexte parodique, r grasseyé est probablement resté fort longtemps encore exclu du théâtre, et donc du chant :
Je condamne au silence une Actrice profane,
Qui change en cris aigus les soupirs d'Ariane,
Celle qui ne formant qu'un bruit vague & confus,
Laisse expirer ses tons, avec peine entendus,
Ou qui, les yeux en pleurs, de deüil enveloppée,
Evoque, en grasseyant, les manes de Pompée.111
Ces vers de Dorat montrent en tout cas que, dans les années 1770, le grasseyement faisait encore figure de défaut rédhibitoire sur une scène.
L'r dorsal ou grasseyé est-il, comme l'écrit Straka112, une création de la haute société de la seconde moitié du XVIIe siècle ? Rien n'est moins sûr. Les documents sont rares et peu clairs, ce qui cache peut-être une réalité plus complexe qu'on ne l'imagine. Comparé à celui d'Andry, le témoignage de Saint Louis est d'une précision confondante. Si l'on reçoit celui-là, on pourra donc difficilement rejeter celui-ci. Et si l'on accepte que c'est bien du grasseyement qu'a voulu parler Andry, on doit aussi recevoir le témoignage de Pillot, plus ancien d'un bon siècle. La haute société du XVIIe siècle, qui n'a donc vraisemblablement rien créé, a pu néanmoins sélectionner, à un moment qu'il est difficile de déterminer précisément, la variante grasseyée d'r, déjà présente de manière plus ou moins diffuse dans le parler parisien et, peut-être sous l'impulsion des précieuses, contribuer à ce qu'elle se répande dans les centres urbains.
Sur la base de tous les indices existants, on peut donc, quoique de manière hypothétique, dresser le scénario suivant, qui reprend et précise celui que l'ère des scribes a déjà permis d'ébaucher :
Le grasseyement, quoique tendant a se répandre, est resté très longtemps stigmatisé par les arbitres de la belle prononciation. Même s'il correspond probablement à un combat d'arrière-garde, le témoignage de Lesaint, datant de la fin du XIXe siècle, mérite d'être cité car on le croirait avoir été écrit cent cinquante ans plus tôt :
R. Cette consonne linguale s'entend dans rabais, régiment, rigide, robuste, fer, pur, etc. L'r s'articule assez fortement au commencement : rapidité, – et légèrement dans le corps des mots entre deux voyelles : parole, ou précédée d'une consonne : brosse. Le grasseyement de l'r, défaut très commun aux Parisiens et qui consiste à supprimer plus ou moins cette lettre dans la prononciation, devient insupportable dans le chant. Dans la conversation, lorsqu'il est peu sensible, on lui trouve généralement quelque chose de doux et d'agréable, qui paraît sourtout plus gracieux dans la bouche d'une femme. – La véritable prononciation de l'r est parfaitement indiquée par Molière dans le Bourgeois Gentilhomme.113
« X. vaut en vertus & en pronunciation autant que C. & S. » dit Tory, citant Martianus Capella. C'est un apport de l'humanisme que d'avoir attiré l'attention sur la prononciation antique de l'x. Cette découverte semble avoir eu des effets douloureux. Bèze, lui-même distingué helléniste, constate presque à regret que cette lettre, « par une nécessité qui fait violence à la douceur de la langue française, se prononce comme un double c dans les emprunts étrangers ». Mais il relève que le second x de Xerxes et Artaxerxes ne fait entendre qu'un seul c, comme si l'on écrivait Xerces, Artaxerces : c'était trop demander aux palais français que de leur faire prononcer deux x dans deux syllabes consécutives114. Bèze prononce aussi le double cc dans exercer, exemple, executer, exces, excessif. Aux siècles précédents, cette lettre n'avait que la valeur d'un s ([s] ou [z]) et personne ne s'en plaignait. Les grammairiens vont donc avoir fort à faire pour rétablir le « vrai » son de l'x dans les emprunts : si l'on en juge par l'usage actuel, ils y sont parvenus, en tout cas en partie.
Alors qu'au XVe siècle on prononçait encore ezemple, esperience ou peut-être même eperience, ce dont on trouve quelques souvenirs chez Palsgrave, qui prétend que x ne doit jamais être prononcé en français comme il sonne en latin ou en anglais, mais plutôt comme un s entre deux voyelles115, on trouve une belle unanimité chez les grammairiens du XVIe siècle pour rendre à l'x sa sonorité canonique. On peut penser que le discours soutenu s'est plié à cette nouvelle tendance d'autant plus facilement que les mots concernés étaient savants. L'affaiblissement de [ks] en [gz] est déjà attesté par Meigret qui, par ailleurs, note siste mais sextuple, hésite entre ezemple et exemple, entre ezpedié et expedié mais écrit exçedant, exçepter, exerçiçe et exterieur, extret, excluzif, extraordinere, exactement, maxime116. Henri Estienne, qui défend dans tous les cas la prononciation humaniste([ks]) témoigne de la peine que ses contemporains avaient à se conformer à cette règle lorsqu'ils se laissaient aller à articuler Gsenophon, ezemple ou Alessandre117.
Dans les mots les plus usités, comme excuse, exemple, exquis, extase, texte, sexte, extreme, dextre, expliquer, c'est s qui prédomine jusqu'au XVIIIe siècle au moins dans le bon usage. Rien n'indique qu'il en ait été autrement dans le discours soutenu.
Pour Baïf118, dont le projet vise à construire en français des vers mesurés à l'antique119, les consonnes posent avant tout un problème métrique : s'il conservait la graphie usuelle, un bon nombre de syllabes recevraient le statut de longues par le seul fait qu'elles contiennent, graphiquement parlant, une syllabe implosive120. Ainsi, la première syllabe de fasse, par la simple présence du double s, devrait être comptée comme longue, alors que celle de face pourrait rester brève. Baïf ne peut se satisfaire de cette fiction, et il doit donc épurer la graphie de manière qu'à chaque consonne corresponde un signe graphique et un seul. Son système graphique compte 19 consonnes, qui résultent d'une analyse phonétique cohérente de la langue du XVIe siècle. Par exemple, la consonne [k] est toujours rendue par k (jamais par c ou k), la consonne [J] par j (jamais par g), la consonne [s] par s (jamais par c ou ss). Il existe deux signes particuliers traduisant l et n mouillés ([L], [N]) et v (consonne) est très strictement distinct de u (voyelle). h n'est utilisé que dans les situations de h « aspiré » et il existe un caractère ad hoc (ç dans les imprimés) pour noter [Ç]. Enfin, il n'existe pas de caractère unique équivalant à x. Baïf le transcrira tantôt par ks (ekses, ékspiér, éksersitez), tantôt par sa forme adoucie gz (égzaltant, égz<au>sse), tantôt même par un simple s (ésplikere, éskiz', éspoz') 121.
Mersenne, même s'il est moins rigoureux en termes de graphie, reprend le même système de 19 consonnes que Baïf122. Il écrit aussi :
L'vne des grandes perfections du chant consiste à bien prononcer les paroles, & à les rendre si distinctes, que les auditeurs n'en perdent pas vne seule syllabe ; ce que l'on remarque aux recits de Baillif, qui prononce fort distinctement, & qui fait sonner toutes les syllabes, au lieu que la plus part des autres les étouffent dans la gorge, & les levres, que l'on n'entend quasi rien de ce qu'ils recitent, soit faute de n'ouurir pas assez la bouche, ou de ne remuer pas la langue comme il faut. C'est a quoy les Maistres se doiuent estudier, afin que leurs escoliers leurs facent de l'honneur, & que les Pages & autres enfans qui doiuent chanter deuant le Roy, & dans les Eglises, prononcent aussi bien en chantant, comme s'ils parloient simplement, & que leurs recits ayent mesme effet qu'vne harangue distinctement prononcée.123
Puis, se référant à Caccini, il loue la manière dont les Italiens, qui « animent » leurs récits plus puissamment que ne le font « nos Chantres ». Ces pages sont intéressantes et nouvelles. D'une part, elles placent on ne peut plus clairement le chant dans le domaine de l'art oratoire. D'autre part, et peut-être pour la première fois en France, elles réclament des chanteurs un effort expressif que Mersenne réduit au rendu de trois passions principales : la colère, la joie et la tristesse124. Même s'ils ne touchent pas spécifiquement les consonnes, ces développements annoncent les écrits d'autres théoriciens du chant qui, eux, feront porter sur les consonnes une bonne partie de l'effort expressif exigé des chanteurs.
C'est bien le cas de Bacilly qui, dans le chapitre qu'il consacre au mouvement et à l'expression, et parmi d'autres procédés et ornements destinés à exprimer les affects, mentionne « certaines Prononciations particulières au Chant & à la Declamation », et notamment le fait de « suspendre » ou de faire « gronder » certaines consonnes125. Il sera beaucoup plus explicite quant à ces renforcements expressifs dans les chapitres qu'il consacrera spécifiquement aux consonnes, et qu'il introduit de la manière suivante :
Ie ne parleray point icy de la maniere que se forment les Consones chacune en particulier, puis que ce seroit prendre la chose de trop loin. Ie les distingueray seulement par leurs qualitez, pour ce qui concerne le Chant François ; C'est à dire ie parleray de celles qui ont plus ou moins de force ou de douceur dans le Chant, & qui demandent d'estre plus appuyées, & prononcées auec plus de poids que les autres ; De celles qui sont jointes dans vne mesme syllabe à d'autres Consonnes, que l'on appelle vulgairement liquides, pourueu qu'elles soient apres les Consonnes, & non pas deuant ; Des finales qui se prononcent auec fermeté, & de celles qui se prononcent legerement, ou point du tout ; De celles qui suspendent quelque temps la prononciation de la Voyelle auant que de la faire sonner, de ce que l'on appelle communément gronder ; C'est par ces qualitez, & par ces circonstances que ie les excepte d'auec celles, qui n'ont rien de particulier en elles & qui ne demandent autre obseruation que le soin general qu'il faut auoir de les bien faire entendre, & auoir toûjours dans l'idée qu'à moins d'vn soin & d'vne exactitude fort grande, ceux qui vous écoutent ne distinguent pas assez les paroles que vous leur chantez, lesquelles sont souuent embarrassez par les traits du Chant, & dont les syllabes sont separées & éloignées les vnes des autres par la Note & par la maniere de Chanter qui les y oblige.
En un mot, il faut que celuy qui chante soit toûjours en crainte de ne pas assez articuler les syllabes, & qu'ainsi les Auditeurs ne goustent qu'à demy le plaisir du Chant, & que ce plaisir ne soit troublé par le chagrin de n'entendre pas assez distinctement les Paroles, & pour ainsi dire par le soin de les deuiner.126
Voilà donc le chanteur qui, en plus de faire entendre distinctement les paroles (tout bon professeur l'y enjoindrait), doit établir une balance extrêmement subtile entre la force de son expression et cette douceur, amplement célébrée, qui participe de l'essence de la langue française. Le meilleur orateur, on le devine, est non pas celui qui force le plus le trait, mais celui qui trouve l'équilibre le plus heureux entre douceur et force.
Laissant ce soin aux grammairiens, Bacilly ne détaille pas le mode d'articulation de chaque consonne. Il limite ses préceptes aux consonnes r, l et n.
Il ne dit rien de précis sur le lieu d'articulation de cette consonne (apical ou dorsal) mais, lorsqu'il met en garde sur la prononciation de la suite -rl- du mot parlons, « qui donne de la difficulté à plusieurs pour bien prononcer l'r »127, on comprend bien que c'est l'agilité de la pointe de la langue, et donc la transition de [r] à [l] qui peut présenter des difficultés (surtout chez un Parisien qui grasseyerait dans son parler quotidien). La transition de [R] à [l] ne poserait pas ce problème. De plus, il reste attaché à la distinction traditionnelle entre r « faible » et r « fort » :
Premierement, il faut tenir pour maxime, que toute r, qui est entre deux Voyelles ne se doit prononcer que simplement & sans affectation, & tout au contraire toute r qui n'est point entre deux Voyelles, mais qui suit immediatement vne Consone, ou qui la precede, doit estre prononcée auec plus de force, & comme s'il y en auoit deux, ou mesmes plusieurs, selon que le mot demande plus ou moins d'expression ; de sorte que l'r de mortel se doit prononcer auec poids, là ou celle de mourir (c'est à dire la premiere & non la derniere, dont ie parleray dans le Chapitre des Finales) qui semble demander la mesme expresion, puis que c'est en quelque façon le mesme mot, ne se doit prononcer que fort legerement, parce que celle-là precede une Consone, & celle-cy est entre deux Voyelles.128
[...]
Il faut encore prononcer l'r auec assez de force lors qu'elle est Capitale, ie veux dire qu'elle commence le mot, comme Rien, Respect, Rendons, & toûjours auec la mesme précaution que dans les r qui sont jointes aux autres Consones, c'est à dire plus ou moins, selon que l'expresssion le merite, comme il arriue dans les mots de rigueur, reuolte, & autres qui ont plus de poids (pourueu que le sens ne s'y oppose pas comme j'ay dit) que ceux-cy, reciter, ranger, raison, rappeller, redire, raconter, &c.129
Autrement dit, r « faible », simplement battu et non roulé, ne souffre aucun renforcement affectif. Par contre, r « fort », manifestement roulé, peut être « surroulé » lorsque l'expression le réclame. A ce propos, Bacilly précise on ne peut plus clairement que c'est le sens général de l'énoncé et non le mot pris pour lui-même qu'il faut prendre en compte : dans, « Mon cœur ne sent plus de tourment », ce serait bien sûr une faute de goût que de surrouler l'r de tourment130.
Il insiste surtout sur l'absence de double l en français : les l de cruelle et de belle sont à passer aussi légèrement que celui de celer, l intervocalique ne souffrant donc pas plus qu'r « faible » les renforcements expressifs. Par contre, on ne saurait trop appuyer les l implosifs de malgré, reuolter131.
« De toutes les consonnes, il n'y en a point qui contribuë dauantage à l'agrément du Chant que l'n », s'étonne-t-il. En effet, le caractère nasal qui, d'ordinaire, est tout sauf gracieux, apparaît comme un agrément s'agissant de l'n. Mais cet agrément, qui caractérise avant tout n suivi d'une voyelle, n'en est un que « pourueu qu'on ne l'appuye pas auec fermeté (comme font certains Prouinciaux) & qu'on ne fasse que l'effleurer, comme si on la vouloit cajoler, cette Consone voulant estre traitée auec flatterie & douceur »132. On remarque en particulier que cette consonne, au contraire de certains r et l, ne semble pas particulièrement se prêter aux renforcement expressifs.
Bacilly consacre ensuite un chapitre à « la Suspension des Consones, auant que de faire sonner la Voyelle qui les suit » :
Il y a vne Prononciation qui est tout à fait particuliere au Chant & a la Declamation, qui se fait lors que pour donner plus de force à l'Expression, on appuye de certaines Consones, auant que de former la Voyelle qui les suit ; ce que l'on a bien voulu nommer, gronder.
De toutes les Consones qui se grondent (pour se seruir de ce mot) l'm est la plus considerable, & dans laquelle cette espece de Prononciation paroist dauantage, à cause qu'elle se prononce tout à fait des levres, lesquelles on tient quelque temps assemblées, auant que de faire sonner la Voyelle dans ces mots, mourir, malheureux, miserable, lesquels mots sont tres-frequens dans le Chant François.133
Ici aussi, il précise que c'est le sens général de l'énoncé qui dicte le recours au grondement. Faire gronder l'm de « Ie ne veux mourir, ny changer » serait une insulte au bon goût. Puis il donne quelques exemples de suspensions d'autres consonnes, comme l'f des mot infidele ou enfin, l'n de non, l's de seuere, le j de jamais134.
En somme, si Bacilly connaît, et réclame, pour la déclamation et le chant, un certain nombre de renforcement expressifs, ceux-ci restent assez peu nombreux et ne touchent qu'un nombre restreint de consonnes. Chez lui, l'expressivité, même si elle est revendiquée, reste très précisément contrôlée et strictement limitée par le bon goût. L'emphase selon Bacilly reste strictement codifiée et ne saurait déferler à bride abattue.
On ne pourra probablement jamais tracer, de manière linéaire, une histoire de l'emphase entre le XVIIe et le XVIIIe siècle. Les témoignages sont difficilement comparables les uns aux autres et, quelle que soit la période, l'emphase prête le flanc à la caricature. Ainsi, lorsque Molière se moque des comédiens de l'Hôtel de Bourgogne135, cela ne signifie nullement que l'emphase était alors passée de mode ou en voie de disparition : les mêmes spectateurs qui hurlaient de rire en voyant Molière imiter Montfleury pouvaient s'être pâmés la veille en voyant le même Montfleury en proie aux transes de la tragédie. En aucun cas, Molière, en prônant le « naturel », n'a pu infléchir en profondeur le cours de l'histoire de la déclamation. Vue sous l'angle étroit des renforcements de consonnes, l'emphase connaît même une singulière inflation entre Bacilly et Bérard, soit entre 1668 et 1755.
Pour Bérard, en effet, « on doit doubler les lettres dans tous les endroits marqués au coin de la passion ». Ce principe est mis en application dans des exemples si explicites qu'ils seront repris tels quels par des traités ultérieurs136 (je note en gras les consonnes qui doivent ou peuvent être doublées) :
Plus on connoît l'amour, & plus on le déteste :
Détruisons son pouvoir funeste.
Rompons ses nœuds, déchirons son bandeau,
Brulons ses traits, éteignons son flambeau.137
Dans cet extrait d'Armide, « on ne sçauroit trop s'attacher à doubler fortement les lettres, & à prononcer avec beaucoup de dureté & d'obscurité ». On n'a pas de peine à imaginer que cette profusion extrême de renforcement affectifs aurait été jugée de fort mauvais goût par Bacilly. En particulier, Bacilly s'abstient totalement de préconiser le doublement (ou la suspension) des occlusives (b, c, p, d, t, etc.). Bérard donne deux autres exemples de passages dans lesquels « il faut doubler les lettres foiblement, & ne se permettre qu'une prononciation douce & claire, comme dans cet extrait de Psyché :
J'éprouve comme vous un embarras extrême,
De quelle vive ardeur ne suis-je pas touché ?
Que de choses à dire ? & cependant, Psyché,
Cependant, je ne puis que dire, je vous aime.138
Ou dans ce fragment des Fêtes de l'Hymen :
Ma Bergere fuyoit l'amour,
Mais elle écoutoit ma musette,
Ma bouche discrette
Pour ma flamme parfaite
N'osoit demander du retour :
Ma Bergere auroit craint l'amour,
Mais je fis parler ma musette,
Ses sons plus tendres chaque jour
Lui peignoient mon ardeur secrette,
Si ma bouche étoit muette,
Mes yeux s'expliquoient sans détour,
Ma Bergére écouta l'amour,
Croyant écouter ma musette.139
Ce qui frappe ici est que, en nombre, il y a en tout cas autant de consonnes doublées dans les deux derniers exemples que dans le premier. On peut imaginer que c'est dans l'intensité du doublement (ou dans la durée de la suspension) que se marquait la différence entre la prononciation « dure obscure » du premier et la prononciation « douce et claire » des derniers. On peut aussi penser que, dans ses exemples, Bérard marque toutes les consonnes qui, pour lui, peuvent supporter d'être doublées, le chanteur restant libre de faire son choix parmi elles, et donc d'en retenir un plus grand nombre lorsqu'il veut exprimer une passion violente. Bérard rend d'ailleurs les chanteurs attentifs au fait que, indépendamment de tout affect, l'articulation doit être plus ou moins exagérée en fonction de la distance des auditeurs (et donc, probablement, de la taille et de l'acoustique de la salle)140.
S'agissant des occlusives, il faut aussi se poser la question de la nature exacte de ce « doublement ». Il est hautement probable en effet qu'il ne consiste pas à forcer sur l'explosion des occlusives comme on le ferait dans une langue germanique, en produisant un bruit de « soupape » assimilable, pour toute oreille francophone de l'époque, à une « cacophonie ». Au contraire, le doublement à la française consiste en une anticipation de l'occlusion, introduisant un silence d'une durée plus ou moins grande avant une explosion dont l'intensité reste parfaitement contrôlée et ne produit pas de bruit adventice.
Tout comme Molière caricature Montfleury, l'emphase sera aussi raillée au XVIIIe siècle. La carricature que donne, en 1776 et avec quelques années de recul, Fuel de Méricourt de la déclamation du grand comédien Lekain est irrésistible :
....?!!!?::? Qu'ai.-.je ... vu ??? ........ Ciel !!!!! où .. sont ::: ces ... échaffff..ffauds ??? .... .
!!!! Cet... app..pareil... de mort.::. , ce.. glai..ve..?!!!:. ces.. bour..reaux...:;.
Ce... peu.ple... qui... m'in.sul.te...!! & .!! que... ma... hhhonte.. att.tire..rre
chaque point est une demi-seconde de silence ; chaque point d'exclamation est un tournoiement d'yeux vers le Ciel : à chaque point d'interrogation on jette ses bras de côté & d'autre & souvent l'on ferme ses poings en se mordant les levres. Quand il y a des points entrelacés de virgules, c'est le Parterre ou les Loges que l'on fixe.141
Mais avant de se préoccuper d'expression, Bérard cherche aussi à décrire la prononciation de chaque consonne. Brèves et pas toujours très claires, ses descriptions n'ajoutent pas grand-chose à l'apport des grammairiens. On notera toutefois qu'il décrit un h dont l'aspiration est plus que virtuelle :
L'h se prononce en serrant un peu le gosier ; & par une petite secousse de poitrine qui le rend aspiré ; cette lettre est gutturale & douce.142
Quant à l'r, celui de Bérard est indéniablement apical ([r]) et roulé. Il est probable qu'il ne fasse plus la distinction entre r « faible » et r « fort » :
Il faut porter la langue au-dessous des dents supérieures, & pousser l'air du gosier, de sorte que cet air réfléchi par le palais, détermine la langue à une espèce de tremblement, c'est pourquoi l'r doit être appellée dentale & linguale.143
Apparemment, tout est simple : pour la période qui nous intéresse, la prononciation des consonnes n'a guère évolué. Tout au plus faudra-t-il choisir, pour les œuvres antérieures à 1200, entre affriquées et constrictives. Dans quelques cas, on pourra hésiter, pour des textes médiévaux à forte coloration normande ou picarde, quant au rendu des palato-vélaires. H pourra être, ici ou là, aspiré (un peu) et r, systématiquement s'agissant de chant ou de déclamation, sera articulé de la pointe de la langue. Enfin, on marquera le discours de toute l'emphase nécessaire en renforçant certaines consonnes. Rien de bien effrayant au premier abord. C'est de la mise en pratique que naîtront les difficultés : un chanteur ou un orateur, même aguerri, en se mettant à prononcer à l'ancienne, sombrera presque inévitablement dans la caricature. Quoi de plus facile que d'aspirer un h ? Encore faudra-t-il savoir demeurer en retrait des langues germaniques. Est-il difficile de rouler les r ? Guère... Mais, dans la bouche d'un grasseyeur né – ce que presque tout francophone est aujourd'hui – les r apicaux risquent bien d'apparaître ridiculement surroulés : la production d'r « faibles » simplement battus nécessitera un long apprentissage. N'est-il pas amusant de suspendre, ou de faire « gronder » les consonnes ? Certes, mais encore faut-il le faire à bon escient et avec mesure : au détour de chaque vers, le mauvais goût, l'excès, l'enflure maladroite menacent la belle emphase.
Bref, celui qui se satisferait d'avoir appris à articuler, puis à « surarticuler » s'arrêterait au dixième du chemin. Car encore faut-il apprendre à surarticuler avec grâce : c'est cet apprentissage qui représente à lui seul les neufs dixièmes restants. Concilier la diction forte qui sied à l'orateur avec la douceur emblématique du français, avec ce « négligé » plus qu'étudié qui est la marque suprême de l'élégance, voilà bien la rude tâche qui attend les passionnés qui, patiemment, apprivoiseront l'art oratoire du passé.
| En arrière | Table des matières Masquer le menu latéral | En avant |
|---|---|---|
| Alphabet phonétique Activer l'affichage des caractères API (unicode) |
(Utilisez la touche « retour » de votre navigateur-explorateur-fureteur pour revenir au texte)