Ce digramme, fort répandu dans l’orthographe française sous les formes ai et ay, rappelle une ancienne diphtongue [ai̯]. En général, celle-ci s’est assez précocement simplifiée en e, voyelle avec laquelle ai se confond pour une bonne partie de son histoire.
Qui dit ai dit en général e ouvert ([ɛ]), à quelques exceptions près où il est, selon les arbitres du bon usage, fermé ([e]).
En syllabe accentuée, Gramont prescrit un ai fermé dans les cas suivants (Footnote: Grammont, La Prononciation française, p. 40.) :
Les formes verbales en -ai, comme j’ai, ainsi que les futurs et les passés simples.
Quelques rares formes verbales en -ais ou -ait, comme sais, sait, vais.
gai, gaie, gais.
Il s’agit là du bon usage qui, après bien des hésitations, semblait s’être fixé à la fin du xixe siècle et auquel on devrait, dans l’idéal, pouvoir se référer aujourd’hui encore. La réalité est beaucoup plus flottante : aujourd’hui, un dictionnaire comme le Petit Robert admet, pour gai(e), à la fois [ge] et [gɛ], il prescrit [ke] pour quai, en accord avec Fouché (Footnote: Fouché, Traité de prononciation, p. 50.).
Il semble bien d’autre part que, pour sais, sait et vais, l’influence de la graphie ait plutôt favorisé l’e ouvert. Selon Fouché, je sais n’a conservé l’e fermé qu’à la Comédie-Française, alors que tu sais et il sait se prononcent traditionnellement en e ouvert (Footnote: Fouché, Traité de prononciation, p. 50.). Au passé simple, peu usité, -ai semble se maintenir fermé, tandis qu’au futur, le même digramme tend à se confondre avec le conditionnel en -ais. Mai et vrai sont en revanche plus ou moins stabilisés en [mɛ] et [vrɛ], encore qu’il existe, notamment dans les médias, une tendance à fermer toutes ces voyelles.
En syllabe inaccentuée, ai, plutôt ouvert quoique moins nettement qu’en syllabe accentuée, peut tout comme e se fermer sous l’effet de l’harmonisation vocalique lorsque la voyelle accentuée est elle-même fermée (aider, plaisir prononcés parfois [ede] et [plezir]). Un tel phénomène n’est de loin pas général, et il ne devrait pas se produire dans les formes de discours les plus soutenues. Ai se prononce bien sûr [Ë] dans certaines formes du verbe faire faisons, faisant) ainsi que dans le substantif faisan.
Dans les mots terminés en -ail, ou contenant le groupe -aill-, l’i se rattache non pas à l’a précédent mais il désigne au contraire l’l mouillé traditionnel, devenu yod aujourd’hui.
Les ai du français ne sont pas issus de la diphtongaison spontanée d’une voyelle latine, mais plutôt de la rencontre d’un a étymologique avec un yod provenant lui-même d’une consonne palatalisée. Ainsi, le i de faire provient-il de la palatalisation du c de fac(e)re, qui se transforme en yod avant de se vocaliser en i et de se fondre en une diphtongue (on parle de coalescence) avec l’a précédent (Footnote: Fouché, Phonétique historique, p. 254 et sq. ; Joly, Précis de phonétique historique, p. 198 ; Zink, Phonétique historique, p. 132-3.). Certains mots latins en -aria ainsi que les mots savants en -arium (Footnote: Le suffixe -arium, dans les mots vulgaires, donne en principe -ier (primarium > premier). Fouché, Phonétique historique, p. 411-415.) aboutissent en français au très productif suffixe -aire (paire, contraire, primaire, vulgaire, etc.).
C’est au cours du xie siècle que la diphtongue [ai̯] évolue de manière transitoire ver [ɛi̯] avant de se simplifier, au début du xiie siècle, en [ɛ]. Comme le rappelle Lote (Footnote: Lote, Histoire du vers, III, p. 142.), il faut remonter à des poèmes assonancés pour trouver en fin de vers trace de la prononciation diphtonguée originelle : des mots en -ai- assonant en -a-. C’est le cas notamment dans la très archaïque Passion de Clermont-Ferrand (Footnote: La Passion de Clermont-Ferrand. Voir par exemple aux vv. 89-90, 167-8, 173-4.). Dans d’autres textes, même fort anciens, on trouve déjà des signes de l’évolution [ai̯] > [ɛi̯] > [ɛ]. Ainsi, dans la Vie de Saint-Alexis, le mot lerme figure dans une laisse en a (Footnote: Vie de Saint Alexis, v. 584.), ce qui conduit à deux conclusions :
C’est la graphie lairme ([lai̯rmə]), aboutissement régulier du latin lácrima par le mécanisme décrit ci-dessus, qui serait à sa place dans cette laisse. Le poème a donc été composé pour un état de langue où la diphtongue [ai̯] était encore intacte.
Pour le copiste du manuscrit de référence, la diphtongue [ai̯] s’était déjà simplifiée en e.
Dans le même poème (Footnote: Vie de Saint Alexis,v. 403.), on trouve aussi la graphie paleis, qui évoque l’étape intermédiaire ([ɛi̯]).
La Chanson de Roland traduit bien aussi de telles hésitations. La diptongue ai s’y rencontre en assonance aussi bien avec a (par exemple la laisse xx) qu’avec e1 (par exemple la laisse iv). Dans ce second cas, la graphie ai (repaire) coexiste avec la graphie e (desfere). Pas moyen, donc, de donner à ai une prononciation unifiée…
On trouve encore des signes de la prononciation diphtonguée dans des textes assonancés plus récents, comme le Charroi de Nîmes (Footnote: Charroi de Nîmes, laisses xlii et li.) ou Aucassin et Nicolette (Footnote: Aucassin et Nicolette, laisse iii.). Dans ces deux textes, il existe aussi des signes isolés de simplification : des formes verbales comme het (hait) et set (sait) figurent dans des laisses en e3 (Footnote: Charroi de Nîmes, v. 38 ; Aucassin et Nicolette, laisse xiii. La présence de ces formes dans des laisses en e3 indique une prononciation plutôt fermée alors que ces mots rimeront en e ouvert.). Dans les textes rimés, ai ne se trouve pas associé avec a, mais au contraire dès l’origine avec e, le plus souvent ouvert, avec lequel son histoire se confond désormais.
En finale absolue, et notamment dans les formes verbales, ai va rapidement se mettre à rimer avec le [e] final, entre autres, des participes passés (Footnote: Fouché, Phonétique historique, p. 258-9.). C’est le cas de manière particulièrement nette chez Machaut. Que disent les dictionnaires de rimes du xvie siècle de cette pratique déjà bien établie au moment où ils écrivent ? Curieusement, Tabourot n’autorise pas expressément ce type de rimes. Il n’en consacre pas moins un long développement à la finale ay, qu’il qualifie de diphtongue sans préciser ce qu’il entend par là. La Noue, c’est intéressant, distingue deux catégories de mots terminés en -ay :
dans la première, qu’il appelle diphtongue plus propre, il range les formes verbales du passé simple et du futur ainsi que sçay, geay, gay, lay, balay, delay, may, quay, ray, vray, essay entre autres. La prononciation la « plus naturelle » de cette diphtongue serait [ɛi̯] et serait encore en usage chez certains, mais « la plus part toutesfois changeant l’e en é masculin, & lui baillent vne prononciation si peu differente de celle en é masculin qu’on l’y peut rimer, comme si ce n’estoit q’vne chose mesme ». Autrement dit, l’ay de ces mots, quoique parfois encore diphtongué, peut sans mal se transformer en [e] et rimer, donc, en e fermé.
la seconde, qu’il appelle diphtongue moins propre, comprend les impératifs singuliers de faire, plaire, naistre, paistre, traire et de leurs composés. Pour La Noue, ces formes se terminent en e ouvert ([ɛ]) et l’on devrait s’abstenir de les rimer avec les autres mots en -ay ou, pire, avec ceux en -é.
Une distinction analogue, mais pas complètement superposable, sera reprise en 1648 dans le Dictionnaire de Rimes de Fremont d’Ablancourt, qui distingue un -ay « rude », qu’on se représente comme un e ouvert, peut-être légèrement diphtongué, d’un -ay « qui se prononce comme, E mas. », cette dernière catégorie groupant les mots gay, sçay et les formes du futur et du passé simple, alors que la première comprend des mots comme essay, lay, delay, balay et l’impératif des verbes en -aire.
Pour d’autres développements concernant un digramme ai fondu dans la voyelle e, on consultera le chapitre en question.
Les mots en -age (et, moins souvent, en -ache) apparaissent parfois sous les graphies -aige (et -aiche). Dans le suffixe latin -aticum, par exemple, d’où est issu le suffixe français -age, la présence de la palatale c ne devrait pas suffire, en théorie, à donner naissance à un yod et l’a devrait se maintenir tel quel. On considère donc la graphie ai comme dialectale (Nord, Est et Ouest) (Footnote: Zink, Phonétique historique, p. 237 ; Fouché, Phonétique historique, p. 347.). Si cette graphie atypique est absente, par exemple, de la Chanson de Roland, elle n’en apparaît pas moins dans un certain nombre de textes littéraires, et déjà dans certains textes assonancés comme le Charoi de Nîmes (Footnote: Charroi de Nîmes, v. 1334.). On la trouve aussi chez certains trouvères, comme Thibaut de Champagne, mais de manière isolée (Footnote: Le Chansonnier Cangé, f° 38 v°, note messaige.) et pas à la rime, où -age reste de rigueur. Elle ne devient réellement fréquente qu’au xve siècle où, par exemple, elle est quasiment systématique dans Maistre Pierre Pathelin. Cette farce recèle notamment les rimes corsaige : naige (pour neige), froumaige : l’aurai-je (Footnote: Maistre Pierre Pathelin, vv. 163-4, 443-4.), qui montrent sans équivoque que ces mots riment en e. Le registre de l’œuvre est, il faut le rappeler, popularisant.
Les Traités de seconde rhétorique font aussi une large place à la graphie -aige, et ils associent volontiers les mots en -a(i)ge < -aticum avec des formes comme ai-je ou scay-je (Footnote: Langlois, Recueil d’arts de seconde rhétorique, p. 130, 348.). On peut douter néanmoins, que [ɛʒə] (ou [eʒə]) se soient jamais insinués jusque dans la déclamation la plus soutenue. Quoi qu’il en soit, le xvie siècle marque le déclin des graphies en -aige. Chez Marot, les graphies -aige et -age sont occasionnellement associées à la rime (Footnote: On a, notamment, dans les Œeuvres lyriques, aage : couraige, avantaige : Cartage, aage : saige, aage : personnaige p. 102, 112, 128, 271, 355.), ce qui donne a penser que la première a perdu toute valeur phonétique spécifique. Ronsard ou Peletier me semblent avoir définitivement abandonné la graphie -aige. Quant aux dictionnaires de rimes, celui de Tabourot, qui n’est pourtant pas trop regardant lorsqu’il s’agit de recenser des rimes périlleuses, ignore complètement -aige ; celui de La Noue fait montre de la même ignorance et ne prend donc même pas la peine de mettre l’apprenti poète en garde contre l’emploi de ces formes déjà vieillies.
La fusion de ai et e étant consommée, tant dans la graphie que dans la déclamation, depuis le xiie siècle, on est étonné de constater que, chez les premiers grammairiens, elle ne semble pas si évidente que cela.
En 1531, Dubois décrit une diphtongue a^i, prononcée « non pas comme deux voyelles distinctes, mais en exprimant doucement le son des deux voyelles en une seule syllabe, comme le cri du malade ou de celui qui soudain est blessé » (Footnote: « Non ai diuisas vocales cum poetis Latinis, sed a^i vna syllaba vtriusque vocalis sonum leniter exprimente, pronuntiamus: qualis vox aegrotis & derepente laesis est plurima ». Isagoge, p. 8.). Cette diphtongue a^i est mise partout où le digramme ai figure dans la graphie usuelle : pa^is (pour paix), fa^ire, a^imer, ta^ire, g-è ua^i (pour je vais), g’-ha^i (pour j’ai), a^igre, ma^igre. Quant à sa simplification en e, c’est dans la bouche des Normands que Dubois le Picard la place (Footnote: Isagoge, p. 13.).
Un tel témoignage peut-il être pris au pied de la lettre ? Il est permis, avec Thurot, d’en douter (Footnote: Thurot I, p. 291.). Il est probable en effet que le propos de Dubois soit ici, plus que de décrire l’usage le plus soigné, de justifier la graphie ai, là où elle a persisté comme là où elle a été réintroduite pour des raisons étymologiques, quitte à aller chercher (et à trouver) une diphtongue dans des registres dialectaux et populaires. En tous les cas, il ne fait pas le poids en face de la tradition plusieurs fois centenaire de la rime.
Les choses vont d’ailleurs changer rapidement, trop rapidement sans doute pour qu’on puisse y voir la trace d’un réel changement phonétique, au fur et à mesure que s’affinera la description phonétique du français. En 1542 déjà, Meigret doit bien chercher pour trouver une diphtongue ai :
Voyons premierement doncques celles [les diphtongues] qui commencent par à, & considerons si, ai, se treuue tousiours raysonnablement escrit, de sorte que les deux voyelles soient en la prononciation comme nous les voyons en aymant, aydant, hair. Il n’y a point de doubte qu’en mais, maistre, aise, vous ny trouuerez aucunes nouuelles de la diphtongue ay, mais tant seulement d’ung e que i’appelle ę ouuert, comme ia i’ay dict. (Footnote: Meigret, Traite, f° D iii v°.)
Pour entendre un son diphtongué, il doit puiser dans les cas particuliers. Avant une consonne nasale (aimant), la diphtongue ai a en effet pu persister plus longtemps que devant consonne orale ; dans haïr, il s’agit bien évidemment d’un hiatus et non d’une diphtongue ; quant au verbe aider, plusieurs grammairiens y reconnaissent la survivance d’une diphtongue voire d’un hiatus dans la prononciation familière, souvenir probable de formes médiévales comme aïst. Au siècle suivant, Vaugelas et Hindret reprocheront encore aux Parisiens une prononciation trisyllabique de aider (Footnote: Vaugelas, Remarques, p. 322. Hindret, L’Art de bien prononcer, discours initial. Plus tôt, un poète comme Pierre de Nesson, Les Vigiles des Morts, p. 57, faisait trisyllabique (tu) aides.).
En 1550, le même Meigret ne donne plus que « payant, ayant » et « gajant » (probablement gageant) comme exemples de la diphtongue ai. Dans les deux premiers, on a un yod et dans le dernier un i consonne : plus trace, donc, d’une réelle diphtongue [ai]. Quant à aymer, il l’écrit désormais « ęymer », en précisant que la vieille forme amer, si elle survit dans l’écriture, n’est plus en usage. Pour le reste, il écrit « vrey, j’ey, je direy » (pour vrai, j’ai, je dirai), usant de la « diphtongue ei par e clós » ([ei̯]). Ailleurs, il hésite entre « j’ey » et « j’é » ([eː]) (Footnote: Meigret, Grammère, p. 8 v°, 9r°, 79 v°.). Pour la forme verbale ait, il donne les deux formes « q’il aye, ou ęyt » ([ajə] ou [ɛi̯(t)]) (Footnote: Meigret, Grammère, p. 107.).
Peletier est encore plus restrictif. Les formes verbales en -ay sont régulièrement notées chez lui par e fermé. Il écrit « eyant », « eyons » pour ayant, ayons (Footnote: Peletier, Dialogue, p. 6, 7, 9 etc.), ce qui est a interpréter comme e fermé suivi d’un yod ([e.j]), mais aussi « eidɇ » pour aide, « reisin » pour raisin où, comme le confirme le compte des syllabes dans ses vers, il entend une diphtongue ([ei̯]) et non un hiatus (Footnote: Peletier, Dialogue, p. 9 ; Amour des amours, p. 4, 142.). Dans son Dialogue, il hésite entre « vrei » et « vręi » (c’est-à-dire entre [ei̯] et [ɛi̯]) (Footnote: Peletier, Dialogue, p. 9, 11, 14, 41, 71.). On a, au masculin singulier, « vręi » ([vrɛi̯]), mais « vręɇ » ([vrɛ.ə]) au féminin et, au pluriel, « vręz » ([vrɛz]) dans ses vers phonétiques (Footnote: Peletier, Amour des amours, p. 8, 26.), où l’on trouve aussi « guei » ([gei̯]) pour gai (Footnote: Peletier, Amour des amours, p. 28.). Ces mots en -ai n’apparaissent pas à la rime.
Ramus, dans son coup d’essai de 1562, donne gaiant et paiant comme seuls exemples de la diphtongue ai (Footnote: Ramus, Gramere, p. 27.). Il ne fait donc rien de plus que citer Meigret. En 1572, il reconnaît encore ai comme une « vraye dipthongue », dont les exemples types sont paiant et aidant. Il admet néanmoins que cette diphtongue « s’altère » souvent en e, soit ouvert (férè pour faire), soit fermé (fère pour ferai) (Footnote: Ramus, Grammaire, p. 38-39.). De fait, dans les deux versions successives de sa graphie phonétique, il utilise constamment e (de préférence ouvert en 1572) pour transcrire le digramme ai de l’orthographe usuelle. Il écrit constamment vre ([vre]) pour vray, et rime même ce mot à suivre (pour suivray) (Footnote: Ramus, Grammaire, p. 180-181.). Plus trace de diphtongue donc, même en finale absolue où ai se prononce comme un e fermé. À l’instar de Meigret et Peletier, il prononce [aʒə] tous les mots en -age. Lorsqu’il juxtapose des textes en orthographe usuelle avec leur transcription phonétique, il lui arrive même d’écrire -aige (davantaige, usaige) tanscrit par -aje, ce qui montre que la graphie -aige avait, pour lui, perdu toute valeur phonétique.
Bèze, finalement, ne reconnaît plus la diphtongue ai que dans l’interjection hai (aujourd’hui aïe !). Il confirme du reste la parfaite identité phonétique des pénultièmes de parfaite et prophete, ainsi que de maistre et permettre avec, dans ce dernier cas, une différence de quantité (Footnote: Bèze, De Recta Pronuntiatione, p. 42-43.).
Les grammairiens du xviie siècle, s’ils continuent à se servir du terme pour désigner, par abus de langage, le digramme ai, ne reconnaissent plus, phonétiquement parlant, de réelle dipthongue. Oudin, qui donne généralement une prononciation assez marquée par l’usage parisien, discute les quelques cas où ai, en principe ouvert, prend le son de l’e fermé. En plus du ai final des formes verbales, largement attesté comme fermé, il mentionne aussi, comme exemple de ai fermé, les mots aimer, aider, traisner. Il n’est pas exclu qu’il s’agisse ici d’une des premières attestations du phénomène d’harmonisation vocalique (Footnote: Oudin, Grammaire 1632, p. 32.). Pour Chifflet, ai appartient aux « diphtongues qui se forment d’un seul son » ou même aux diphtongues « fausses et impropres ». Comme avant lui Bèze, ce même Chifflet atteste une différence de quantité entre deux voyelles de même timbre : l’e ouvert bref de mettre et l’e ouvert long de maistre (Footnote: Chifflet, Essay d’une parfaite grammaire, p. 172, 178, 188.). Hindret, lui aussi, considère ai comme une fausse diphtongue (Footnote: Hindret, L’Art de bien prononcer, p. 45.). Mais c’est Dangeau qui règle formellement son compte à la « diphtongue », en traitant ai comme une simple graphie alternative figurant, de manière générale, l’e ouvert et, dans certains cas particuliers comme les formes verbales en -ai, l’e fermé (Footnote: Dangeau, Opuscules, p. 5, 50.).
Lorsque ai est suivi d’une voyelle, l’i fonctionne en général comme semi-consonne (yod). La question se pose donc de savoir si l’a précédent se conserve tel quel ou passe, sous l’effet de l’i, à e, ouvert ou, éventuellement, fermé. Les tergiversations des grammairiens de la Renaissance sont à l’image des hésitations de l’usage de leur temps. Ce n’est qu’au xviie siècle que se dessine peu à peu un consensus qui annonce l’usage moderne.
-aie final. Comme l’écrit Thurot (Footnote: Thurot I, p. 293 et sq.), trois prononciations ont pu coexister pour -aie : [ajə], [ɛjə] et [ɛə]. Au xvie siècle, cette dernière prononciation sans yod est très minoritaire et n’apparaît guère — et encore, pas de manière constante — que chez Peletier. Meigret écrit « aye » ([ajə]) (Footnote: Meigret, Grammère, p. 2, 10 etc.). C’est en revanche [ɛjə] qui a assez tôt la faveur des grammairiens dans leur majorité, et notamment de Ramus et de Bèze, qui s’exprime en détail sur la question. De manière générale, [ajə] fait figure de dialectisme ou d’archaïsme. C’est néanmoins la prononciation que défendront encore Tabourot et, quoique de manière moins nette, La Noue. On peut donc imaginer que l’archaïsme en question se soit conservé plus longtemps en déclamation que dans le discours familier. À partir du xviie siècle, ce sont plutôt [ɛə] et [ɛjə] qui coexistent, les grammairiens dissertant sur la présence d’un yod intercalaire — l’i est-il plus ou moins « redoublé » ? — qui devait donc déjà tendre à disparaître. Chifflet va plus loin, puisqu’il affirme que, dans un mot comme playe, « on traine l’e ouvert » sans redoubler le i (sans, donc, intercaler de yod ni prononcer l’e féminin) : [plɛː] (Footnote: Chifflet, Essay d’une parfaite grammaire, p. 185,6.). Cette dernière prononciation, la plus proche de nous, ne peut bien sûr, à moins d’une licence qui serait signalée par une graphie particulière, avoir cours en poésie.
-aie- à l’intérieur d’un mot. On trouve encore, au xvie siècle, des formes comme vrayement, payement, gayement qui sont trisyllabiques et devaient donc se prononcer [ɛjə] ou, comme l’écrit Ramus, [ɛ.ə] (Footnote: Ramus, Grammaire, p. 57.). Cependant, déjà au xvie siècle, l’usage poétique tend à négliger l’e fémin intérieur en faisant de ces mots des dissyllabes ([vrɛman(t)]).
Dans les autres cas, c’est-à-dire lorsque ai est suivi d’une autre voyelle qu’un e féminin, la présence d’un yod intercalaire n’est guère contestée. Sa présence ne devrait donc pas être remise en cause dans le discours soutenu. Reste à déterminer le timbre de la voyelle précédente : a ou e. Il semble bien que la prononciation traditionnelle soit [aj], peu à peu supplantée par [ɛj] (ou éventuellement [ej]) sous l’influence du parisien vulgaire. Tory, par exemple, attribue cette dernière prononciation aux dames de Paris qui, « en lieu de A pronuncent E bien souuent, quant elles disent. Mon mery est a la porte de Peris, ou il se faict peier. En lieu de dire. Mon mary est a la porte de Paris ou il se faict paier » (Footnote: Tory, Champfleury, f° XXXIII v°.). Meigret, fort peu parisien, prononce en tout les cas ayons, ayez et ayant par a. Peletier cède déjà aux « dames » de Tory en notant eyant et eyons au moyen de l’e fermé qu’il utilise par défaut en syllabe inaccentuée, mais considère encore comme efféminée la prononciation par e de payer (Footnote: Peletier, Dialogue, p. 6, 7, 9, 85.). Ramus, lui, utilise l’e ouvert que, de manière générale, il favorise dans cette situation. Bèze, finalement, réclame [ɛj] pour payer, paiement.
Si la tendance générale, en cette fin de xvie siècle, va dans le sens de la prononciation par e, on trouve néanmoins jusqu’à la fin du siècle suivant des grammairiens, et non des moindres, qui condamnent l’e qu’ils entendent dans la bouche de nombreux locuteurs. C’est notamment le cas de Chifflet et de Hindret (Footnote: Chifflet, Essay d’une parfaite grammaire, p. 189 ; Hindret, L’Art de prononcer parfaitement, p. 143, cité par Thurot I, 299.). Dangeau, quant à lui, regrette encore en 1694 que l’y, « inutile » dans des mots comme ayez et ayant, ait induit « de mauvaises prononciations » ([ɛj]) alors que la graphie aïez aurait permis de maintenir « un a tout simple » dans ces mots (Footnote: Dangeau, Opuscules, p. 34.). Implicitement, il admet donc que, pour ces formes verbales, l’usage commun a fini par l’emporter sur la raison des grammairiens. Il n’empêche que ce même usage est jusqu’à nos jours resté incohérent, puisqu’on prononce encore par a des mots comme païen, aïeul, glaïeul, contre-exemples qui ne devraient pas remettre fondamentalement en cause la règle générale, selon laquelle c’est e qui s’est peu à peu imposé dans cette situation, même si la prononciation archaïque par a a pu être jugée plus élégante jusqu’à l’aube du xviiie siècle.
Pour Sébillet, la diphtongue ai « se diastole en Païs, Thaïs, haïs, naïf » (Footnote: Sébillet, Art poëtique françois, in Goyet, p. 87.). Il dresse ainsi la liste à peu près exhaustive des mots où l’on peut, en poésie, trouver a et i en diérèse (Footnote: Voir aussi Thurot I, p. 500-3.). À la rigueur pourrait-on ajouter le cas particulier de abbaye, tétrasyllabique au Moyen Âge ([aba.i.ə]) et encore trisyllabique aujourd’hui ([abe.i] selon le Petit Robert, mais en concurrence avec [abɛ.i], [abeji] et [abɛji] selon Martinet et Walter).
Dans les formes de haïr avec diérèse (haïr, haï, haïssons), c’est la prononciation par a ([a.i]) qui s’est maintenue. Les autres formes étaient originellement en e (tu hes, il het) et, pour elles, la graphie ai est donc une réfection de la Renaissance.
Pays, paysan, paysage étaient prononcés par a à l’origine, comme l’attestent Meigret et Peletier, quoique ce dernier mentionne peïs comme une prononciation efféminée (Footnote: Meigret, Grammère, p. 64 ; Peletier, Dialogue, p. 85.). Dès le xviie siècle, c’est néanmoins la prononciation par e qui s’impose peu à peu, si l’on en croit Oudin et Chifflet (Footnote: Oudin, Grammaire 1640, p. 40 ; Chifflet, Essay d’une parfaite grammaire, p. 189.).
Enfin, les contemporains du compositeur Guillaume Dufay semblent bien avoir, en tout cas en déclamation, prononcé les deux voyelles finales de son nom en hiatus ([dyfa(j)i]), ce qui ressort de diverses sources en vers dans lesquelles ce nom est trisyllabique, à commencer par la chanson Ce moys de may (Footnote: Dufay, Opera omnia, vol. 6 n° 39.) et par ce passage fameux du Champion des Dames (Footnote: Martin Le Franc, Le Champion des Dames, vv. 16264, 16295.) qui définit ce que les historiens de la musique appellent, aujourd’hui encore, la contenance angloise.
De manière générale, Baïf note les ai de l’orthographe usuelle par è, c’est-à-dire un e de timbre douteux mais souvent ouvert occupant des positions métriques longues : on sait au moins qu’il ne considérait pas ce son comme une diphtongue. En syllabe ouverte et à l’intérieur des mots, il lui arrive d’utiliser é en lieu et place lorsque la métrique impose une brève : on lira donc fére pour faire alors même que, dans d’autres formes de ce verbe, il arrive que è traduise des ai qui, pour nous, ont valeur d’e féminin : fèzant, fèzøs (Footnote: Jean-Antoine de Baïf, Etrénes, f° 4, 12v°, 13, 13v°.). Cas particulier déjà évoqué, les formes éidas, éidant, éidront, éidér (Footnote: Jean-Antoine de Baïf, Etrénes, p. xvi, xvii (ma numérotation des pages de l’introduction) ; 9v°), attestant la prononciation diphtonguée des formes du verbe aider. On ne trouve pas, chez Baïf, de formes en -aige, tous les mots de cette série étant écrits en -aje (Footnote: Jean-Antoine de Baïf, Etrénes, p. xix, xxiv, xxvi, xxix, xxxi etc. (ma numérotation des pages de l’introduction).).
En finale absolue, c’est invariablement è qui s’impose, aussi bien pour les passés simples et futurs (Footnote: Jean-Antoine de Baïf, Etrénes, p. v, vi (ma numérotation des pages de l’introduction).) que pour fai (présent de l’indicatif ou impératif) (Footnote: Jean-Antoine de Baïf, Etrénes, p. iv (ma numérotation des pages de l’introduction) ; f° 14 v°, 15, 16 v°.), j’ai (Footnote: Jean-Antoine de Baïf, Etrénes, p. v (ma numérotation des pages de l’introduction).) ou pour des mots comme vrai, gai (Footnote: Jean-Antoine de Baïf, Etrénes, p. ii, iii, iv (ma numérotation des pages de l’introduction) ; f° 3.). Il n’est pas possible de savoir si Baïf pratique ainsi pour distinguer graphiquement les formes en -ai des participes en -é dont il transcrit la finale par é, où s’il veut marquer une différence de timbre, auquel cas son usage ne recouperait pas celui des rimeurs.
La syllabe féminine des mots en -aie est parfois élidée, comme lorsqu’il écrit vrè^’ pour vraie ou ésè’ pour essaie (Footnote: Jean-Antoine de Baïf, Etrénes, p. iv (ma numérotation des pages de l’introduction).). Ailleurs, on trouve, dans des cas analogues, un yod intercalaire : gèìÎe pour gaie (Footnote: Jean-Antoine de Baïf, Etrénes, p. ix (ma numérotation des pages de l’introduction) ; f° 4v.), et des graphies analogues pour délaie, paye, essaie (Footnote: Jean-Antoine de Baïf, Etrénes, f° 7 v°, 16 v°, 17.). Dans les autres cas où -ai- est suivi d’une voyelle, il hésite entre [aj] et [Ej]. On a, par exemple, a suivi d’un yod ([aj]) dans aiant (ayant) (Footnote: Jean-Antoine de Baïf, Etrénes, p. xi (ma numérotation des pages de l’introduction) ; f° 2 v°, 3, 5 v°.), et aussi dans s’égayant, payant, aïeux, frayeur, rayon, frayés (Footnote: Jean-Antoine de Baïf, Etrénes, p. ix, xv, xxiv, xxvi, xxvii (ma numérotation des pages de l’introduction) ; f° 3, 8.). On trouve, plus rarement, è suivi d’un yod ([Ej]), par exemple dans s’égayait, s’égayant (Footnote: Jean-Antoine de Baïf, Etrénes, p. xvii (ma numérotation des pages de l’introduction) : f° 10.). Cette dernière graphie lui est utile lorsque le mètre exige une longue. Pour les mot naïf, pays comme pour son propre nom, il garde à l’a en hiatus sa prononciation naturelle ([a.i]) (Footnote: Jean-Antoine de Baïf, Etrénes, p. iii, xv, xxiv, xxvi, xxvii, xxxii.).
Mersenne (Footnote: Mersenne, Embellissement, p. 378-9, in Harmonie universelle, vol. 2 du fac-similé.) reconnaît la diphtongue ai « dans ces mots, paier, & raier, dans lesquels ai ne fait qu’vne syllabe ». Ce qu’il décrit n’est donc pas une vraie diphtongue, mais une voyelle (probablement, pour lui, un a) suivie d’un yod ([paje(r)]). Il écrit aussi, et c’est intéressant car cela rejoint la position de La Noue :
Quelques vns ajoûtent la dixiéme [diphtongue] pour la derniere syllabe des futurs, qu’ils composent de l’é aigu, et de l’i, éi, au lieu de notre ai, comme en ces verbes direi, ferei pour dirai, & ferai, mais le seul é aigu suffit pour ces dictions diré, feré, &c.
Ces finales pouvaient donc encore, au premier tiers du xviie siècle, être perçues comme des diphtongues par une oreille musicienne qui leur préférait néanmoins le son de l’e fermé.
Voici ce que dit Bacilly :
Sur les Dyphtongues ai & au, il y a fort peu de remarques à faire, quant à la Prononciation, puis que la premiere n’en a point d’autre que celle de l’e, & la derniere que celle de l’o ; & comme c’est aux Grammairiens à parler de la difference de l’ai lors qu’il est semblable à l’e ouuert, ou masculin, ie ne m’étendray point sur ce sujet pour ne pas sortir des bornes que ie me suis proposé : I’en donneray seulement cet Exemple en passant, sur lequel le Lecteur pourra se regler pour tous les autres, aimer & faire, l’ai de aimer se prononce comme vn e moins ouuert, et celuy de faire, comme vn e fort ouuert : Il faut donc que l’on s’instruise fort exactement de ces differences d’ai, car autrement on prendroit bien souuent l’vn pour l’autre, & cela feroit vn son fort desagreable à l’oreille. (Footnote: Bacilly, Remarques, p. 279-80.)
Faut-il voir, dans cette distinction entre aimer et faire, un signe d’harmonisation vocalique ? Il me semble plus vraisemblable d’y faire concourir deux autres facteurs : le fait que l’ai de faire soit accentué a pu le rendre plus ouvert à l’oreille de Bacilly qui, parmi les premiers, pressent le rôle de l’accent en français. Le fait que celui d’aimer, en plus d’être inaccentué, soit suivi d’une consonne nasale a pu, à lui seul, modifier légèrement son timbre. Quoiqu’il en soit, on retrouve ici le souci de distinguer finement, pour la voyelle e, plusieurs degrés d’aperture.
Il y a encore vne autre Obseruation à faire lors qu’il se rencontre vn y apres l’a, qui est aussi vne affaire des Grammairiens, & dont ie diray ces deux mots en passant, que dans certains endroits l’a se prononce comme un e, en disant peyer pour payer, quoy que dans le mot de ayez cela soit en quelque façon douteux, & qu’il y ait du pour & du contre, quant à l’vsage, & qu’ainsi on puisse en ce rencontre ménager vn milieu entre l’a & l’e. (Footnote: Bacilly, Remarques, p. 280.)
On retrouve ici une hésitation très nettement perceptible chez les grammairiens jusqu’au xviie siècle. Le moins qu’on puisse dire est que Bacilly ne tranche pas…
Brossard se sert du digramme ai pour rendre compte de la prononciation de l’e ouvert italien (Footnote: Brossard, Traité, p. 339.). Quant à Bérard, s’il ne traite pas expressément des diphtongues, vraies ou fausses, il condamne, au côté d’erreurs de diction véritablement énormes, Pêisage, Pêsible et Plêsir, auxquels il préfère Péisage, Pésible et Plésir (Footnote: Bérard, Art du Chant, p. 53.), consacrant par là-même l’entrée de l’harmonisation vocalique dans la théorie du chant. Tous ses contemporains auraient-ils adhéré ? On peut en douter.
Enfin, Raparlier prescrit un é fermé dans Péysage et Pésible (harmonisation vocalique ?), un e demi-ouvert dans Plesir et un è ouvert dans Jamès. Pour lui :
Tous les Verbes qui à l’Indicatif se terminent en ais, se prononcent comme un è ouvert. Il faut en excepter sçais du Verbe sçavoir, qui se prononce : Je scé, é fermé. Tous les Futurs des Verbes ai, se prononcent é fermé. L’Indicatif présent, l’Imparfait, le Conditionnel présent, le Conditionnel passé pour l’auxilliaire avoir, le tout terminé en ois, se prononce comme un e demi-ouvert. (Footnote: Raparlier, Principes, p. 41-2.)
Le cas d’ai suivi d’une consonne orale ne pose guère de problème : c’est, selon une tradition déjà établie au moment où s’expriment les premiers trouvères, le son de l’e ouvert ([ɛ]) qui s’impose dans cette situation. Seule exception notable, le cas des formes du verbe aider, dans lesquels une prononciation diphtonguée ([ɛi̯]) voire en hiatus ([ɛ.i]) a pu subsister jusqu’au xviie siècle.
Lorsqu’ai est final, il tend assez précocement à se confondre, au moins à la rime, avec e fermé ([e]). Toutefois, une prononciation légèrement diphtonguée a pu persister jusqu’au xviie siècle.
Suivi d’un e féminin non élidé, ai donne naissance à un yod intercalaire qui tendra à s’effacer au xviie siècle. Il y a hésitation quant au timbre de la voyelle précédente, l’a originel ([aje]) ayant tendance, dès le xvie siècle, à se fermer en e ([ɛje]). Il est possible que la prononciation la plus archaïque ([ajə]) ait gardé la faveur en déclamation jusqu’au xviie siècle.
Suivi d’une autre voyelle, ai donne également naissance à un yod qui persiste jusqu’à nos jours. De manière assez générale, l’a précédent se ferme en e ouvert. On note toutefois, jusqu’au xviie siècle, une résistance des formes du verbe avoir (ayant, ayez…) qui tendent à conserver l’a. L’a s’est conservé jusqu’à nos jours dans les mots glaïeul et aïeul.
Enfin, a et i peuvent se trouver en hiatus. Dans ce cas, c’est [a(j)i], avec ou sans yod intercalaire, qui se maintien avec, toutefois, dès le xvie siècle, un glissement vers [ɛ(j)i] pour certains mots comme pays ou abbaye.
Footnotes: