Olivier Bettens

« INTONATION JUSTE » À LA RENAISSANCE : IDÉAL OU UTOPIE ?

Esquisse d'un modèle fondé sur la théorie de Zarlino

 

Le modèle présenté ici était prêt, dans ses grandes lignes, en 1992. Dans les années qui ont suivi, plusieurs discussions sur le forum rec.music early, en particulier avec Margo Schulter à propos de l'accord pythagoricien et Pierre Funck au sujet des ajustements de comma, m'ont permis de l'affiner et de mieux l'expliciter. Mais je n'aurais jamais osé rendre public ce qui suit sans la providentielle rencontre, en été 1998, d'Yves Ouvrard et de Jean-Pierre Vidal qui se sont employés avec enthousiasme à développer l'outil logiciel dont je rêvais, mais que je n'aurais jamais été capable de réaliser seul. Qu'ils trouvent ici l'expression de ma gratitude.

 

Introduction



Dans la deuxième partie de ses Istitutioni Harmoniche1, Gioseffo Zarlino livre ce qui constitue l'une des premières descriptions précises d'un tempérament musical2. A l'issue de cet exposé, il consacre un chapitre à l'intonation vocale, déclarant de manière on ne peut plus claire que les chanteurs a cappella tendent à utiliser non pas un tempérament particulier mais les intervalles dans leur « forme vraie »3. Cette affirmation fait de lui le prophète4 de ce que des théoriciens ultérieurs ont appelé « intonation juste »5. Plutôt qu'une démonstration, qu'il n'a guère les moyens de construire, c'est un credo qu'il livre: il pose un idéal6, pas forcément atteint mais néanmoins hautement désirable. Soucieux de s'assurer la caution des anciens, il identifie le système qu'il préconise à l'un de ceux proposés par Ptolémée au deuxième siècle de notre ère. Le nom de ce théoricien de l'Antiquité vient ainsi faire pendant à celui de Pythagore, traditionnellement attaché au seul système en vigueur dans la théorie médiévale.

Alors que, si l'on s'intéresse à l'intonation instrumentale, on peut tirer des renseignements précieux aussi bien des traités techniques que des instruments eux-mêmes ou de tableaux les représentant7, cette profession de foi est, avec la controverse qu'elle a provoquée, notamment entre Zarlino et son ancien élève Vicenzo Galilei8, le seul point de départ dont nous disposions pour aborder l'intonation des chanteurs au XVIe siècle.

L'intonation juste a de tout temps été considérée par certains comme une chimère. Ils y voient, peut-être à raison, un caprice de mathématicien sans réel contenu musical. Il n'en demeure pas moins que cette « illusion » a longtemps fait l'objet d'une quête que Haynes n'hésite pas à comparer à celle du Graal9. S'il est un point de l'espace-temps où cette quête avait quelque chance d'aboutir, il se situe à coup sûr dans l'une ou l'autre des cappelle et camerate de très haut niveau qui fleurissent dans l'Italie du XVIe siècle, ce microcosme qui voit « tous les praticiens, mus par l'autorité de Zarlino »10, rechercher assidûment la meilleure intonation possible. C'est à cette époque plus qu'à n'importe quelle autre que l'intonation juste a pu faire l'objet d'une pratique plus ou moins consciente et raisonnée.

Seulement, une telle affirmation gagnerait en consistance si l'intonation juste était autre chose qu'une idée vague. Sa mise en pratique implique en effet des choix qui peuvent conduire à des résultats fort divers. C'est en vain qu'on cherche, dans la littérature ancienne ou moderne, un mode d'emploi permettant de l'appliquer à des exemples musicaux concrets. Ce que nous tentons de décrire n'est certainement pas une marche à suivre rigide, c'est avant tout un modèle de référence, dont nous souhaitons, mais ce n'est pas l'essentiel, qu'il puisse avoir aujourd'hui une utilité pratique. Si des chanteurs de la Renaissance ont pratiqué une forme d'intonation juste, quelles ont pu être leurs stratégies, explicites ou implicites, conscientes ou inconscientes pour s'approcher de cet idéal ? Voilà la principale question que nous nous poserons. Nous serons alors amené à nous en poser une autre, plus brûlante à une époque où de nombreux ensembles vocaux se consacrent à la polyphonie de la Renaissance : de quelle manière des chanteurs d'aujourd'hui qui auraient adopté l'idéal de Zarlino peuvent-ils procéder pour l'atteindre ? Nous postulons que ces deux questions ont la même réponse ou, tout au moins, que la réponse à la seconde ne peut faire l'économie d'une réflexion en profondeur à propos de la première.

 

Chapitre premier : de Helmholtz à Barbour

Helmholtz et la « gamme naturelle »

Un peu oubliée auparavant, l'intonation juste fut remise au goût du jour par le naturalisme de l'époque romantique, et notamment par le grand physicien Helmholtz qui fit accorder un « harmonium juste » pour mener ses expériences. Tout en prônant un usage universel de sa « gamme naturelle » par les chanteurs et les violonistes de son temps, il la juge particulièrement appropriée à la musique de la Renaissance :

Les particularités de la gamme naturelle se manifestent surtout dans l'ancienne musique italienne de Palestrina, Vittoria, Gabrieli et leurs contemporains. Ces oeuvres réclament les consonnances les plus justes parce qu'elles n'obtiennent les nuances les plus délicates de l'harmonie que par les renversements des accords, l'alternance des accords majeurs et mineurs, et un petit nombre de dissonances formées par des retards. Exécutées dans la gamme tempérée, elles perdent tout sens et toute expression, tandis que, grâce à l'emploi de la gamme naturelle, elles produisent souvent sur l'harmonium un bon effet.11

Il reconnaît aussi que les chanteurs qu'il a entendus sont pour la plupart incapables de chanter « de manière à donner à l'auditeur ce bien-être complet qui résulte d'une parfaite harmonie », ce qu'il attribue à l'influence néfaste des pianos accordés au tempérament égal avec lesquels ils s'exercent. Les choses étaient bien différentes par le passé :

Jusqu'au dix-septième siècle, les chanteurs étaient enseignés au moyen du monochorde pour lequel Zarlino, au milieu du du seizième siècle, avait retrouvé la vraie gamme naturelle.12

Mais quelle est donc cette « vraie gamme naturelle » dont Zarlino doit, bien malgré lui, assumer la paternité ? Sans entrer dans le détail de la discussion de Helmholtz, qui s'appuie notamment sur une nomenclature modale très personnelle, on l'identifiera à ce qu'il appelle « gamme majeure » et qu'il décrit par les rapports de fréquences suivants13 :

      ut1 - ré  - mi  - fa1 - sol - la  - si   - ut2
      1   - 9/8 - 5/4 - 4/3 - 3/2 - 5/3 - 15/8 - 2

C'est cette gamme qui, reprise à l'infini dans des dizaines d'ouvrages théoriques plus ou moins récents, sous des noms divers comme gamme de Zarlino, gamme naturelle ou gamme des physiciens, a fondé un certain nombre de jugements définitifs tant sur l'intonation juste que sur Zarlino lui-même. Que faut-il en penser ? Avant tout qu'il s'agit d'un anachronisme grossier : quoi que puisse laisser penser l'examen superficiel d'une figure (Figure 1.1) apparaissant dans son traité, Zarlino n'a pu en aucune manière « retrouver la gamme naturelle », pour la simple et bonne raison que la notion de gamme et celle, corollaire, de tonalité, n'existaient pas à la Renaissance. Que cela ne nous empêche pas, cependant, de poursuivre encore un peu l'examen de ce que nous appellerons désormais gamme de Helmholtz, afin de rappeler quelques notions élémentaires sur le calcul des intervalles musicaux.

Tous les degrés de cette gamme sont, avec sa tonique ut, dans un rapport de fréquences simple, correspondant à ce qu'on appelle des intervalles « purs »14 : ut1-ut2 forment une octave de rapport 2, ut1-sol une quinte de rapport 3/2, ut1-fa une quarte de rapport 4/3, ut1-mi une tierce majeure de rapport 5/4, ut1-ré un ton de 9/8 la-ut2 une tierce mineure de rapport 6/5, si-ut2 un demi-ton (diatonique) de rapport 16/15.

Les difficultés apparaissent dès lors qu'on calcule les intervalles qui figurent entre les degrés intermédiaires, et notamment les secondes, les quintes et les tierces. Tout d'abord, les secondes ré-mi et sol-la sont de rapport 10/9 et conduisent à la définition d'un ton mineur qui oblige à rebaptiser ton majeur le ton traditionnel ou pythagoricien de 9/8. Cette distinction entre un ton mineur et un ton majeur est absente des principaux systèmes d'intonation qui ont historiquement prévalu dans la musique pour clavier (accord pythagoricien, tempéraments mésotonique ou égal...) et, de plus, les règles du contrepoint et, plus tard, de l'harmonie, ne l'ont jamais prise en compte. Ensuite, avec la quinte ré-la apparaît le rapport de 40/27, intervalle que rejetterait, en simultanéité, la moins délicate des oreilles : en comparaison avec la quinte de 3/2, elle est trop petite d'un micro-intervalle qu'on calcule à 81/80 et qu'on appelle comma syntonique (ci après comma tout court). Enfin, la tierce mineure ré-fa est d'un rapport de 32/27, ce qui en fait une tierce mineure pythagoricienne. On notera que c'est aussi le comma qui fait la différence entre le ton majeur et le ton mineur, ainsi qu'entre les tierces pythagoriciennes et les tierces pures.

Afin de pallier ces intervalles irréguliers, dus à l'irruption d'un inévitable grain de sable nommé comma, Helmholtz introduit dans sa gamme un second ré, d'un comma plus grave que le premier15, et qui permet de restituer dans leurs rapports « naturels » la quinte ré-la et la tierce mineure ré-fa. Avec cette note dédoublée, il devient possible de construire, sur la gamme de Helmholtz, les accords parfaits qui permettent d'en dégager une tonalité. Mais il est alors légitime de se demander si une gamme qui présente un degré optionnel est encore une gamme, et comment elle pourra fonctionner comme repère diatonique, du moment qu'un de ses degrés n'est pas déterminé : par quelle variante du ré passer lorsqu'on monte d'ut à mi ? On se demande aussi comment sortir de l'étroit domaine de la « pureté tonale » absolue, car la moindre « modulation » fera intervenir d'autres gammes de Helmholtz, tout aussi indéterminées. Comment le chanteur s'y retrouvera-t-il ? Et, en admettant même qu'il s'y retrouve, comment imaginer qu'il puisse, sur la base de prémisses si anachroniques, s'approcher un tant soit peu des schémas de pensée qui prévalaient à la Renaissance ? C'est dans cette impasse que nous abandonnerons la « gamme naturelle ».

Le labyrinthe de Barbour

Le système diatonique pythagoricien, tel que décrit par Boèce et la théorie médiévale, est déjà une forme d'intonation juste. Il est en effet bâti exclusivement sur des proportions simples, faisant intervenir les facteurs 2 et 3 : tous les intervalles qu'il comporte sont « non tempérés » et peuvent être réduits à des combinaisons d'octaves (de rapport 2) et de quintes (de rapport 3/2). Repris par ceux qui accordaient les instruments à clavier, il a été arbitrairement limité, à un cycle de douze quintes, la dernière d'entre elles, le fameux loup, trop petite d'un comma dit pythagoricien, traduisant l'incommensurabilité mathématique des puissances de 2 et de celles de 3 ou, ce qui revient au même, l'impossibilité de faire coïncider un nombre donné de quintes avec un nombre donné d'octaves. En réalité, et si l'on refuse tout compromis, une série de quintes pures se présente, abstraction faite des octaves, non comme un cercle mais comme une spirale doublement infinie. C'est cette spirale qui constitue le « noyau » de tout système d'intonation juste. Sous forme déroulée, elle prend l'aspect suivant16 :

...Ebb-Bbb-Fb-Cb-Gb-Db-Ab-Eb-Bb-F-C-G-D-A-E-B-F#-C#-G#-D#-A#-E#-B#-F##-C##-G##-D##-A##...

La principale limitation de ce système est qu'il ne permet pas de générer des tierces pures, majeures (5/4) ou mineures (6/5), mais seulement des tierces pythagoriciennes de 81/64 et de 32/27. La tierce majeure pythagoricienne est, rappelons-le, plus grande d'un comma (syntonique) que la tierce majeure pure, la tierce mineure pythagoricienne est plus petite d'un comma que son homologue pure. L'astuce, exposée notamment par Barbour17, consiste à ajouter, parallèlement à cette série nucléaire de quintes pures, une seconde série décalée d'un comma vers le grave, qui permet de générer des tierces majeures pures à partir de chacune des notes de la première série. Ce qui donne, sur un tronçon limité :

série "-1"    : ...    D-1   A-1   E-1   B-1  F#-1  C#-1  G#-1  D#-1    ... 
                                  /   \ 
série de base : ... Bb --- F --- C --- G --- D --- A --- E --- B --- F# ... 

En partant d'une note quelconque de la série de base (par exemple C) et en montant en oblique vers la droite, on obtient la tierce majeure pure (E-1 se trouve un comma en dessous du E de la série de base). En redescendant, toujours en oblique vers la droite, on retombe sur la quinte de la note de départ (G), ce qui complète l'accord parfait majeur. Plus généralement, après avoir ajouté une série de quintes, on a accès, à partir de chacune des notes de la série de base, à la tierce majeure vers l'aigu et à la tierce mineure vers le grave.

Mais tous les problèmes ne sont pas pour autant résolus. Afin de pouvoir générer, à partir de chacune des notes de la série de base, des tierces majeures vers le grave et des tierces mineures vers l'aigu, il faut maintenant ajouter au système une série de quintes décalée d'un comma vers l'aigu :

série "-1"    : ...    D-1   A-1   E-1   B-1  F#-1  C#-1  G#-1  D#-1    ... 
                                  /   \ 
série de base : ... Bb --- F --- C --- G --- D --- A --- E --- B --- F# ... 
                                  \   / 
série "+1"    : ...   Db+1  Ab+1  Eb+1  Bb+1   F+1   C+1   G+1   D+1    ... 

En descendant en oblique vers la droite, et en remontant symétriquement, il est possible d'obtenir n'importe quel accord parfait mineur. La combinaison de ces trois séries de quintes permet donc de générer, à partir de chacune des notes de la série de base, un accord parfait majeur et un accord parfait mineur. Cela peut sembler satisfaisant, mais que se passe-t-il lorsque, à partir d'une note de l'une des séries ajoutées, on désire générer une nouvelle tierce pure ? On doit avoir recours à une série de quintes supplémentaires, décalée d'un comma par rapport à la précédente, et ainsi de suite à l'infini vers le haut comme vers le bas :

... 
série "-3"    : ...         A#-3  E#-3  B#-3 F##-3 C##-3 G##-3          ... 
  
série "-2"    : ...      F#-2  C#-2  G#-2  D#-2  A#-2  E#-2  B#-2       ... 
  
série "-1"    : ...    D-1   A-1   E-1   B-1  F#-1  C#-1  G#-1  D#-1    ... 
                                  /   \ 
série de base : ... Bb --- F --- C --- G --- D --- A --- E --- B --- F# ... 
                                  \   / 
série "+1"    : ...   Db+1  Ab+1  Eb+1  Bb+1   F+1   C+1   G+1   D+1    ... 
  
série "+2"    : ...      Fb+2  Cb+2  Gb+2  Db+2  Ab+2  Eb+2  Bb+2       ... 
  
série "+3"    : ...        Abb+3 Ebb+3 Bbb+3  Fb+3  Cb+3  Gb+3          ... 
... 

Voilà donc enfin un « système complet de génération d'accords purs », pour reprendre l'expression d'Asselin18. Ce réseau représente toutes les fréquences qu'il est possible d'atteindre en procédant par combinaisons de quintes et de tierces pures, au départ d'un point unique (par exemple A440). Il est impressionnant parce qu'il est quatre fois illimité : chaque série de quintes est deux fois illimitée, vers la gauche et vers la droite, et il est possible d'ajouter une double infinité de séries de quintes, au-dessus et au-dessous de la série de base. Si l'on se souvient, de plus, qu'il avait été fait, au départ, abstraction des octaves, on peut maintenant, parallèlement au plan de la feuille (ou de l'écran), superposer à ce réseau bidimensionnel déjà fort complexe des copies conformes de lui-même, transposées d'une ou plusieurs octaves, et cela à l'infini vers l'aigu comme vers le grave, pour obtenir toutes les fréquences atteignables en théorie (la théorie ne s'arrête pas avec les limites de la phonation et de l'audition humaines !) en combinant des octaves, des quintes et des tierces pures. On comprend qu'une telle structure ait pu donner le vertige à certains auteurs, comme à D. Devie, qui n'en livre pas moins une description très imagée :

On peut imaginer un immense labyrinthe sous la forme d'une construction faite d'une série d'étages comportant, à chaque niveau, un couloir en forme de spirale qui se déroulerait à l'infini en cercles concentriques vers la périphérie. Tous les 5 mètres, on trouverait un escalier montant à l'étage supérieur ou descendant à l'étage inférieur, représentant les tierces pures. Qu'on se représente le moindre accord parfait à l'intérieur de ce dédale et l'on aura une idée du caractère aberrant du système en question.19

Le vertige provient avant tout de l'incroyable surabondance de fréquences que recrute un tel labyrinthe, et à l'impossibilité de concevoir un clavier qui les prenne toutes en compte : les tentatives en ce sens ont conduit à quelques curiosités de la facture instrumentale qui n'ont jamais dépassé le stade du prototype20.

Le mythe de la dérive du diapason

C'est un vertige d'un autre ordre qui prend le chanteur s'il tente de s'engager dans le labyrinthe de Barbour. Sa voix, extrêmement flexible, n'est en effet pas soumise à la principale faiblesse des claviers : un nombre limité de touches par octave. S'il perd néanmoins pied, c'est avant tout parce qu'il ne sait quel chemin prendre pour passer d'une note à l'autre. En d'autres termes, le labyrinthe de Barbour, qui ne procède que par tierces, quintes et octaves, est totalement dépourvu de repère diatonique : en aucune manière, il n'indique comment procéder par degrés. L'intervalle de seconde, maillon élémentaire de toute mélodie, n'y apparaît jamais de manière directe.

Faute de mieux, Barbour21, qui a bien vu les faiblesses de la gamme de Helmholtz et son inaptitude à fonctionner en elle-même comme repère diatonique, se raccroche à ce qu'on peut appeler le principe de la note commune : il postule que, lorsqu'une note est commune à deux accords consécutifs, elle ne doit pas varier. Le résultat est que certains enchaînements d'accords vont entraîner une instabilité du diapason22 qui, au cas où le phénomène se répète, peut se transformer en une véritable dérive. Il prend l'exemple suivant :


Figure 1.2 : Le début du God save the King.


Si l'on admet que le A du quatrième accord doit être le même que celui du troisième, l'accord de G majeur qui clôt cet extrait se retrouve un comma plus grave que l'accord initial. En répétant en boucle les deux premières mesures du célèbre chant, on obtient cette curieuse descente aux enfers (Exemple 1.1)23. Il suffit, nous semble-t-il, de l'entendre une seule fois pour se rendre compte de son caractère invraisemblable : aucun ensemble vocal, fût-il médiocre ou au contraire excellent, ne saurait reproduire un tel naufrage, et encore moins s'en faire un modèle.

Appliqué systématiquement, le principe de la note commune, ou tout principe analogue, provoquerait, dans d'innombrables pièces, des dérives du diapason identiques à celle du God save the King. Barbour se sert cette observation pour construire une réfutation fondamentale de l'intonation juste. En toute logique, ce n'est que le principe de la note commune qu'elle aurait pu rendre caduc. Curieusement, il n'en a rien été : ce même principe a été récupéré depuis, sous une forme plus générale, par les partisans mêmes de l'intonation juste. C'est ainsi que, parmi les interprètes spécialisés dans la polyphonie vocale, il n'est pas rare d'entendre l'opinion, à notre avis farfelue, selon laquelle, si l'on chante « vraiment » juste, alors le diapason « doit » fluctuer. L'idée est à ce point reçue qu'on la trouve, reprise telle quelle, dans des écrits théoriques récents24. Si l'on relève, avec un rien d'ironie, qu'il est certainement plus gratifiant pour un groupe de chanteurs de se dire qu'ils détonnent parce qu'ils chantent « trop » juste que d'admettre qu'ils chantent faux ou « pas tout à fait » juste, on comprend d'autant mieux l'apparition d'un tel mythe.

Ce dont on ne s'est guère avisé, cependant, c'est que le principe de la note commune, et donc la dérive du diapason, ne sont en rien inéluctables. Pourquoi, en effet, le ténor qui chante God save the King devrait-il forcément calquer son A du quatrième accord sur le A chanté par le soprano au troisième accord, forçant par là même les autres voix à s'adapter et le diapason à baisser ? Ne pourrait-on pas attendre que l'alto et la basse tombent plutôt d'accord sur le D qui est déjà présent dans l'accord initial (en langage tonal, la dominante) ? Le soprano n'aurait ensuite guère de peine à les rejoindre en chantant une tierce pythagoricienne descendante A-F#. Enfin, ces trois voix forceraient le ténor à ajuster son A un comma au-dessus de celui qu'il vient d'entendre au soprano. Cette seconde solution est-elle, sur le papier, plus invraisemblable que la première, elle qui a l'avantage de maintenir aussi bien le diapason que la pureté verticale et n'est, même répétée en boucle, nullement choquante pour l'oreille (Exemple 1.2) ? Au nom de quoi la première solution, celle qui « sonne faux » serait-elle représentative de l'intonation juste, alors que la seconde, celle qui « sonne juste », serait exclue de cette définition ?

Comment aller plus loin, face à toutes ces questions ? C'est Zarlino et la théorie du XVIe siècle qu'il va maintenant falloir questionner.

 

| Sommaire | Introduction | Chap. 1 | Chap. 2 | Chap. 3 | Chap. 4 | Conclusion | Bibliographie |