MESURES DE L’EFFICIENCE PHONATOIRE EN VOIX PARLEE ET CHANTEE
Compte-rendu de la présentation
Claire PILLOT
COMPTE RENDU
Cet ensemble d’expériences s’insère dans le contexte d’une thèse de phonétique portant sur l’efficience et l’efficacité vocale dans le chant lyrique. Ce qui est présenté ici est une première étape portant sur la mise au point d’un protocole expérimental pour déterminer des paramètres aérodynamiques dans des émissions vocales chantées. La méthodologie et les résultats obtenus ont fait l’objet d’une abondante discussion qui sera poursuivie dans l’atelier du 11 juillet prochain, et qui fera l’objet d’expériences complémentaires lors des prochains mois.
Le larynx peut être assimilé à un transducteur d’énergie permettant de transformer de l’énergie aérodynamique en énergie acoustique. L’efficience phonatoire (rapport du travail acoustique sur le travail aérodynamique-voir plus loin) quantifie cette transformation. Au vu de la littérature, peu de mesures de l’efficience phonatoire ont été systématiquement effectuées dans une tâche chantée.
1. Les expériences présentées ici s’inscrivent, en premier lieu, dans la mise au point d’un protocole expérimental pour déterminer des paramètres aérodynamiques dans des émissions vocales chantées (débit et pression sous-glottique).
2. Deuxièmement, il s’agit de savoir si l’efficience phonatoire (Eg) est significativement différente d’une tâche parlée à une tâche chantée.
3. Troisièmement, la mesure de ce paramètre est-elle justifiée et spécifique dans le chant lyrique ? Autrement dit : les chanteurs utilisent-ils réellement leur larynx d’une façon efficiente ?
4. Quatrièmement, la variabilité de l’efficience, en regard de celle des paramètres qui la composent (Pression sous-glottique, débit moyen et intensité) n’est-elle pas trop importante en voix parlée et chantée ?
5. Cinquièmement, l’efficience en chant varie-t-elle avec le fondamental pour une personne donnée, pour un type vocal donné, un mécanisme donné ?
- Les valeurs de tous les paramètres sont plus élevées en voix chantée qu’en voix parlée quel que soit le corpus.
- La dispersion des valeurs est plus grande en chant qu’en parole
Tableau 1 : Moyennes globales minimale et maximale de chacun des paramètres
paramètre |
Voix parlée |
Voix chantée |
Pression sous-glottique (cm H20) |
5,2-11,1 |
16,2-24,8 (34) |
Intensité (dB) |
68,9-78,3 |
78,8-89,9 (93,8) |
Débit (l/s) |
0,212-0,312 |
0,231-0,470 |
Efficience x 10-5 (ppm) |
15.8-31.2 |
33.9-123.8 |
Les nombres entre parenthèses renvoient aux items dont le fondamental varie (gammes, arpèges). Les autres chiffres concernent les syllabes [pi].
Les valeurs augmentent régulièrement avec l’intensité dont l’effet est significatif.
En ce qui concerne la voix parlée, les valeurs obtenues sont analogues à celles de Holmberg (1994) et Hans (1996) (locuteurs féminins).
En ce qui concerne la voix chantée, l’effet de la voyelle est significatif sur les valeurs obtenues (La pression sous-glottique des syllabes [pa] est plus importante que celle des syllabes [pi] : z=-8.63 ; p<0,0001). Enfin, les valeurs augmentent avec la fréquence fondamentale (voir plus loin).
En ce qui concerne la voix parlée, les valeurs obtenues sont analogues à celles de Holmberg (1994) et Hans (1996) (locuteurs féminins) et augmentent significativement en fonction de l’intensité.
En ce qui concerne la voix chantée, l’effet de la voyelle est significatif sur les valeurs obtenues (le débit des syllabes [pa] est plus important que celui des syllabes [pi] : z=-5.76 ; p<0,0001). De plus, il existe une différence significative des valeurs entre les calculs automatique et manuel (z=-16.19 ; p<0,0001) : les valeurs de débit sont sous-estimées par le calcul automatique. L’effet de l’intensité est significatif ([pi] versus [pi] faible : z=-8.08 ; p<0,0001) contrairement à celui du tempo ([pi] versus [pi] chanté plus vite : z=-0.8 ; p=0.42). Enfin, on peut se demander si la variabilité obtenue est due au vibrato.
En ce qui concerne la voix parlée, les valeurs obtenues sont analogues à celles de Holmberg (1994) et Hans (1996) (locuteurs féminins) exceptée pour l’intensité faible où les valeurs de ces expériences sont supérieures à celles de la littérature. Elles augmentent significativement en fonction de l’intensité.
En ce qui concerne la voix chantée, l’effet de la voyelle est significatif sur les valeurs obtenues (l’intensité des syllabes [pa] est plus importante que celle des syllabes [pi] : z=-3.51 ; p=0,0004). L’effet du tempo n’est pas significatif ([pi] versus [pi] chanté plus vite ). On note enfin que les valeurs d’intensité, ainsi que leur dispersion, sont plus importantes pour les gammes et arpèges que pour les syllabes [pi] à intensité constante.
En ce qui concerne la voix parlée, les valeurs obtenues sont analogues à celles de Hans (1996) (locuteurs féminins).
En ce qui concerne la voix chantée, le tempo ([pi] versus [pi] chanté plus vite : z=-2.43 ; p=0.015) et l’intensité ([pi] versus [pi] faible : z=-8.44 ; p<0,0001) ont un effet significatif sur les résultats obtenus.
a. Voix parlée
Les paramètres varient significativement d’une mesure à l’autre d’après des tests ANOVA à mesures répétées (niveau de significativité : 95%), exceptée l’efficience. Ces résultats restent les mêmes si le niveau de significativité est moins sévère (sauf pour l’intensité à un seuil de 0,5%).
La variabilité d’intensité est négligeable par rapport à celle des autres paramètres (notamment la pression sous-glottique et le débit).
Cependant, les valeurs des différents paramètres aérodynamiques sont comparables à ceux mesurés chez 50 sujets féminins non chanteurs (Hans, 1996) : la comparaison a été utilisée en calculant le score Z d’après les travaux de Holmberg (1994). L’utilisation de cette analyse statistique permet de nuancer les scores des ANOVA à mesures répétées : en effet, d’après le calcul de ces scores z (Z=valeur observée-moyenne de la population / écart-type de la population), la variabilité des différents paramètres aérodynamiques est inférieure à deux écart-types, excepté pour la pression sous-glottique en intensité confortable, la pression sous-glottique et le débit moyen en intensité forte, la pression sous-glottique et l’efficience en intensité faible.
b. Voix chantée
Les paramètres varient significativement d’une mesure à l’autre d’après des tests ANOVA à mesures répétées (niveau de significativité : 95%), exceptée l’intensité pour les gammes avec [pi] et [pa] ainsi que les arpèges. Ces résultats restent les mêmes si le niveau de significativité est moins sévère.
La variabilité d’intensité est négligeable par rapport à celle des autres paramètres (notamment la pression sous-glottique et le débit). On pourrait donc supposer qu’il existe un meilleur contrôle de l’intensité (le plus important) par rapport aux autres paramètres en chant. Ces hypothèses seraient à vérifier avec d’autres chanteurs expérimentés.
La pression sous-glottique augmente régulièrement avec la fréquence fondamentale des gammes et arpèges, et l’on observe une dispersion analogue des données quel que soit le degré (fréquence fondamentale) de la gamme. On note cependant que les valeurs obtenues sont plus importantes pour la première note que la suivante, ce qui suppose l’existence d’un geste différent sur le début de l’item, pouvant être considéré comme un artéfact.
Les corrélations entre le fondamental et la pression sous-glottique sont positives, surtout pour les gammes avec [pa] (rho=0.45 ; N=184 ; p<0,0001) et les arpèges (rho=0.38 ; p=0.007).
Les corrélations entre le fondamental et le débit sont légèrement positives, surtout pour les gammes avec [pa] (rho=0.34 ; N=184 ; p<0,0001) et les arpèges (rho=0.46 ; p=0.001).
L’intensité croît avec la fréquence fondamentale et sa dispersion est faible, exceptée pour les syllabes [pa] à 440 Hz des gammes. On note en effet que cette intensité atteint son maximum à 440Hz pour les arpèges (émis avec la syllabe [pa]), et 494 Hz pour les gammes avec [pa] en raison de l’existence de phénomènes de résonance, de couplage avec le masque que l’on peut considérer comme un artéfact : cette facilité devrait dépendre du premier formant de la voyelle [a]. En effet, à 494 Hz, le deuxième harmonique de [a] est à 988 Hz et correspond au deuxième formant de cette voyelle. A 440 Hz, le deuxième harmonique de [a] est à 880 Hz et correspond au deuxième formant de cette voyelle.
Les corrélations entre le fondamental et l’intensité sont très positives, surtout pour les gammes avec [pi] (rho=0.89 ; N=200 ; p<0,0001) et les arpèges (rho=0.85 ; p<0,0001 ; N=50).
L’efficience croît en fonction de la fréquence fondamentale, et, comme l’intensité, atteint son maximum à 440Hz pour les arpèges (émis avec la syllabe [pa]), et 494 Hz pour les gammes avec [pa] et [pi].
Les corrélations entre le fondamental et l’efficience sont très positives, surtout pour les gammes avec [pi] (rho=0.78 ; N=200 ; p<0,0001) et les arpèges (rho=0.78 ; p<0,0001 ; N=50).
EFFICIENCE ET FREQUENCE FONDAMENTALE : DONNEES SUR L’ENSEMBLE DES 5 MESURES (voix chantée) : échelle logarithmique
Figure 1 : fréquence (Hz) des gammes et arpèges
Figure 2 : fréquence (Hz) des gammes avec [pi]
Figure 3 : fréquence (Hz) des gammes avec [pa]
Figure 4 : Fréquence (Hz) des arpèges
Figure 5: Voix parlée à toutes les intensités (fo =220Hz) : rho=0,7 ; p<0,0001 (*) ; N=179
Figure 6 : Voix chantée à intensité faible (fo=330Hz) : rho=0,91 ; p<0,0001 (*) ; N=29
Les syllabes [pi] émises à 220 Hz en voix parlée à toutes les intensités, possèdent le même niveau sonore que celles à intensité faible pour le chant (330 Hz). Pour ces deux groupes de valeurs, les valeurs d’efficience sont analogues et sont semblablement corrélées au niveau sonore (corrélations très positives).
Elles sont données dans le tableau suivant :
Corrélation |
Voix parlée |
Voix chantée |
Intensité / pression sous-glottique |
Rho=0.67 et r²=0.67 également Holmberg, 1994 : r²=0.69 |
Rho=0.49 ([pi]) Rho=0.29 (gammes et arpèges) |
Pression sous-glottique/débit |
Rho=0.14 (non significative) |
[pi] : rho=0.17 |
Intensité/efficience |
Rho=0.7 et r²=0.71 Holmberg, 1994 : r²=0.77 |
[pi] : rho=0.61 |
Intensité/débit |
Rho=0.47 ; p<0,0001 |
Rho=0.29 (gammes et arpèges) Rho=0.47 ([pi]) |
BARD MC, McCAFFREYTV, SLAVIT DH, LIPTON RJ (1992): Non invasive technique for estimating subglottic pressure and laryngeal efficiency, Ann. Otol. Rhinol. Laryngol. 101: 578-582.
CARROLL L.M. & coll (1996): Respiratory and glottal efficiency measures in normal classically trained singers, Journal of Voice, vol 10, n°2 pp.139-145.
HANS S (1996): Evaluation des paramètres aérodynamiques laryngés par l’Aérophone II chez des sujets normaux, D.E.A. de Phonétique, Paris, III, 177 pages.
HIRANO & COLL (1993): Vocal fold physiology, Raven Press, Ltd, New York
HOLMBERG E.B. , HILLMAN R.E., PERKELL J.S., & GRESS C. (1994) : Relationships between intra-speaker variation in aerodynamic measures of voice production and variation in SPL across repeated recordings, J. Of speech and hearing research, volume 37, 484-495.
IWATA S. (1988): Aerodynamic aspects for phonation in normal and pathologic larynges, in Vocal Fold physiology, Mechanisms & Functions, edited by O. Fujimura,
Raven Press, Ltd, New York.JIANG J. & coll (1999): Aerodynamic measurements of patients woth Parkinson’s disease, J. Of Voice, 13 (4), pp 583-591.
LAUKKANEN A.M., LINDHOLM P., VILKMAN E. (1995): On the effects of various vocal training methods on glottal resistance end efficiency, Folia Phoniatrica Logopedica, 47: 324-330.
SCHUTTE H.K. (1992): Integrated Aerodynamic Measurements, J. of Voice, 6(2), 127-134.
SCHUTTE H.K. (1984): Efficiency of professional singing voices in terms of energy ratio, Folia Phoniatrica, 36, 267-272
SCHUTTE H.K. & VAN DEN BERG J. (1980): The efficiency of voice production (abstract of the XVIII Congress of IALP, Washington, 1980), Folia Phoniatrica, 32(3), 238-239
SCHUTTE H.K., VAN DEN BERG J. & HOEKSEMA P.E. (1980): Effect of voice therapy measured by comparing vocal efficiency values (abstract of the XVIII Congress of IALP, Washington, 1980), Folia Phoniatrica, 32(3), 239
SCHUTTE H.K. (1980): The efficiency of voice production, Groningen, Kemper.
SLAVIT D.H. & McCAFFREY TV (1991): Regulation of phonatory efficiency by vocal fold tension and glottic width in the excised canine larynx, Ann otol Rhinol Laryngol, 100, 668-677.
SLAVIT D.H. (1991): Regulaiton of phonatory efficiency by vocal fold tension and glottic width in the excised canine larynx, Annals of Otologico-Rhinol. Laryngology, 100, 668-677.
STEVENS K. & HIRANO M. (1981): Vocal Fold Physiology, University of Tokyo Press, 421 pages.
SUNDBERG & Coll (1993): Comparisons of pharynx, source, formant and pressure characteristics in operatic and musical theatre singing, J. of Voice, 7(4), 301-310.
SUNDBERG J. (1987): The Science of the singing voice, Northern Illinois University Press, Dekalb, Illinois, 216 pages
SUNDBERG J. & coll (1999): effects of subglottal pressure variation on professional baritone singers’ voice sources, JASA, 105 (3), 1965-1971.
SUNDBERG J. (1995): Vocal fold vibration patterns and modes of phonation, Folia Phoniatrica Logopedica, 47: 218-228.
TANAKA S. & GOULD W.J. (1983) : Relationships between vocal intensity and noninvasively obtained aerodynamic parameters in normal subjects, JASA, 73 (4), 1316-1321.
TANG J. & STATHOPOULOS E.T. (1995): Vocal efficiency as a function of vocal intensity: a study of children, women, and men, JASA, 97(3), 1885-1891.
TITZE I.R. (1992): Vocal efficiency, J. of Voice, vol 6, n°2, pp 135-138
TITZE I.R. (1994): Principles of voice production, Prentice-Hall, Inc., Englewood Cliffs, New Jersey, 354 pages
VAN DEN BERG J.W. (1956): Direct and indirect determination of the mean subglottic pressure, Folia Phoniatrica, 8, 1-24.
YANAGI E., SLAVIT DH, McCAFFREY TV (october 1991): Study of phonation in the excised canine larynx, Otolaryngology Head and Neck Surgery, vol 105(4): 586-595.