Prosodie et correction phonétique

Par Stephan Wilhelm : Professeur agrégé en CPGE, Docteur en sociophonétique anglaise - Laboratoire TIL (Texte, Langage, Image), Université de Dijon ALOES

Publié par Clifford Armion le 23/10/2012

Activer le mode zen PDF

Selon le cadre dans lequel chacun évolue, on peut avoir diverses conceptions de la correction phonétique. Pour l’enfant qui acquiert sa langue maternelle, cette notion (bien imprécise, sans doute) sera différente de celle qu’entretient celui qui découvre l’anglais en tant que langue étrangère. Pour l’apprenant de niveau avancé (notamment pour les candidats aux concours de recrutements de professeurs ou les enseignants d’anglais d’origine non-anglophone), un degré élevé de correction phonétique est essentiel et constitue souvent l’objet d’une quête opiniâtre. À divers niveaux de l’enseignement, la correction phonétique est d’ailleurs étroitement associée à l’« authenticité » de l’anglais oral, c’est-à-dire à un haut degré de conformité avec la langue parlée par les locuteurs natifs.

Introduction

Selon le cadre dans lequel chacun évolue, on peut avoir diverses conceptions de la correction phonétique. Pour l’enfant qui acquiert sa langue maternelle, cette notion (bien imprécise, sans doute) sera différente de celle qu’entretient celui qui découvre l’anglais en tant que langue étrangère. Pour l’apprenant de niveau avancé (notamment pour les candidats aux concours de recrutements de professeurs ou les enseignants d’anglais d’origine non-anglophone), un degré élevé de correction phonétique est essentiel et constitue souvent l’objet d’une quête opiniâtre. À divers niveaux de l’enseignement, la correction phonétique est d’ailleurs étroitement associée à l’« authenticité » de l’anglais oral ((Voir par exemple le Bulletin Officiel du ministère de l'Education Nationale et du ministère de la Recherche n° 13 du 02 novembre 2000 (N° spécial) : <http://www.education.gouv.fr/bo/2000/special13/formation.htm>.)), c’est-à-dire à un haut degré de conformité avec la langue parlée par les locuteurs natifs.

On avance ici l’idée que la prosodie, dont certaines composantes sont souvent imparfaitement maîtrisées par les apprenants et relativement peu prises en compte dans l’enseignement de l’anglais langue étrangère, constitue une clef essentielle à la correction phonétique, à divers stades du parcours d’apprentissage et à divers niveaux de maîtrise de la langue.

Pour étayer cette affirmation, on circonscrira tout d’abord la nature des phénomènes prosodiques en clarifiant quelques questions conceptuelles soulevées par l’emploi de ce terme. On examinera ensuite la nature et les fonctions de trois composantes essentielles de la prosodie : l’intonation, la qualité de voix et le rythme. On verra que ces éléments constituent de puissants marqueurs de spécificité inter-langues, entre autres dans le cas du français et de l’anglais. On soulignera l’incidence de leur maîtrise sur la correction phonétique, et l’on émettra quelques pistes de réflexion en relation avec l’enseignement/apprentissage de l’anglais langue étrangère.

1. Définir la prosodie

La plupart des linguistes de tradition américaine considèrent les notions de traits suprasegmentaux et de prosodie comme globalement équivalentes ((« In American linguistics, the term [prosodic features] is used more or less synonymously with suprasegmental features. » (Lehiste 1970 : 1-2))). Aussi l’étymologie du mot « prosodie » s’avère-t-elle éclairante pour les définir. Ce terme tire son origine du vocable grec prosōidia, qui désignait une pièce chantée avec un accompagnement musical. Il n’est donc pas étonnant que Handley (2008) définisse la prosodie comme la « musicalité des énoncés » (« [the] music of the utterance ») ((Le choix a été fait de citer une définition récente pour refléter les approches actuelles, mais la définition de la prosodie remonte au phonéticien J. R. Firth, contemporain de Daniel Jones et membre du département dirigé par ce dernier au sein du prestigieux University College (de Londres) dans les années 1920. Fort de son expérience militaire en Inde et sur le continent africain ainsi que de ses responsabilités dans l’enseignement, Firth fut fortement influencé par son étude des langues locales. Il publia en 1948 un article intitulé “Sounds and Prosodies”. Dans celui-ci et dans d’autres travaux publiés en 1957, Firth réfutait le bien fondé des modèles analytiques fondés exclusivement sur l’approche phonémique adoptée par ses contemporains. Il défendait l’idée que les « caractéristiques musicales » (musical aspects) d’une langue, jusque-là considérées comme des attributs de discours (speech attributes), devaient être envisagées comme appartenant à la structure syntagmatique de la langue, par contraste avec les éléments appartenant à sa structure paradigmatique. Firth désignait ces caractéristiques musicales sous l’appellation de « prosodies ».)).

L’une des composantes les plus saillantes de la musique est sa dimension mélodique, résultant d’un ensemble de variations de « hauteur » sonore (corrélat perceptif de la fréquence) intervenant au fur et à mesure qu’un morceau se déroule. De même, l’une des composantes les plus remarquables de la production orale est l’intonation (voir plus bas). De même que le rythme, le tempo et le timbre des instruments se combinent à la composante mélodique d’une pièce musicale, d’autres traits que la hauteur des sons contribuent aussi à caractériser la chaîne parlée. A l’instar de l’intonation, ceux-ci sont observés à un niveau différent de celui du segment ((C’est-à-dire, notamment, du phonème (Cruttenden 1997 : 2).)) ; c’est pourquoi on définit l’ensemble de ces traits comme suprasegmentaux.

Le terme « suprasegmental » n’est pas particulièrement sujet à controverse. Cependant, la circonscription des éléments suprasegmentaux varie sensiblement d’un auteur à l’autre, même si ces variations ne semblent guère jusqu’ici avoir fait l’objet de remarques particulières. Par souci de clarté, on examinera la manière dont divers linguistes conçoivent les traits suprasegmentaux, puis on proposera de ceux-ci une définition précise en prenant en compte non seulement des données épistémologiques, mais aussi des critères psycho-cognitifs.

1.1 Approche qualitative et approche quantitative

Certains auteurs estiment que les éléments suprasegmentaux se définissent en fonction de leur nature ou de leur qualité. Ils considèrent comme suprasegmentales trois composantes de la chaîne parlée, à savoir : 1) la hauteur mélodique ; 2) le volume ; 3) la quantité (par là il faut entendre la « longueur » associée à la durée des sons). C’est en substance la définition retenue par Lehiste (1970 : 1) ((« Suprasegmentals are generally listed as the set of features consisting of pitch, stress, and quantity. ».)) ou par Ladd (1996 : 6-7) ((« [S]uprasegmental features [… are …] features of fundamental frequency (F0), intensity, and duration ». Ladd (1996 : 6-7) prend soin de préciser que la hauteur mélodique, l’accentuation (stress) et la quantité ne constituent que les corrélats perceptifs de la fréquence fondamentale, de l’intensité et de la durée.)).

D’autres adoptent une approche quantitative et considèrent comme déterminant le domaine auquel les traits s’étendent (Lehiste 1970 : 1 ; 1996 : 227). Les traits prosodiques sont alors envisagés comme des éléments observables sur des sections de la chaîne parlée dont la longueur excède celle des segments. C’est une définition de ce type que retient entre autres le Glossaire des termes linguistiques de la SIL ((http://www.sil.org/linguistics/GlossaryOfLinguisticTerms/WhatIsASuprasegmental.htm)) : « A suprasegmental is a vocal effect that extends over more than one sound segment in an utterance […] ».

Les définitions qualitative et quantitative de la prosodie ne semblent pas a priori contradictoires. Cruttenden (1997 : 1-2), définit d’ailleurs les éléments suprasegmentaux en combinant les deux approches :

There are […] three features which are commonly used for linguistic purposes, either singly or jointly. These three features are pitch, length, and loudness. Pitch concerns the varying height of the pitch of the voice over one syllable or over a number of successive syllables; length concerns the relative duration of a number of successive syllables or the duration of a given syllable in one environment relative to the duration of the same syllable in another environment; loudness concerns the changes of loudness within one syllable or the relative loudness of a number of successive syllables. […] Such features generally extend over stretches of utterances longer than just one sound and are hence often referred to as suprasegmentals […].

Un examen attentif des travaux qui adoptent l’une ou l’autre perspective révèle cependant une différence entre les deux angles d’approche. Alors que la définition qualitative restreint les traits suprasegmentaux aux seuls paramètres de hauteur mélodique, de volume et de quantité, l’approche quantitative permet d’élargir leur éventail à d’autres éléments. Firth (1957) considère ainsi l’assimilation ((C’est-à-dire l’influence exercée sur la réalisation d’un phonème par les caractéristiques phonétiques d'un son immédiatement voisin. Le son modifié par assimilation acquiert alors une ou plusieurs caractéristiques propres au son qui le précède ou le suit. Dans la séquence /ɪn ðə ˈbɒks/ (in the box), par exemple, en cas de discours rapide, la fricative dentale /ð/ est susceptible d’être réalisée comme une nasale [n̪] en raison de l’influence exercée par la nasale /n/ qui la précède (in the box => [ɪn̪n̪əˈbɒks]).)) et l’harmonie vocalique ((Dans les cas d’harmonie vocalique, phénomène observable dans plusieurs langues du monde, l’ensemble des voyelles qui apparaissent dans les syllabes d’une même unité lexicale ou syntagmatique appartiennent à la même « classe » que la voyelle précédente. Les classes en question peuvent être de divers types – voyelles arrondies ou non arrondies, voyelles « sombres » ou voyelles « claires », etc. – et varient selon les langues. L’harmonie vocalique se manifeste parfois en français lorsque certaines voyelles moyennes en position non accentuée subissent l’influence d’une voyelle située en syllabe finale (comparer aimer [eme] et aimable [ɛmabl]) (Asla Østby 2005 : 2).)) comme revêtant un statut prosodique, bien que ces phénomènes ne relèvent pas de la triade définie plus haut. De même, Cruttenden (1997 : 1), s’il ne réfute pas explicitement la définition qualitative des éléments suprasegmentaux, considère que la qualité de voix fait partie de ces derniers ((« The word nice might be said softly or loudly; it might be said with a pitch pattern which starts high and ends low, or with one which begins low and ends high; it might be said with a voice quality which is especially creaky or especially breathy. Such features […] are […] referred to as suprasegmentals (and a type of transcription which indicates how any of them are used is therefore termed a suprasegmental transcription). » Cruttenden (1997 : 2) écrit par ailleurs : « The prosody of connected speech may be analyzed and described in terms of the variation of a large number of prosodic features. »)).

1.2 L’approche fonctionnelle

C’est entre autres à cause de cette ouverture de la notion de traits suprasegmentaux que Lehiste (1970 : 1) réfute la définition quantitative. Elle considère celle-ci comme à la fois trop large, dans la mesure où elle ouvre la porte à d’autres éléments que la hauteur mélodique, le volume et la quantité ((À l’inverse de Firth ou de Cruttenden, Lehiste (1996 : 227) refuse d’accorder un statut suprasegmental à des traits tels que la qualité de voix.)), et trop étroite, car elle exclut ces mêmes éléments lorsqu’ils sont observés sur un seul segment ((« Suprasegmentals are generally listed as the set of features consisting of pitch, stress, and quantity, or […] defined as features whose domain extends over more than one segment (Hamp 1957). A definition is generally preferable to a list; the definition referred to, however, has at least two weaknesses. If suprasegmentals are to be defined with reference to their domain, then pitch, stress, and quantity would not qualify as suprasegmentals when they happen to be manifested over a single segment. On the other hand, if all features whose domain is larger than one segment are to be classed as suprasegmentals, then long components such as the voicing of a sequence of voiced segments would have to be included (Z. Harris 1944), and the ranks of suprasegmentals would be swelled with such additional possible suprasegmental features as vowel harmony and pharyngealisation. » (Lehiste 1970 : 1))).

L’élément que Lehiste (1970 : 2) considère comme déterminant est le rôle fonctionnel des traits de hauteur mélodique, de volume et de quantité. Pour elle, ces derniers possèdent un statut particulier dans la mesure où ils sont non seulement indispensables à la réalisation des segments, mais remplissent aussi souvent une fonction qui se superpose à celle des traits intrinsèques de ceux-ci ((« I believe there is a difference in kind between segmental features proper and the features of pitch, stress, and quantity. The last three are, in a way, a secondary, overlaid function of inherent features. »)). La hauteur mélodique, le volume et la quantité sont nécessaires à la réalisation de tout segment. Le fait de prononcer un phonème, par exemple /uː/ ou /m/, de manière audible implique inévitablement qu’on lui confère un certain degré de hauteur mélodique, de volume et de quantité. Mais des variations de ces mêmes éléments peuvent également affecter des sections de la chaîne parlée et transmettre des informations de nature grammaticale ((Des variations ou des degrés particuliers de hauteur mélodique peuvent par exemple conférer à un énoncé un sens interrogatif. Ils remplissent alors une fonction grammaticale.)) ou attitudinale ((Des variations ou des degrés particuliers de hauteur mélodique, de volume ou de quantité peuvent par exemple signaler un état psychologique ponctuel comme la colère, la surprise ou la condescendance (Uldall 1960 ; Scherer et al. 1984 ; Cruttenden 2001a ; Ladd 2008).)), par exemple. Ceci a des répercussions sur la manière dont chacun des segments est réalisé, d’où l’idée de superposition fonctionnelle mise en avant par Lehiste ((« Voicing is an inherent feature that may be identified at a moment in time; pitch is an overlaid function of voicing. The fundamental frequency of a voiced segment may serve simultaneously to identify the segment as voiced and to constitute part of the manifestation of a tonal or intonational pattern. Every segment must have a certain duration in the time domain to be identifiable as a segment; the feature of quantity involves manipulation of inherent duration. Every segment, if it is to be realized phonetically, also has a certain amount of intensity (as a result of being produced with a given amount of articulatory effort); whatever the acoustic and physiological correlates of stress, they consist in intensifying phonetic factors already present in a lesser degree. » (Lehiste 1970 : 2))).

Lehiste (1970 : 2) oppose encore les traits suprasegmentaux aux éléments segmentaux en considérant les premiers comme quantifiables sur un plan syntagmatique, c’est-à-dire en comparaison des éléments directement ou indirectement adjacents de la chaîne sonore, et les segments comme définis de manière paradigmatique, c’est-à-dire par rapport aux éléments susceptibles de leur être substitués ((« A further difference between segmental and suprasegmental features appears in the fact that suprasegmental features are established by a comparison of items in sequence (i.e. syntagmatic comparison), whereas segmental features can be defined without reference to the sequence of segments in which the segment appears, and their presence can be established either by comparison by inspection or paradigmatic comparison (i.e. comparison of an item with other items in the phonological inventory). For example, the rounding of a vowel in a sequence of rounded vowels can be established for each vowel without reference to adjacent sounds. The stressedness of a vowel, on the other hand, cannot be established without comparing the vowel to another segment in the sequence. » (Lehiste 1970: 2))).

1.3 Proposition de définition de la nature et du statut de la prosodie

A l’instar de Lehiste, on jugera inadaptée une définition quantitative selon laquelle les éléments suprasegmentaux affecteraient exclusivement des sections de la chaîne parlée recouvrant plusieurs segments. Certains traits prosodiques peuvent en effet s’étendre à un segment unique tout en exerçant une fonction qui se superpose à celle des traits inhérents à celui-ci. C’est le cas dans l’énoncé interrogatif : « I ? » (↗I), où le schéma intonatif ascendant remplit sur le phonème unique /aɪ/ ((Voir aussi Cruttenden (1997 : 1) : « [Prosodic features] … generally extend over stretches of utterances longer than just one sound. […] [They] may extend over varying domains: sometimes over relatively short stretches of utterances, like one syllable or one morpheme or one word […]; sometimes over relatively longer stretches of utterances, like one phrase, or one clause, or one sentence (intonation is generally relatable to such longer domains). Of course this distinction is not always as clear-cut as it first appears: a sentence, for example, may consist of one word. »)) une fonction qui se superpose à celle de la hauteur mélodique inhérente à ce dernier.

On ne souscrira pas, en revanche, à l’hypothèse selon laquelle les éléments suprasegmentaux devraient invariablement se définir de manière syntagmatique. On estime en effet qu’il n’est pas nécessaire qu’un trait soit défini ou quantifié par rapport à ceux des sections adjacentes de la chaîne sonore pour qu’il remplisse une fonction superposée à celle des composantes intrinsèques des segments de la chaîne. Ainsi, l’ensemble de la production parlée d’un locuteur peut être réalisé à volume sonore égal, mais avec une intensité jugée élevée en soi (qui n’a jamais eu affaire à un interlocuteur qui « parle fort » ?). La fonction de cette intensité suprasegmentale, quelle qu’elle soit, se superpose alors à celle des traits inhérents aux segments.

Contrairement à Lehiste, on ne limitera pas les éléments suprasegmentaux à la hauteur mélodique, au volume et à la quantité. On estime en effet que d’autres éléments, notamment la qualité de voix, peuvent remplir une fonction qui se superpose à celle des traits inhérents aux segments. Une coloration particulièrement nasale de l’ensemble de la chaîne sonore peut par exemple signaler une anomalie physiologique ou encore, d’une tout autre manière, des origines nord-américaines ((Certains objecteront que ce type de fonction de la qualité de voix, dite indicielle (voir section 2.2), diffère des fonctions souvent sémantiques et/ou pragmatiques de la hauteur mélodique, du volume ou de la quantité. Il est en réalité malaisé de délimiter ces domaines, comme l’illustre Firth (1957: 192) par une affirmation devenue célèbre : « Surely it is part of the meaning of an American to sound like one. »)).

A ce stade et en prenant en compte tous les paramètres répertoriés ci-dessus, on pourrait être tenté de définir les composantes prosodiques de la chaîne parlée comme l’ensemble des éléments remplissant une fonction qui se superpose à celle des traits des segments. Cette définition qualitative présente une indéniable valeur épistémologique en ce qu’elle permet de circonscrire la nature de la prosodie. Elle n’est pourtant pas sans poser une difficulté d’ordre cognitif. En effet, le fait de concevoir la fonction des traits suprasegmentaux comme superposée à celle des segments laisse supposer que la chaîne parlée doit être conçue comme une suite segmentale sur laquelle se greffent par la suite des traits prosodiques. Or, il semble plus cohérent d’envisager la prosodie comme une matrice qui sous-tend la production parlée (Daniels, communication personnelle, 2011).

Ceci se vérifie dans la manière dont les enfants acquièrent leur langue maternelle. Il apparaît en effet que, durant la période de babillage (de trois mois à un an environ), durant laquelle les enfants ne produisent aucun mot, les nourrissons anglophones imitent déjà certains schémas intonatifs utilisés par leurs parents. Vers la fin de la période de babillage et au début de celle des premiers mots (généralement entre huit mois et un peu plus d’un an), il est fréquent d’observer l’emploi de séquences intonatives qui évoquent celles de phrases entières ((Il semblerait en revanche que les enfants ne soient pas nécessairement en mesure de comprendre le sens des schémas intonatifs avant celui des mots (Cruttenden 2001a : 168), mais il s’agit là d’une autre question. Ce que l’on souligne ici est que l’enfant produit des schémas à caractère potentiellement « suprasegmental » avant d’être capable d’y insérer des suites cohérentes de segments (c’est-à-dire de phonèmes).)) (Peters 1977 ; Halliday 1975 ; Cruttenden 2001a). Sharpe (1970) suggère pour sa part que l’acquisition de certaines composantes de la qualité de voix s’effectue avant même celle de l’intonation. Messum (2010) parvient quant à lui à la conclusion que les enfants anglophones ((Il s’agit avant tout de ceux dont la langue maternelle est l’anglais britannique.)) développent très tôt certaines caractéristiques de leur ajustement articulatoire entre autres parce qu’ils acquièrent un mode passif de relâchement des articulateurs lors de la production des plosives. Bien que peu d’éléments aient été mis au jour en relation avec l’acquisition du rythme, Messum (2007 ; 2008) estime également que les anglophones acquièrent les caractéristiques rythmiques de leur langue maternelle – y compris l’alternance entre les voyelles pleines dans les syllabes accentuées et les voyelles réduites dans les syllabes non accentuées – parce qu’ils recourent pendant la petite enfance à un mode de respiration pulsatile. L’antériorité de l’acquisition des composantes prosodiques du discours sur les mots et/ou les phonèmes confirme le fait que ces éléments sous-tendent la chaîne parlée plutôt que de s’y superposer. Ceci n’est pas sans conséquences sur la manière dont il convient de concevoir l’apprentissage de l’anglais (on y reviendra plus bas).

Ayant déterminé la nature et le statut des éléments prosodiques, on se propose d’examiner la nature et les fonctions de trois caractéristiques suprasegmentales des langues du monde : l’intonation, la qualité de voix et le rythme.

2. L’intonation

2.1 Définition

Le terme « intonation » est parfois utilisé dans son acception la plus générale. Il désigne alors l’ensemble des variations de hauteur mélodique observées dans la chaîne parlée ((Voir par exemple la définition de l’intonation fournie par le lexique de linguistique de l’université d’Utrecht (<http://www2.let.uu.nl/UiL-OTS/Lexicon/>) : « Changes in fundamental frequency during the course of an utterance » ou par le glossaire en ligne des termes linguistiques de la SIL (<http://www.sil.org/linguistics/Glos-saryOfLinguisticTerms/>) : « Intonation is the system of levels (rising and falling) and variations in pitch sequences within speech ».)). On restreindra ici cette définition et l’on entendra par intonation les variations de hauteur observées au niveau de la phrase ou de ses constituants, mais non à des niveaux inférieurs, comme celui du mot ou du morphème (Ladd 1996 : 7-8 ; Cruttenden 1997 : 8-9). En d’autres termes, on considèrera que l’intonation est un phénomène supralexical ((On a cependant vu qu’il existe des cas où une phrase peut consister en un seul mot (section 1.3). Des variations de hauteur mélodique observées sur le mot concerné dans ces cas particuliers peuvent effectivement relever de l’intonation au sens où on l’entend ici, dans la mesure où les informations qu’elles véhiculent ont trait à la phrase ou à ses constituants et non au mot en tant qu’unité lexicale.)).

2.2 Les fonctions de l’intonation

Il n’est pas toujours facile de délimiter les fonctions de l’intonation. Ceci tient au fait que cette dernière est susceptible de remplir les trois fonctions essentielles de la parole : linguistique, paralinguistique et extralinguistique (voir par exemple Abercrombie 1967 ; Martinet 1982 ; Laver 1994). On entend par fonction linguistique la transmission du contenu sémantique du message dans le cadre d’un acte de communication donné. Il s’agit, en quelque sorte, du sens du « texte » du message. La fonction paralinguistique renvoie à la transmission d’informations relatives à l’état émotionnel ou affectif du locuteur, ou encore à son attitude à l’égard de son message ou de son destinataire. Enfin, la fonction extralinguistique consiste en la transmission d’informations relatives aux caractéristiques permanentes du locuteur (Laver [1968] définit cette fonction comme « indicielle »).

Pour la fonction linguistique, plusieurs ouvrages descriptifs et manuels consacrés à l’enseignement de l’anglais langue étrangère traitent du rôle grammatical de l’intonation (voir par exemple O’Connor & Arnold 1973 ; Cutler, Dahan & Van Donselaar 1997 ; Gussenhoven 2002 ; Deschamps et al. 2004) ((Au XVIe siècle déjà, Butler (1634) décrivait la fonction grammaticale de l’intonation.)). Ils décrivent notamment son statut démarcatif (c’est-à-dire sa capacité à délimiter les constituants de la phrase), informationnel ou emphatique (lorsqu’elle confère une saillance particulière à des informations ou éléments spécifiques de l’énoncé). L’intonation peut également signaler le caractère déclaratif ou interrogatif (Jones 1947 ; Halliday 1967, 1970 ; Cruttenden 1981 ; 1997) ((Voir aussi Grabe et al. (2005 : 2).)). Ainsi l’énoncé You’re going with me, produit avec un accent nucléaire ascendant, sera le plus souvent interprété comme une question ou une invitation (quelle qu’en soit la syllabe nucléaire). Le même énoncé prononcé avec un ton nucléaire descendant (simple) revêtira en revanche une valeur affirmative ou impérative. L’intonation peut aussi remplir un rôle discursif, permettant notamment de réguler les tours de paroles (Brazil 1997 ; Schegloff 1998 ; Wichmann 2000 ; Grabe et al. 2005).

Lorsqu’elle remplit une fonction paralinguistique, l’intonation peut signaler un état psychologique temporaire, des émotions ou des attitudes (Uldall 1960 ; Scherer et al. 1984 ; Grabe et al. 2005). Ainsi You’re going with me prononcé avec un ton nucléaire ascendant dont le point d’arrivée se situe particulièrement haut dans la tessiture du locuteur (high rise ou full rise) pourra exprimer une vive surprise. Avec un ton nucléaire descendant particulièrement ample (high fall), il pourra traduire la colère du locuteur ou conférer un caractère péremptoire à l’énoncé. On note au passage qu’en matière d’intonation, il n’est pas toujours facile de distinguer entre fonction linguistique et fonction paralinguistique : les notions d’interrogativité et de surprise se recoupent parfois, ainsi que celles d’assertivité et d’autorité déontique ((Cruttenden (1981 : 82-87) considère que la fonction paralinguistique de l’intonation prédomine sur sa fonction grammaticale : lorsque des facteurs grammaticaux et attitudinaux influent simultanément sur le choix d’un schéma intonatif, ce sont ces derniers qui l’emportent.)).

En tant que marqueur extralinguistique, l’intonation peut enfin signaler certains traits de personnalité ou états psychologiques permanents (une intonation monotone pourra par exemple évoquer un tempérament apathique), ou encore des origines sociales ou géographiques (Pellowe & Jones 1978). Les systèmes intonatifs, la « forme » de certains contours et les correspondances entre schémas mélodiques et « sens » constituent en effet des éléments distinctifs des langues du monde et de leurs variétés (Grabe 1998 ; Cruttenden 2001a) ((Voir aussi Jarman and Cruttenden 1976 ; Pellowe and Jones 1978 ; Knowles 1978 ; Cruttenden 1981 ; 2001b ; Willems 1982 ;Grabe et al. 2000, etc.)).

2.3 Intonation et correction phonétique

L’intonation est fréquemment l’un des aspects d’une langue étrangère qu’un apprenant peine longtemps à maîtriser (Sharpe 1970 : 128 ; Grabe 1998 : 10). De nombreux malentendus entre apprenants et locuteurs natifs résultent d’ailleurs d’une maîtrise défectueuse du système intonatif de la langue qui fait l’objet de l’apprentissage (Grabe et al. 2005 : 1). Dans le cas de l’anglais, ces malentendus seraient avant tout liés à certains effets pragmatiques ou à des différences de sens grammatical dues à l’emploi de schémas intonatifs erronés (Roach 1983 ; Grabe et al. 2005). On mesure donc l’importance pour l’apprenant d’une maîtrise sans faille du système intonatif de la variété de l’anglais qu’il utilise et d’une grande cohérence dans l’usage des éléments de son inventaire phonologique. Afin de promouvoir une correction phonétique optimale, on voit aussi la nécessité d’une précision minutieuse dans la réalisation des schémas intonatifs. Il est à noter que l’un des défauts les plus couramment relevés en France chez des apprenants de niveau avancé (lors des oraux des concours de recrutement de professeurs) est l’usage de schémas intonatifs inappropriés ou calqués sur la langue maternelle (Wilhelm 2010 ; 2011b ; 2012). On relève entre autres le recours fréquent à des schémas ascendants en fin d’énoncé déclaratif, l’usage occasionnel de contours phonologiquement appropriés, mais phonétiquement influencés par le français ou encore un marquage défectueux du statut de l’information par l’accent de phrase. On note aussi souvent l’absence de certains éléments caractéristiques du système intonatif de l’anglais ((En tout cas du RP (Received Pronunciation), aussi désigné par les appellations Southern British English, Queen’s English, ou BBC English (Wells 1982 : 117).)), particulièrement le (rise-)fall-rise, qui maintient l’attention de l’interlocuteur en éveil en signalant une suite à venir.

3. La qualité de voix

3.1 Définition

A l’instar d’Abercrombie (1967), Laver (1968 ; 1980 ; 1994) et Mackenzie-Beck (2005), on définira la qualité de voix comme le « timbre » ou la « coloration » qui caractérise l’ensemble des sons produits par un locuteur lorsqu’il s’exprime oralement ((Abercrombie (1967 : 91) donne de la qualité de voix une définition qui la restreint aux cas où elle remplit une fonction extralinguistique, ou indicielle (voir section 2.2) : « [Voice quality consists of] those characteristics which are present more or less all the time that a person is talking. It is a quasi-permanent quality running through all the sound that issues from his mouth. »)). Cette coloration résulte du positionnement à plus ou moins long terme des organes qui contribuent à la production du flux sonore, indépendamment de la production et de l’articulation des segments individuels qui composent la chaîne parlée.

On considère par ailleurs, à l’instar de Laver (1968 ; 1980), Sharpe (1970) ou Mackenzie-Beck (2005), que la qualité de voix résulte non seulement des ajustements des organes qui contribuent à l’articulation des éléments composant la chaîne sonore (c’est-à-dire des organes faisant office de résonateurs, ou d’articulateurs), mais encore de ceux qui contribuent à la phonation, ou production de la voix (c’est-à-dire du mode de vibration des plis vocaux ((Communément désignés sous le nom de cordes vocales.)) situés à l’intérieur du larynx) ((La qualité de voix n’est donc pas ici assimilée uniquement aux ajustements articulatoires, comme dans Honikman (1964) ou Wilson (2006), ni exclusivement à la phonation, à laquelle sont essentiellement consacrés les travaux de Catford (1964) et Ladefoged (1971). On estime ici que la « coloration » caractéristique de la voix d’un locuteur résulte tout autant des processus qui interviennent dans l’articulation que de ceux qui entrent en jeu dans la production de la voix.)).

3.2 Fonctions de la qualité de voix

A l’instar de l’intonation, la qualité de voix peut remplir les trois types de fonctions essentielles de la parole : linguistique, paralinguistique et extralinguistique (Laver 1994 ; Marasek 1997).

Dans certaines langues africaines, un type particulier de phonation, en association éventuelle avec d’autres traits suprasegmentaux, sert à marquer les énoncés interrogatifs (Ladd 2008 : 81). En anglais comme dans d’autres langues, la qualité de voix peut également jouer une fonction délimitative entre phrases ou propositions (Epstein 2002 : 13-14 ; Marasek 1997 : I.6) ((Laver (1994 : 21) considère que la régulation des tours de parole relève de la fonction paralinguistique. On pense plutôt qu’elle se situe au niveau syntaxique, c’est-à-dire linguistique.)). On se situe ici sur les plans grammatical et discursif, c’est-à-dire au niveau linguistique.

Lorsqu’elle remplit une fonction paralinguistique, la qualité de voix peut véhiculer des informations de type affectif ou attitudinal (Laver 1980 ; Gobl & Ní Chasaide 2003) ((Déjà au XIXe siècle, le physicien Hermann Ludwig Ferdinand von Helmholtz reconnaissait dans sa Théorie physiologique de la musique fondée sur l’étude des sensations auditives (1863) l’existence d’un phénomène de perception « directe » (unbewußtes Schließen) des émotions, indépendante du contenu sémantique du message, à partir de la qualité de voix.)). Délivrée avec une voix « dure », une exhortation visant à amener un interlocuteur à se dépêcher conservera ainsi le même sens de base que le même énoncé émis avec une voix modale, mais transmettra des informations additionnelles relatives aux émotions du locuteur (vraisemblablement la colère ou l’impatience (Laver 1980 : 131-132)) ((Dans diverses langues, certains types de qualité de voix peuvent être utilisés à des fins honorifiques ou pour signaler la déférence (Laver 1980 : 4).)).

C’est surtout quand elle est perceptible de façon quasi-permanente que la qualité de voix revêt une fonction extralinguistique. Des ajustements phonatoires ou articulatoires peuvent en effet permettre d’identifier les caractéristiques physiologiques ou psychologiques d’un locuteur (Laver 1968 : 49-51), mais aussi ses origines sociales ou géographiques (Laver 1968 : 50).

On retiendra ici que différents types de qualité de voix peuvent être associés à diverses langues ou accents particuliers. Honikman (1964 : 73) considère d’ailleurs que toute langue du monde est caractérisée par un positionnement spécifique des articulateurs :

[Articulatory setting] is the fundamental groundwork which pervades and, to an extent, determines the phonetic character and specific timbre of a language […,] the gross oral posture and mechanics […] requisite as a framework for the comfortable, economic, and fluent merging and integrating of the isolated sounds into that harmonious, cognizable whole which constitutes the established pronunciation of a language. ((Voir aussi Wilson (2006 : 1) : « If asked why different languages sound different, a layperson might answer that different languages use different sounds (i.e. they have different phonemes). A linguist would add that different languages use sounds differently (i.e. they have different phonologies). However, there is another factor that also plays a part in the sound of a language. As far back as 350 years ago (Wallis 1653 : 1972) people sensed that when speaking a foreign language, one’s articulators – the tongue, jaw, lips, etc. – seemed to have a whole different underlying or default posture than the one used for one’s native language. »))

Ce qui est vrai sur le plan articulatoire l’est aussi au niveau phonatoire. Certains modes de vibration des plis vocaux peuvent en effet caractériser les langues du monde ou leurs variétés (Sharpe 1970 : 116-117). Une utilisation fréquente de la voix craquée est ainsi associée à de nombreux accents américains ou à diverses variétés d’anglais britannique (Henton & Bladon 1988).

3.2 Qualité de voix et correction phonétique

La qualité de voix est l’un des aspects d’une langue étrangère qui offre le plus de résistance à l’apprenant. Sharpe (1970 : 127-128) observe que, même dans la production d’éléments de niveau avancé qui maîtrisent la grammaire, la prononciation des phonèmes, l’intonation et les caractéristiques rythmiques d’une langue non acquise pendant l’enfance, la qualité de voix continue dans bien des cas à trahir une origine étrangère. Honikman (1964), dont les recherches s’inscrivent dans une perspective contrastive, relève aussi que les difficultés rencontrées par de nombreux apprenants de niveau avancé sont davantage liées à un positionnement inadéquat des articulateurs plutôt qu’à la réalisation de phonèmes isolés. Coadou (2007) et Coadou & Audibert (2009), qui confrontent la qualité de voix de locuteurs anglophones et d’apprenants français de niveau avancés, montrent à partir d’analyses instrumentales que l’ajustement de certains articulateurs, notamment la pointe et la lame de la langue, la mâchoire inférieure et les lèvres, varie de manière significative selon que l’on a affaire aux uns ou aux autres. Les apprenants francophones, lorsqu’ils s’expriment oralement en anglais, ont ainsi tendance à s’exprimer en laissant la mâchoire inférieure trop ouverte ainsi qu’à arrondir et remuer excessivement les lèvres (ces remarques corroborent les observations de Honikman [1964]). Ils ont aussi tendance à adopter une voix insuffisamment nasale, et parfois à rétracter la pointe et la lame de langue de manière trop marquée, par hypercorrection. On reviendra dans la section 5 sur d’éventuels prolongements pédagogiques de ces constats. On se bornera ici à remarquer que les anglicistes soucieux d’améliorer la qualité phonétique de leur langue orale auront intérêt à se concentrer sur la qualité de voix.

4. Le rythme

4.1 Définition

De manière schématique, on définira le rythme d’une langue comme l’organisation hiérarchisée d’unités de discours plus ou moins saillantes dans le déroulement temporel de la production de la chaîne parlée (Dellwo 2004 ((« Rhythm is the systematic organization of prominent and less prominent speech units in time. »))). Les unités en question varient selon les langues ou les variétés de langue auxquelles on a affaire. Elles correspondent souvent à des syllabes, parfois à d’autres éléments. Cruttenden (1997 : 7) considère que les langues tirent souvent leurs caractéristiques rythmiques de l’alternance entre syllabes accentuées et non accentuées : « In many languages […] patterns of prominent and non-prominent syllables produce a particular rhythmical effect. » ((Skandera & Burleigh (2005 : 87) décrivent le rythme comme la récurrence d’éléments proéminents de discours à des intervalles perçus comme réguliers : « The rhythm of a language is the recurrence of prominent elements of speech at what are perceived to be regular intervals of time. ». Cette définition met en évidence les fondements cognitifs de la notion de rythme. Les notions de récurrence, de temps et de régularité que l’on y retrouve ne sont en effet pas sans évoquer la nature des rythmes biologiques et/ou musicaux, dont la perception fait appel aux facultés cognitives et parfois à des éléments subjectifs. Il semblerait en réalité que le rythme relève davantage de la perception subjective de composantes de la chaîne sonore que de caractéristiques physiques objectives, mesurables instrumentalement (Abercrombie 1967 ; Grabe & Low 2002 ; Di Cristo 2003).))

4.2 Le rythme en tant que marqueur de variété inter-langues

S’il est assez difficile de parler de fonctions linguistique ou paralinguistique du rythme ((Bien que l’on puisse parfois observer des recours à un rythme manifestement accentuel ou syllabique pour produire des effets d’emphase ou promouvoir l’intelligibilité.)), la définition proposée ici suggère que des types de rythme caractérisent les langues du monde. Le rythme peut donc remplir une fonction extralinguistique.

Bien que cette affirmation demande à être nuancée et précisée avec une technicité qui dépasse le cadre de cet article, plusieurs linguistes considèrent que toute langue se caractérise par un rythme plus ou moins syllabique ou accentuel (Pike 1945 ; Abercrombie 1967 ; Dasher & Bolinger 1982 ; Roach 1982 ; Dauer 1983). Les langues à rythme dit syllabique (syllable-timed languages) sont caractérisées par une récurrence des syllabes à des intervalles perçus comme plus ou moins réguliers, et les langues à rythme dit accentuel (stress-timed languages) par celle d’« accents » ou de « pieds », c’est-à-dire d’ensemble de syllabes, à des intervalles perçus comme plus ou moins périodiques. Le français est ordinairement considéré comme une langue syllabique alors que l’anglais ((Il faut entendre par là les variétés d’anglais le plus souvent enseignées dans le monde, c’est-à-dire le RP et le General American.)) est généralement décrit comme une langue accentuelle.

4.3 Substrat et interférence

Certaines variétés d’anglais influencées par des phénomènes de substrat ou d’interférence ((Un substrat est une langue qui a été supplantée ou est en voie d’être supplantée par une autre langue, mais qui continue d’exercer une influence sur cette dernière langue dans telle ou telle zone géographique. L’interférence est le phénomène par lequel deux ou plusieurs langues distinctes parlées au même moment dans la même zone géographique s’influencent mutuellement. Les conséquences de telles influences peuvent souvent être observées au niveau lexical et syntaxique, mais aussi sur le plan phonétique et/ou phonologique.)) manifestent une structure rythmique distincte de celle du RP ou du General American. Ainsi le rythme de l’anglais de Singapour diffère-t-il significativement de celui de ces accents (Low et al. 2001 ; Grabe & Low 2002). De même, des spécificités rythmiques ont été observées dans le créole jamaïcain et l’anglais des communautés Panjabi de Bradford, décrits comme syllabiques (Foulkes 2002 : 3). Ce sont sans doute également des phénomènes de substrat et/ou d’interférence qui pourraient expliquer la relative syllabicité du rythme de l’anglais parlé dans diverses zones du pays de Galles alors que la structure rythmique de l’anglais utilisé à Cardiff se rapproche davantage de celle du RP, accentuelle (Mees & Collins 1999 : 194).

4.4 Rythme et correction phonétique

Pour le sujet d’origine française, la maîtrise du rythme de l’anglais est d’autant plus nécessaire que la langue qu’il apprend à manier appartient à une catégorie rythmique différente de celle de sa langue maternelle. Une fois encore, il est frappant de noter que l’un des défauts les plus couramment relevés en France lors des concours de recrutement de professeurs est l’usage d’un rythme variablement syllabique (voir par exemple Wilhelm 2010 ; 2011b ; 2012). Les défauts rythmiques observés dans ce contexte consistent dans la plupart des cas en une accentuation systématique de toutes les syllabes, même en position non accentuée (effet « staccato »), parfois accompagnée d’un nivellement des différences entre voyelles pleines et voyelles réduites. Il arrive alors que l’expression d’apprenants de niveau avancé qui maîtrisent par ailleurs de façon très honorable la prononciation de chacun des phonèmes de l’anglais s’avère défaillante car plaquée sur une matrice rythmique distinctement étrangère.

5. Quelles conséquences pour l’enseignement de l’anglais langue étrangère ?

On voit que les composantes prosodiques que sont l’intonation, la qualité de voix et le rythme constituent des caractéristiques spécifiques saillantes des langues du monde. Elles sont en l’occurrence de puissants marqueurs distinctifs de l’anglais et du français, et l’on comprend que le fait de les maîtriser constitue un prérequis essentiel à l’atteinte d’un degré honorable de correction phonétique. Dans cette section, on abordera quelques prolongements des observations émises sur la nature et la fonction de ces trois composantes de l’oral en relation avec l’enseignement de l’anglais langue étrangère.

On a souligné plus haut le caractère matriciel de la prosodie en montrant que cette dernière sous-tendait la production orale plutôt que d’en constituer une composante superposée. Il ne semble donc pas incohérent d’envisager que l’apprentissage des éléments suprasegmentaux devrait non seulement accompagner, mais aussi être envisagé comme un indispensable support de tout travail entrepris sur la prononciation des segments. On ne formulera pas ici de recommandations précises quant à la manière dont chacune des composantes de la prosodie gagnerait à être présentée à des apprenants d’anglais langue étrangère. Cet aspect de l’enseignement/apprentissage de l’anglais constitue encore un sujet de recherche sous-exploré. On passera néanmoins en revue quelques pistes pionnières explorées par des pédagogues désireux d’adopter une approche prosodique de l’enseignement de l’anglais oral.

5.1 Intonation et rythme

Le fait de sensibiliser les apprenants au système intonatif de l’anglais, à la réalisation phonétique des tons qui le composent ainsi qu’à leur valeur grammaticale, discursive, attitudinale et indicielle présente assurément une utilité. Cependant, l’abord actuel de l’intonation, qui consiste souvent à établir des correspondances taxinomiques entre schémas intonatifs et sens grammatical ou attitudinal, s’apparente d’une certaine manière davantage à une approche segmentale qu’à une véritable sensibilisation aux caractéristiques prosodiques de l’anglais (Yates 2003 : 20). En outre, si l’attention des apprenants de divers niveaux est de nos jours régulièrement attirée sur certaines spécificités rythmiques de la langue (voir par exemple Yates 2003), force est de constater qu’au final, la structure rythmique observée dans la production des apprenants demeure souvent défectueuse, même à un niveau avancé.

Pour parer à ces lacunes, Yates (2003) propose une approche holistique dans laquelle les signaux paralinguistiques entrent en ligne de compte au même titre que la prosodie. Cette approche, initialement élaborée à l’intention de jeunes adultes, fait tout d’abord appel au visionnement répété de documents audiovisuels par lesquels on découvre des échanges authentiques entre des locuteurs natifs. Les apprenants reproduisent ensuite, dans le cadre de jeux de rôle, le rythme, l’intonation et les postures corporelles des natifs. Une telle approche a pour but de stimuler les mécanismes d’imitation qui entrent en jeu lors d’une immersion en milieu anglophone et de promouvoir la découverte de la langue orale par un autre biais que celui d’un travail segmental. Son aspect ludique la rend a priori éminemment exploitable avec de jeunes débutants, mais Yates (2003) ne parvient pas à démontrer empiriquement sa supériorité sur les méthodes traditionnelles en termes de niveaux d’authenticité phonétique et d’intelligibilité obtenus au final. Pour maîtriser le rythme de l’anglais, Messum (2010) recommande pour sa part de promouvoir un mode de respiration pulsatile, et signale avoir observé des résultats prometteurs chez ceux qui, jeunes ou moins jeunes, se prêtent à ce travail sur le souffle.

5.2 Approche contrastive de la qualité de voix

Les expériences les plus probantes semblent cependant avoir été réalisées dans le domaine de la qualité de voix. Honikman (1964) rapporte ainsi avoir obtenu des résultats spectaculaires en sensibilisant des apprenants de niveau avancé aux spécificités des ajustements articulatoires caractéristiques de l’anglais. C’est avec profit que l’on examinera le tableau 1, qui répertorie à partir de ses travaux les ajustements distinctifs du français (il s’agit d’une variété parlée à Paris) et de l’anglais (le RP).

Tableau 1 : Comparaison des ajustements articulatoires caractéristiques de l’anglais (RP) et du français, d’après Honikman (1964 : 73-84)

Ajustements des articulateurs	Anglais (RP)	Français (parlé à Paris)
*Mâchoires*	Assez fermées, mais relâchées (non serrées).	Modérément ouvertes.
*Lèvres*	Neutres. Modérément actives.	Arrondies. Très actives ; s’étirent et s’arrondissent vigoureusement.
*Etat de tension de la cavité orale*	Relâchée.	Joues contractées.
*Articulation principale des consonnes*	Alvéolaire, avec la pointe de la langue.	Dentale, avec la lame de la langue.
*Langue* : ancrage (c’est-à-dire : position de base, quasi-permanente)	Vers le palais. Les éléments « ancrés » sont les parties latérales de la langue, qui demeurent en permanence à proximité de l’intérieur des gencives et de l’arcade dentaire supérieures.	Vers la partie inférieure de la bouche. L’élément clef de l’« ancrage » est l’extrémité/lame, qui demeure positionnée près des incisives inférieures ou en contact avec elles.
*Langue :* extrémité	Effilée.	Non effilée.
*Langue :* corps	Légèrement incurvé vers la partie inférieure de la bouche (concave par rapport au palais).	Incurvé en direction du palais (convexe par rapport au palais).
*Langue :* dessous	Incurvé vers la partie inférieure de la bouche (concave par rapport au palais).	Neutre.

En insistant sur les ajustements des mâchoires et des lèvres, puis sur l’« ancrage » (ou position quasi-permanente) de la langue caractéristique de l’anglais, Honikman rapporte avoir à plusieurs reprises conduit des apprenants à adopter consciemment un positionnement leur permettant d’obtenir un degré surprenant de correction phonétique. Selon elle (Honikman 1964), en se concentrant sur des ajustements de long terme plutôt que sur la réalisation de phonèmes individuels, c’est non seulement la réalisation de tout un ensemble de segments clefs (particulièrement les consonnes alvéolaires), mais encore la fluidité des apprenants qui s’améliore considérablement. Messum (2010), dont les travaux corroborent ces observations, suggère pour sa part qu’au travail sur le positionnement de la langue, des mâchoires et des lèvres, il convient encore d’ajouter la recherche d’un relâchement des lèvres et de la langue ainsi que l’adoption d’un mode de respiration pulsatile conduisant naturellement à la production de plosives aspirées ((On pourrait aussi suggérer aux apprenants français d’accroître leur degré de nasalité (voir section 3.3) et de recourir à la voix craquée après les tons descendants en fin d’énoncé déclaratif. Il convient aussi de veiller à ce que le travail sur le positionnement de la langue ne donne pas lieu à une rétraction excessive de l’extrémité/lame de cet articulateur, par hypercorrection (voir section 3.3 et Coadou & Audibert 2009 : 3).)). De telles approches ont essentiellement été adoptées avec des apprenants expérimentés, mais semblent – théoriquement du moins – applicables à de jeunes sujets, au même titre, par exemple, que certaines activités d’orthophonie.

On terminera la revue de ces travaux pilotes en soulignant qu’une approche « holistique » de l’anglais oral ne constitue pas une garantie de progrès en termes de correction phonétique, chacun réagissant différemment à ce type d’enseignement en fonction de sa personnalité. Par ailleurs, une aptitude plus ou moins innée à imiter la prosodie des natifs (Honikman 1964 ; Yates 2003) ainsi que toute une variété de facteurs psychologiques difficilement quantifiables entrent en jeu dans l’apprentissage d’une langue étrangère, particulièrement pour ce qui est de l’oral (Daniels 1995 ; Yates 2003). Les réflexions consignées plus haut mettent cependant en lumière les limites d’une approche exclusivement articulée autour des segments. Il existera toujours, bien sûr, une nécessité de préserver un équilibre entre les approches segmentale et suprasegmentale en raison de la survenance inévitable de difficultés ponctuelles liées à la prononciation des phonèmes. Mais les expériences réalisées ici et leurs résultats font ressortir la nécessité de ne pas laisser le segment devenir un « arbre qui cache la forêt », une entité atomistique magnifiée au point d’escamoter la matrice phonologique de la prosodie.

Conclusion

Après avoir clarifié quelques enjeux conceptuels soulevés par la délimitation de la prosodie, on s’est efforcé de définir quelques-unes des composantes suprasegmentales dont la maîtrise apparaît déterminante pour promouvoir chez les apprenants d’anglais langue étrangère un degré satisfaisant de correction phonétique. On s’est principalement concentré sur l’intonation, la qualité de voix et le rythme.

On a souligné que si, pour des raisons épistémologiques, il peut sembler utile de définir la prosodie comme un ensemble d’éléments dont la fonction se superpose à celle des traits intrinsèques des phonèmes, il est cognitivement préférable de concevoir celle-ci comme une matrice sous-jacente dans laquelle s’enchâssent les segments. Pour cette raison, il paraît hautement souhaitable de promouvoir l’acquisition de la prosodie de l’anglais langue étrangère, même aux stades les plus précoces de l’apprentissage. Dans le cas des apprenants les plus expérimentés, une reconsidération de certains aspects de la production orale pourrait également être envisagée et impliquer un travail sur divers paramètres suprasegmentaux.

Cet article ne propose pas de stratégies précises en vue de l’enseignement des composantes prosodiques de la langue, mais répertorie quelques pistes de réflexions fournies par les travaux pionniers de pédagogues convaincus de la nécessité d’une approche suprasegmentale de l’enseignement/apprentissage de l’anglais langue étrangère. On pense que les prolongements pédagogiques de cette sphère de recherche encore sous-explorée pourraient s’avérer déterminants en matière de correction phonétique.

Bibliographie

ABERCROMBIE, D. (1967) Elements of General Phonetics. Édimbourg : Edinburgh University Press.

ASLA ØSTBY, K. (2005) « Le système vocalique du français parisien. Une étude dans le cadre du projet "Phonologie du français contemporain" ». Présentation donnée à l'IRIT (Institut de Recherche en Informatique de Toulouse) : <http://www.irit.fr/RJC2005/data-base/pdf/AslaOstbyKathrine2.pdf> (12/09/2012).

BRAZIL, D. (1997) The Communicative Value of Intonation in English. Cambridge : Cambridge University Press.

BUTLER, C. (1634) English Grammar. Première édition en 1633, à Oxford, par William Turner "for the Author". Edition moderne par A. EICHLER (éd.) Charles Butler's English Grammar 1634, Neudrucke Frühneuenglischer Grammatiken 4, 1, Halle : Niemeyer.

CATFORD, J. C. (1964) “Phonation Types: the Classification of some Laryngeal Components of Speech Production”, in D. ABERCROMBIE, D. B. FRY, P. A. D. Maccarthy, N. C. SCOTT & J. L. M. TRIM (éds.), In Honour of Daniel Jones: Papers Contributed on the Occasion of His Eightieth Birthday 12 September 1961. Londres :Longman, 26-37.

COADOU, M. (2007) Qualité de voix et accents régionaux en anglais britannique. Thèse de doctorat non publiée. Université Aix-Marseille 1. Laboratoire Parole et Langage (LPL), CNRS : UMR 6057, Université de Provence, Aix-en-Provence.

COADOU, M. & AUDIBERT, N. (2009) “Voice Quality and English as a Foreign Language: A Pilot Study”, Proceedings of the 3rd International Workshop on Advanced Voice Functions Assessment (AVFA 2009). Madrid, Espagne : <http://nicolas.audibert.per-so.sfr.fr/doc/AVFA09_Coadou_Audibert.pdf> (12/09/2012)

CRUTTENDEN, A. (1981) “Falls and Rises: Meanings and Universals”, Journal of Linguistics 17/1, 77-92.

CRUTTENDEN, A. (1997 [1986]) Intonation (2e éd.). Cambridge : Cambridge University Press.

CRUTTENDEN, A. (2001a) Gimson’s Pronunciation of English. Londres : Routledge.

CRUTTENDEN, A. (2001b) “Mancunian Intonation and Intonational Representation”, Phonetica 58, 53-80.

CUTLER, A., DAHAN, D. & VAN DONSELAAR, W. A. (1997) “Prosody in the Comprehension of Spoken Language: a Literature Review”, Language and Speech 40(2), 385-400.

DANIELS, H. (1995) “Psycholinguistic, psycho-affective and procedural factors in the acquisition of authentic L2 phonology”, Speak Out! Newsletter of the IATEFL Pronunciation Special Interest Group, 15, 3-10.

DASHER, R. & BOLINGER, D. (1982) “On Pre-accentual Lengthening”, Journal of the International Phonetic Association 12, 58-69.

DAUER, R.M. (1983) “Stress-timing and Syllable-timing Reanalyzed”, Journal of Phonetics 11, 51-62.

DELLWO, V. (2004) “Speech and Language Rhythm”. Présentation donnée à University College, Londres : <http://www.phonetiklabor.de/Phonetiklabor/Inhalt/Unterrichts-material/PDFs/SpeechRhythm.pdf> (12/09/2012).

DESCHAMPS, A., DUCHET, J-L., FOURNIER, J-M. & O’NEIL, M. (2004) English Phonology and Graphophonemics. Paris : Ophrys.

DI CRISTO, A. (2003) “De la métrique et du rythme de la parole ordinaire : l’exemple du français”, Semen 16 : <http://semen.revues.org/document2944.html> (20/08/2012).

EPSTEIN, M. A. (2002) Voice Quality and Prosody in English. Thèse de doctorat non publiée. Université de Californie : <http://www.linguistics.ucla.edu/faciliti/re-search/mae_diss.pdf> (12/09/2012).

FIRTH, J. R. (1957) “Sounds and Prosodies”, Papers in Linguistics, 1924-1961, 121-138.

FOULKES, P. (2002) “Current Trends in British Sociophonetics”, Working Papers in Linguistics 8(3) – A Selection of Papers from NWAV 30, 75-86.

GOBL, C. & NÍ CHASAIDE, A. (2003) “The Role of Voice Quality in Communicating Emotions, Mood and Attitude”, Speech Communication 40, 189-212.

GRABE, E. (1998) Comparative Intonational Phonology: English and German, MPI Series in Psycholinguistics 7 Wageningen : Ponsen en Looien.

GRABE, E. & LOW, E. L. (2002) “Durational Variability in Speech and the Rhythm Class Hypothesis”, Papers in Laboratory Phonology 7. Berlin : Mouton de Gruyter, 515-546.

GRABE, E., KOCHANSKI, G. & COLEMAN, J. (2005). “The Intonation of Native Accent Varieties in the British Isles – Potential for Miscommunication?”, in K. DZIUBALSKA-KOLACZYK & P. PRZEDLACKA (éds.), English Pronunciation Models: a Changing Scene. Linguistic Insights Series. Berne : Peter Lang, 311-337.

GRABE, E., POST, B., NOLAN, F. & FARRAR, K. (2000) “Pitch Accent Realisation in Four Varieties of British English”, Journal of Phonetics 28, 161-186.

GUSSENHOVEN, C. (2002) “Intonation and Interpretation: Phonetics and Phonology”, in B. BEL & I. MARLIN (éds.), Proceedings of the Speech Prosody 2002 Conference, Aix-en-Provence : Laboratoire Parole et Langage, Université de Provence, 47-57.

HALLIDAY, M. A. K. (1967) Intonation and Grammar in British English. La Haye : Mouton.

HALLIDAY, M. A. K. (1970 [1963]) A Course in Spoken English: Intonation (2e éd.). Oxford : Oxford University Press.

HALLIDAY, M. A. K. (1975). Learning How to Mean, Londres : Edward Arnold.

HANDLEY, Z. (2008) “Is Text-to-Speech Synthesis Ready for Use in Computer-Assisted Language Learning?”, Speech Communication (2008) : <http://www.tara.tcd.ie/jspui/bit-stream/2262/49645/1/PEER_stage2_10.1016%252Fj.specom.2008.12.004.pdf> (12/09/2012)

HENTON, C. & BLAD septembre ON, A. (1988). “Creak as a Sociophonetic Marker”, in L. M. HYMAN and C. N. LI (éds.), Language, Speech and Mind: Studies in honour of Victoria A. New York et Londres : Routledge.

HONIKMAN, B. (1964) “Articulatory Settings”, in D. ABERCROMBIE, D. B. FRY, P. A. D. MACCARTHY, N. C. SCOTT & J. L. M. TRIM (éds.), In Honour of Daniel Jones: Papers Contributed on the Occasion of His Eightieth Birthday 12 September 1961, 73-84.

JARMAN, E. & CRUTTENDEN, A. (1976) “Belfast Intonation and the Myth of the Fall”, Journal of the International Phonetic Association 6, 4-12.

JONES, D. (1947 [1940]) An Outline of English Phonetics (6e éd.). Cambridge : Heffer.

KNOWLES, G. O. (1978) “The Nature of Phonological Variables in Scouse”, in P TRUDGILL (éd.), Sociolinguistic Patterns in British English. Londres : Arnold, 80-90.

LADD, D. R. (2008 [1996]) Intonational Phonology (Cambridge Studies in Linguistics 79) (2nd éd.). Cambridge : Cambridge University Press.

LADEFOGED, P. (1971) Preliminaries to Linguistic Phonetics. Chicago : University of Chicago Press.

LAVER, J. (1968) “Voice Quality and Indexical Information”, British Journal of Disorders of Communication 3, 43-54.

LAVER, J. (1980) The Phonetic Description of Voice Quality. Cambridge : Cambridge University Press.

LAVER, J. (1994) Principles of Phonetics. Cambridge : Cambridge University Press.

LEHISTE, I. (1970) Suprasegmentals. Cambridge, Massachussets : MIT Press.

LEHISTE, I. (1996) “Suprasegmental Features of Speech”, in N. LASS (éd.), Principles of Experimental Phonetics. St. Louis : Mosby, 226-244.

LOW, E. L., GRABE, E. & NOLAN, F. (2001). “Quantitative Characterisations of Speech Rhythm: Syllable-timing in Singapore English”, Language and Speech 43/4, 377-401.

MACKENZIE-BECK, J. M. (2005) “Perceptual Analysis of Voice Quality: the Place of Vocal Profile Analysis”, in W. J. HARDCASTLE & J. M. MACKENZIE-BECK (éds.), A Figure of Speech: a Festchrift for John Laver. Londres : Laurence Erlbaum, 285-322.

MARASEK, K. (1997) EGG and Voice Quality. Thèse de doctorat non publiée. Université de Stuttgart : <http://www.ims.uni-stuttgart.de/phonetik/EGG/> (20/08/12).

MARTINET, A. (1982) “Linguistique, paralinguistique, extralinguistique”, International Review of Applied Linguistics in Language Teaching, vol. 20 ; 1-4, 83-84.

MEES, I. & COLLINS, B. (1999) “Cardiff: a Real-time Study of Glottalization”, in P. FOULKES & G. J. DOCHERTY (éds.), Urban Voices (Accent Studies in the British Isles). Londres : Arnold, 185-202.

MESSUM, P. (2007) The Role of Imitation in Learning to Pronounce. Thèse de doctorat non publiée. University College, Londres.

MESSUM, P. (2008) “What if Children don’t Learn to Pronounce by Imitation? How Should we Teach Older Learners?”, IATEFL Pronunciation Special Interest Group Newsletter 39, 16-21.

MESSUM, P. (2010) “Understanding and Teaching the English Articulatory Setting”, Speak Out! (IATEFL Pronunciation Special Interest Group Newsletter) 43, 20-29.

O’CONNOR, J. D. & ARNOLD, J. A. (1973) Intonation of Colloquial English. Bristol : Longman.

PELLOWE, J. & JONES, V. (1978) “On Intonational Variability in Tyneside Speech”, in P. TRUDGILL (éd.), Sociolinguistic Patterns in British English. Londres : Arnold, 101-121.

PETERS, A. (1977) “Language Learning Strategies: does the Whole Equal the Sum of Its Parts?” Language 53, 560-573.

PIKE, K. L. (1945) The Intonation of American English. Ann Arbor, Michigan : University of Michigan Press.

ROACH, P. (1982) “On the Distinction Between ‘Stress-timed’ and ‘Syllable-timed’ Languages”, in D. CRYSTAL (éd.), Linguistic Controversies. Londres : Arnold, 73-79.

ROACH, P. (1983) English Phonetics and Phonology (2nd éd). Cambridge : Cambridge University Press.

SCHEGLOFF, E. (1998) “Reflections on Studying Prosody in Talk-in-Interaction”, Language and Speech 41, 235-60.

SCHERER, K., LADD, D. & SILVERMAN, K. (1984) “Vocal Cues to Speaker Affect: Testing Two Models”, Journal of the Acoustical Society of America 76, 1346-1356.

SHARPE, M. C. (1970) “Voice Quality: A suggested Framework for Description and some observations”, in S. A. WURM & D. C. LAYCOCK (éds.), Pacific Linguistic Studies in Honour of Arthur Capell. Pacific Linguistics Series C, 13, 115-132.

SKANDERA, P. & BURLEIGH, P. (2005) A Manual of English Phonetics and Phonology. Tubingue : Gunter Narr Verlag.

ULDALL, E. (1960) “Attitudinal Meanings Conveyed by Intonation Contours”, Language and Speech 3, 223-234.

WELLS, J.C. (1982) Accents of English. Vol 1: An Introduction. Cambridge : Cambridge University Press.

WICHMANN, A. (2000) Intonation in Text and Discourse. Harlow : Pearson Education (Longman).

WILHELM, S. (2010) “Rapport de jury du CAPES externe d’anglais – Session 2010”. Section 4.2.4 : « Anglais oral », 77-95. Ministère de l’enseignement supérieur et de la recherche : <http://media.education.gouv.fr/file/capes_ext/14/6/RJC_2010_CAPES_externe_anglais_150146.pdf> (20/08/2012).

WILHELM, S. (2011a) Innovations segmentales et suprasegmentales dans le NW Yorkshire : Implications pour l’étude du changement accentuel dans l’anglais des îles Britanniques. Thèse de doctorat. Université de Bourgogne : <http://ressources-numeriques.u-bourgogne.fr/theses/27009150/these_WILHELM_STEPHAN_00_00.pdf> (20/08/2012).

WILHELM, S. (2011b) “Rapport de jury du CAPES externe d’anglais – Session 2011”. Section 4.1 : « Langue orale », 62-70. Ministère de l’enseignement supérieur et de la recherche : <http://cache.media.education.gouv.fr/file/capesext/37/8/anglais_186378.pdf> (20/08/2012).

WILHELM, S. (2012) “Rapport de jury du CAPES externe d’anglais – Session 2012”. Section 4.1 : « Langue orale », 63-76. Ministère de l’enseignement supérieur et de la recherche : <http://cache.media.education.gouv.fr/file/capes_ext/73/8/anglais_222738.pdf> (20/08/2012).

WILLEMS, N. (1982) English Intonation from a Dutch Point of View. Dordrecht : Foris Publications.

WILSON, I. L. (2006) “Articulatory Settings of French and English Monolingual and Bilingual Speakers”. Thèse de doctorat non publiée. Université de British Columbia : <http://web-ext.u-aizu.ac.jp/~wilson/Wilson2006PhD.pdf> (20/08/12).

YATES, K. (2003) “Teaching Linguistic Mimicry To Improve Second Language Pronunciation”. Mémoire de maîtrise non publié. Université de North Texas. Denton, Texas. UNT Digital Library : <http://digital.library.unt.edu/permalink/meta-dc-4164:1> (20/08/12).

Pour citer cette ressource :

Stephan Wilhelm, Prosodie et correction phonétique, La Clé des Langues [en ligne], Lyon, ENS de LYON/DGESCO (ISSN 2107-7029), octobre 2012. Consulté le 07/11/2025. URL: https://cle.ens-lyon.fr/anglais/langue/phono-phonetique/prosodie-et-correction-phonetique

Anglais

Navigation