Vous êtes ici : Accueil / Langue(s) / La prononciation en (anglais) L2 : perspectives cognitives et questions de fond pour une didactique focalisée sur "le sens"

La prononciation en (anglais) L2 : perspectives cognitives et questions de fond pour une didactique focalisée sur "le sens"

Par Heather Hilton : Professeur émérite - Université Lyon 2 (laboratoire CeRLA), Marie-Pierre Jouannaud : Maîtresse de conférences en linguistique et didactique - Université Paris 8
Publié par Marion Coste le 05/12/2024

Activer le mode zen PDF

[Article] Nous résumerons ici des travaux fascinants en sciences cognitives, visant à mieux cerner la nature et le fonctionnement des connaissances phonologiques (réceptives et productives, phonémiques et prosodiques) dans le cerveau humain. Nous résumerons également des démarches (expérimentales ou didactiques) qui ont facilité l’émergence de nouvelles catégories phonémiques – même dans le cerveau d’apprenants plus âgés ou ayant étudié une langue étrangère pendant de nombreuses années. Ces perspectives cognitives sur les apprentissages phonologiques nous permettront de questionner quelques notions répandues de la didactique communicativo-actionnelle des langues (((Task-Based Language Teaching))). Elles nous aideront aussi à décomplexer les activités phonologiques et métaphonologiques en classe de langue, à tous les niveaux.

Introduction

Pendant la rédaction récente de synthèses des travaux en sciences cognitives concernant l’utilisation et l’apprentissage du langage (Hilton, 2022 ; Jouannaud, 2021), nous avons été frappées par un net décalage entre les conclusions des recherches en sciences cognitives – qui pointent une importance centrale des connaissances phonologiques dans la cognition langagière – et la place beaucoup plus marginale attribuée à ces connaissances dans la didactique européenne communicative et « actionnelle » (Conseil de l’Europe, 2001). Dans les pages qui suivent, nous allons d’abord faire le point sur ces travaux en sciences cognitives portant sur la nature, le fonctionnement et l’acquisition des réseaux phonologiques, avant de considérer de possibles retombées didactiques de ces perspectives cognitives. Nous espérons ainsi tracer quelques pistes pour une didactique renforcée des apprentissages phonologiques, toujours dans le cadre d’une méthodologie visant l’utilisation communicative du langage.

1. Sciences cognitives et connaissances phonologiques

1.1 Réseaux cérébraux

La focalisation de la recherche en sciences cognitives évolue en parallèle de notre capacité technique à observer l’activation de différentes parties du cerveau. L’électroencéphalographie – une technique ancienne (Berger, 1929) qui fut informatisée pendant les années 1980 – mesure la temporalité de certaines ondes d’activation neuronale dans le néocortex – cette partie du cerveau la plus proche de l'enveloppe crânienne, et donc des électrodes placées sur le cuir chevelu (Mecarelli, 2019). L’imagerie par résonance magnétique fonctionnelle (IMRf, Ogawa et al., 1990) permit dans les années 1990 de localiser ces activations corticales et de mesurer leur intensité. Au XXIe siècle, les avancées rapides de la neuroimagerie et de l’informatique rendent possible une visualisation de plus en plus fine et en trois dimensions, non seulement des activations de la substance grise du néocortex, mais également de la « tractographie » des faisceaux de substance blanche qui relient les neurones dans le cortex, et les réseaux du cortex au reste de l’encéphale. Depuis une quinzaine d’années, la « connectivité » neuronale et les grands circuits d’activation cérébraux (whole-brain systems) sont les grandes préoccupations de la neuroscience des réseaux (network neuroscience).

Pour l’étude cérébrale du langage, les travaux à la fin du XXe siècle étaient focalisés sur des aires temporo-frontales gauches (au niveau des tempes, au-dessus des oreilles) traditionnellement associées à l’utilisation du langage, et surtout sur la temporalité de différents types de traitements morpho-syntaxiques (réactions, par exemple, à une terminaison verbale ou nominale inattendue dans un énoncé ; Gernsbacher et Kaschak, 2003). Les limitations technologiques de la neuroimagerie informatisée de première génération nécessitaient des paradigmes expérimentaux artificiels et surtout réceptifs – car il est difficile d’observer l’utilisation naturelle du langage si le sujet en observation ne peut pas bouger sa tête (comme c’est le cas dans un scanner IRM). Des avancées récentes de la spectroscopie infra-rouge (SPIR, pour spectroscopie dans l’infrarouge proche) rendent possible l’observation de deux cerveaux « couplés » en interaction ; on parle de hyperscanning ou de l’activation cerveau-à-cerveau (Ferrari et Quaresima, 2012 ; Hasson et al., 2012).

Les « modèles » cognitifs de l’utilisation du langage les plus influents en Europe furent développés au Max Planck Instituut voor Psycholinguïstiek (Nimègue, Pays-Bas) : un modèle de la production orale par Willem Levelt, premier directeur de l’Institut (Levelt, 1989, 1999), et un modèle de la compréhension aurale ((Compréhension en modalité orale ; compréhension de l’oral.)) par Anne Cutler et Charles Clifton (1999). Peter Hagoort, actuel directeur de l’Institut, a proposé une mise à jour de ces modèles en conformité avec les travaux en neuroscience des réseaux : le modèle Mémoire, Unification, Contrôle, ou MUC (Hagoort, 2005, 2016). Dans ce modèle, l’utilisation communicative du langage implique de multiples activations dans les réseaux sémantiques et linguistiques de notre mémoire (M), qui sont unifiées (U) dans des aires de jonction (des moyeux ou hubs) à l’intersection de différents lobes du cortex, sous le contrôle (C) de notre attention consciente. Les réseaux neuronaux associés au langage dans notre mémoire ont une « architecture tripartite » : réseaux sonores, réseaux syntaxiques (les processus combinatoires permettant de mettre les mots ensemble en énoncés) et sémantiques (du sens ; Hagoort, 2005, 416). Notre mémoire pour le langage comporte des réseaux phonologiques, lexicaux, grammaticaux et discursifs ; pour chacun de ces niveaux, il existe des voies d’activation afférentes (pour la perception des signaux entrants) et d’autres voies d’activation efférentes (pour les signaux générés par le système nerveux et sortant vers le monde externe).

Pendant l’écoute du langage (la compréhension de l’oral), par exemple, des signaux auditifs, visuels et sociaux externes activent les réseaux phonologiques, visuels et pragmatiques du cerveau, qui à leur tour activent les réseaux sémantiques, autobiographiques et sociaux du sens. L’unification des signaux entrants et des réseaux du sens s’opère dans le gyrus temporal gauche et dans les aires temporo-pariétales qui ont longtemps été associées à la compréhension du langage (Geschwind, 1980 ; Wernicke, 1974). Ce sont effectivement ces « aires de jonction » où des neurones métamodaux permettent d’unifier des informations auditives, visuelles et motrices (activées dans les lobes temporal, occipital et pariétal respectivement, situés sur le côté, l'arrière et le dessus de la tête), avant d’activer les réseaux sémantiques, qui sont très largement distribués dans tout le cortex (Huth et al., 2016 ; corroborant Warrington, 1975). Il est important de souligner le fait que les sons spécifiques de la parole humaine sont traités à part par le cerveau, acheminés par le thalamus (au centre du cerveau) vers le cortex le long de voies neuronales dédiées (Bartlett, 2013) ((Pour des explications plus détaillées et quelques illustrations graphiques des structures cérébrales mentionnées ici, nous référons nos lecteurs à Hilton (2022, 13-17 et 56-67).)).

1.2 Perception langagière

Pour la perception du langage, font partie de notre mémoire phonologique des catégories de sons, correspondant aux phonèmes de notre langue maternelle (L1), des catégories ou schémas pour la perception des contours prosodiques (au niveau des mots et des groupes de souffle), et des informations visuelles liées à la perception de la parole (mouvements faciaux et buccaux, notamment) ((Cette liste n’est pas exhaustive, puisqu’il faudrait également y ajouter les connaissances allophoniques et phonotactiques (combinaisons de sons possibles), que nous n’aurons pas la place de traiter ici.)). La perception des sons langagiers active des aires du gyrus temporal supérieur : à gauche pour la perception des traits phonétiques et à droite pour la perception prosodique (Mesgarani et al., 2014 ; Ramos Nuñez et al., 2020). Pour Patricia Kuhl et Paul Iverson, les catégories phonémiques de notre L1 servent d’« aimants perceptifs », nous permettant de reconnaître les variations allophoniques comme faisant partie d’une seule catégorie sonore (Kuhl et Iverson, 1995). Ils schématisent ce phénomène de la façon suivante (Figure 1, ibid., 124).

Figure 1 - représentation de la distance objective (A.) et de la distance perçue (B.) entre une voyelle prototypique (au centre) et des instances proches (d'après Kuhl et Iverson 1995)

Les cerveaux bilingues semblent comporter deux réseaux phonologiques séparés (Gonzales et Lotto, 2013), qui ne se chevauchent ni ne s’emmêlent – même dans des conditions expérimentales cherchant à provoquer des activations simultanées (Calabria et al., 2018 ; Sulpizio, Del Maschio, Del Mauro et al., 2020). Le « commutateur langagier » (language switch) qui active tel ou tel ensemble de réseaux linguistiques dans un cerveau bilingue relève des noyaux gris centraux, et des lobes du cortex inférieur liés à notre cognition sociale (Sulpizio, Del Maschio, Fedeli et al., 2020). Autrement dit, le cerveau bilingue différencie ses deux langues de façon fonctionnelle (Byers‐Heinlein, 2014).

Dans une étude intéressante – et pour le moment, unique (Pérez et al., 2019) – Alejandro Pérez et ses collègues ont utilisé les nouvelles techniques de l’hyperscanning de cerveaux couplés pour observer l’activation des réseaux sémantiques (chez deux interlocuteurs) en langue maternelle et langue étrangère. Les interactions en L1 ont généré un alignement conceptuel rapide dans les deux cerveaux observés : les réseaux sémantiques activés dans le cerveau de la personne qui parle (les contenus conceptuels de son « message ») « s’allument » quelques centaines de millisecondes plus tard dans celui de la personne qui écoute. Une telle résonance sémantique (Hilton, 2022, 78) n’a pas été constatée par ces chercheurs quand l’interaction avait lieu en langue étrangère (niveau intermédiaire). Les auteurs formulent l’hypothèse qu’un cerveau qui est dans l’incapacité de s’aligner sur les signaux vocaux émis par un interlocuteur ne pourra pas accéder à la résonance sémantique qui caractérise la compréhension du langage.

1.3 Production langagière

Pour la production langagière, les « connaissances » en mémoire sont plutôt des procédures articulatoires : des programmes moteurs hautement coordonnés, d’une même complexité que la motricité fine (qui permet aux humains de dessiner, écrire, coudre, etc.). Plus de 100 muscles sont impliqués dans l’articulation langagière (Tremblay et al., 2016), et les éléments de l’appareil phonatoire qui se trouvent dans notre tête (lèvres, langue, pharynx, mâchoire, etc.), ainsi que les muscles faciaux qui accompagnent l’articulation du discours (autour des yeux, notamment) – sont pilotés directement par six nerfs crâniens du tronc cérébral ; c’est un système moteur se situant à proximité immédiate de l’encéphale (Hilton, 2022, 63). Jacques Mehler et ses associés ont postulé que nous manipulons la parole de façon syllabique et non pas phonémique (Mehler, 2004), et la neuroimagerie récente suggère effectivement qu’il y aurait une procédure musculaire distincte dans le gyrus préfrontal du cortex pariétal pour l’articulation de chaque syllabe de notre L1 (Idsardi et Monahan, 2016). Deux structures infracorticales (cachées sous le cortex), le cervelet et le striatum, sont impliquées dans la coordination et le séquençage de la parole orale, mais leur rôle dans l’articulation n’est pas encore pleinement spécifié (Long et al., 2016).

Pendant l’utilisation interactive du langage, les voies afférentes de la compréhension et les voies efférentes de la production « résonnent » ensemble, notamment lors de la réception du langage. La perception des indices visuels de la parole (mouvements faciaux, de la tête et du buste) déclenche une légère activation des réseaux efférents, qui contribue aux prédictions qui facilitent la compréhension de la parole (Christiansen et Chater, 2016). Les effets des indices visuels de la parole sur notre perception phonologique sont assez forts pour influencer notre perception des informations acoustiques : la perception visuelle d’une bouche articulant la syllabe /ba/, par exemple, empêche le cerveau d’entendre la syllabe /ga/ réellement produite – elle sera perçue sur le plan auditif comme /da/ (McGurk et MacDonald, 1976).

2. Acquisitions phonologiques

2.1 Acquisitions phonologiques en L1

Les catégories perceptives, les schémas et les procédures articulatoires font tous partie du système non-déclaratif de la mémoire – cette composante importante de la mémoire humaine qui regroupe des connaissances difficiles à verbaliser (d’où son nom ; Squire, 1992). Pendant le développement langagier du petit enfant (en L1), l’acquisition des catégories et schémas perceptifs a lieu de façon inconsciente : ce sont des exemples classiques d’apprentissages implicites. Ces trames perceptives sont le résultat de traitements réitérés du langage, grâce aux capacités « statistiques » du cerveau humain : à partir des dizaines de milliers de signaux vocaux perçus chaque jour, le cerveau apprend à reconnaître les éléments appartenant à une même catégorie, malgré une variation importante (comme, par exemple, tous les animaux appartenant à la catégorie « chien »), et à extraire des régularités récurrentes (comme les régularités grammaticales ou les schémas intonatifs de la L1 ; Hilton, 2022, 44‑45). L’enfant apprendra ainsi à reconnaître le phonème /i:/ par-delà les différences de longueur, de volume, de hauteur de la voix (selon le locuteur, la vitesse d’élocution, le contexte phonétique, etc.). L’enfant n’est pas conscient de la structuration neuronale qui a lieu de cette façon ; ces catégories et schémas sont un produit annexe de son utilisation consciente du langage, une sorte d’optimisation des réseaux langagiers, pour des traitements plus efficaces (Conway, 2020).

Du point de vue développemental, les apprentissages phonologiques constituent la base de l’acquisition de notre langue maternelle, commençant avant notre naissance, vers cinq mois de gestation (Fifer et Moon, 1994 ; López-Teijón et al., 2015). Les signaux langagiers entendus par le fœtus sont essentiellement prosodiques (les fréquences hautes restant imperceptibles in utero), et l’organisation neuronale qui a lieu pendant les derniers mois de la gestation doit être fortement influencée par cette composante de la langue parlée par sa mère (Moon, 2017). A la naissance, un enfant reconnaît la voix de sa mère et les intonations caractéristiques de la langue qu’elle parle ; il réagit également au phénomène de voisement/non-voisement (Gervain, 2018, pour un résumé des travaux). Dès huit semaines, le bébé a appris à associer les positions de la bouche avec les sons langagiers entendus (Patterson et Werker, 2003). A la fin de la première année de vie extra-utérine, les réseaux phonologiques du cerveau se sont déjà organisés autour des catégories phonémiques de notre L1, et les cerveaux plus « dédiés » (committed) à ces catégories semblent plus à l’aise dans d’autres domaines de l’acquisition langagière : deux ans plus tard, ces enfants ont des connaissances lexicales et compétences discursives plus développées (Kuhl et al., 2008).

L’apprentissage des gestes fins de l’articulation langagière relève de nos apprentissages sensori-moteurs – une forme d’apprentissage particulier, qui démarre explicitement, et se « rode » implicitement, avec la répétition des mêmes mouvements dans différentes situations (Hilton, 2022, 46‑47). Pendant les 12-14 premiers mois de vie, les enfants consacrent beaucoup de temps et d’énergie à la coordination de l’appareil phonatoire, atteignant l’expertise articulatoire vers l’âge de 6-7 ans, quand le conduit vocal atteint sa configuration mûre.

2.2 Acquisitions phonologiques en langue étrangère et seconde

En acquisition des langues étrangères, l’apprentissage des futures connaissances non-déclaratives (la grammaire, la prosodie réceptive, les catégories phonémiques, la prononciation) est l’un des plus grands défis que les enseignants doivent aider les apprenants à relever (Hilton, 2022, 131‑132). L’acquisition phonologique en L2 (langue étrangère ou seconde ((Une langue seconde fait partie de l’environnement social immédiat de l’enfant ou adulte ; l’apprenant est en contact physique et social direct avec cette langue. Une langue étrangère est apprise dans un contexte où la culture parlant cette langue est physiquement et socialement éloignée de l’apprenant : c’est le cas de la plupart des langues vivantes apprises à l’école. Dans la recherche en acquisition des langues, l’abréviation « L2 » peut référer soit à une langue seconde, soit à une langue étrangère, selon les objets de recherche et les contextes étudiés.))) constitue une zone de résistance notoire : comment altérer les habitudes si enracinées de l’articulation en L1 ? Comment faire acquérir de nouveaux schémas prosodiques ou de nouvelles catégories phonémiques ?

La didactique communicative et actionnelle des langues vivantes (en vigueur dans l’Education nationale en France) ((L’approche dite « actionnelle » est une version de la méthodologie communicative qui est centrée sur la notion de « tâche » ; en anglais, on parle de la Task-Based Communicative Approach (l'expression action-oriented approach est également utilisée dans le CECRL, avec une dimension plus sociale). L’orientation communicative de la didactique des langues en Europe fut déterminée par la Commission culturelle du Conseil de l’Europe, dès son Projet majeur langues vivantes qui a débuté en 1972.)) a eu tendance à minimiser l’importance du travail sur les éléments linguistiques en classe de langue – y compris le système phonologique. Globalement, la méthodologie communicative et actionnelle est caractérisée par une focalisation sur le sens (au lieu des formes linguistiques à apprendre) et sur les compétences communicatives (avec une insistance particulière sur les compétences productives), et par une approche descendante (top-down) des composantes du discours (Hilton, 2022, 123‑125) ((Une « démarche descendante » en compréhension, par exemple, part d’éléments sémantiques (indices visuels comme la mise en page d’un document, ou bruits de fond dans un enregistrement) pour émettre des hypothèses et dégager les grandes lignes d’un discours à comprendre, avant d’inviter les apprenants à focaliser leur attention sur le « signal » linguistique (oral ou écrit). C’était un principe de base dans la « méthode globale » en lecture.)). Ces grandes lignes théoriques ont des retombées importantes pour les pratiques en classe de langue vivante, qui finissent par compliquer les acquisitions phonologiques.

La didactique communicative et actionnelle postule que l’acquisition des composantes formelles s’effectuerait « naturellement » (c’est-à-dire implicitement) lors de l’utilisation communicative de la langue à apprendre, à l’instar de ce qui semble se passer chez les jeunes enfants en L1 (Krashen, 1981), si bien que certains enseignants ont pu se demander si « l’enseignement de la grammaire et du lexique étaient désormais interdits » (Taylor et Manès-Bonnisseau, 2018, 8) ((La version de l’approche communicative utilisée en France jusqu’aux années 2000 ménageait une place importante à l’activité méta-grammaticale sous la forme de « PRL » (pratique raisonnée de la langue ; Ministère de l’Education Nationale, 1987))).

Quand il y a une focalisation sur les composantes linguistiques du discours dans les classes actionnelles, le travail se fait à partir d’éléments de grande taille – un texte, un discours ou un « acte de parole » – plutôt que d’unités linguistiques telles que le mot, le morphème, la syllabe ou le phonème. Le fait d’« isoler » des éléments linguistiques de leur « contexte » discursif est considéré comme incompatible avec un apprentissage visant la compétence communicative : « les savoirs linguistiques ne s’acquièrent pas hors contexte » (Ministère de l’Education Nationale, 2010, 4) ; il ne faut pas faire de la « phonétique ‘hors sol’ » (sans référence à un discours authentique ; Bourguignon, 2006, 60; Pinéda, 2017, 62‑63). Enfin, les approches communicatives et actionnelles mettant l’accent sur l’activité communicative, elles ont tendance à privilégier la production et l’interaction – puisqu’il est plus facile d’observer et analyser le discours produit que la reconstruction (invisible) du sens lors de la compréhension. De ce fait, quand les classes actionnelles abordent le système phonologique d’une langue étrangère, le travail porte essentiellement sur la prononciation – l’articulation des sons, et non pas leur perception. Et la politique plurilingue européenne ((Qui valorise toutes les langues utilisées par l’individu, quel que soit son niveau de compétence dans les différentes activités langagières (Conseil de l’Europe, 2001, 15).)) mène certains didacticiens à souligner la nature identitaire de l’« accent étranger » en L2 ; l’acquisition du système sonore de la L2 n’est pas considérée comme indispensable (Pérez Cañado, 2021).

Il faut souligner la nature incomplète et même erronée de certains de ces principes méthodologiques, le problème de base de la méthodologie communicative étant sa vision réductrice des acquisitions langagières (Hilton, 2022, 125‑130). L’apprentissage d’une L1 n’est ni rapide ni totalement implicite ; il se réalise grâce à une exposition illimitée à cette langue, et à l’utilisation d’une variante adaptée aux connaissances linguistiques émergentes et aux stades développementaux de l’enfant (Snow, 1977). Or, dans une classe de langue étrangère, le temps d’exposition à la langue à apprendre est très réduit, et dans une classe communicative, les grands blocs discursifs qui sont entendus comportent trop de formes variées pour permettre au cerveau « statistique » des apprenants d’extrapoler les catégories phonémiques ou les schémas prosodiques de cette langue (Hilton, 2022, 128‑129). Un même problème est constaté pour des adultes apprenant une langue seconde en contexte immersif : leur attention est focalisée sur le sens, et le signal linguistique est trop complexe pour que toutes les catégories phonémiques émergent pour la L2 (Iverson et al., 2012). Même si l’importance d’un « bon accent » peut être débattue en fonction des objectifs de chaque apprenant pour la production orale en L2, la capacité à capter les sons et les contours de cette langue semble être essentielle à toute activité de compréhension et d’interaction (selon les travaux d’hyperscanning résumés ci-dessus). Nous avons également vu que cette capacité semble contribuer à la qualité des acquisitions lexicales ou grammaticales en L1 – et pourrait donc contribuer fortement aux apprentissages en L2 seconde ou étrangère (Hilton, 2022, 154-155). Les réseaux neuronaux de la phonologie réceptive et productive résonnant ensemble, il est très important de ne pas limiter les activités d’apprentissage à un travail exclusivement productif et articulatoire.

3. Vers une didactique phonologique décomplexée et plus efficace

Depuis plus de vingt ans, la recherche internationale en didactique et en acquisition des langues a conclu à l’importance d’activités de « focalisation sur la forme » (Doughty et Williams, 1998), pour renforcer les apprentissages linguistiques au sein d’une méthodologie qui reste communicative (Swan, 1985; VanPatten et Cadierno, 1993). Pour renforcer l’acquisition phonologique, il est nécessaire de concevoir des activités qui focalisent l’attention des apprenants sur les catégories ou les schémas à acquérir, et très important d’inclure des entraînements réceptifs. L’articulation de notre L1 est si rodée, si automatique, qu’un travail méta-articulatoire peut également renforcer les apprentissages productifs (Messum et Young, 2021).

Dans les paragraphes qui suivent, nous allons décrire une démarche développée en contexte expérimental, qui se prête bien au contexte éducatif, et qui semble renforcer les apprentissages phonémiques. Nous aimerions ainsi montrer que même dans le cadre d’un enseignement focalisé sur le sens, il est possible (et utile) de prendre pour cible des éléments discrets (extraits d’un contexte discursif) et qui ne sont pas porteurs de sens en eux-mêmes, mais qui permettront ensuite l’accès au sens, en compréhension puis en production. Les questions didactiques auxquelles nous tenterons de répondre sont les suivantes :

  • Est-ce qu’un entraînement hors contexte sur les phonèmes de l’anglais sans avoir à se focaliser sur le sens peut aider à la création de nouvelles catégories phonémiques ?
  • Est-ce qu’un entraînement en réception peut avoir un effet en production ?
  • Est-ce que les effets de cet entraînement décontextualisé pourront être transférés en contexte signifiant ?

3.1 Entraînement perceptif à haute variabilité

Commençons par rappeler les contours des difficultés perceptives des apprenants. Comme nous l’avons vu plus haut, notre espace perceptif s’est spécialisé pour notre L1, ce qui permet une perception rapide et robuste par l’utilisation d’indices fiables (les catégories récurrentes) qui ont été repérés suite à une exposition massive à cette langue. Une fois les catégories phonémiques en place, il n’y a pas besoin d’attention pour le décodage des sons et l’attention peut se porter sur le sens du message lors de l’écoute. En L2, le défi est de « reprogrammer » nos réseaux perceptifs, afin de ne pas être pris au piège par les routines optimisées pour les catégories phonémiques de notre L1, qui nous amènent à négliger les différences entre des phonèmes distincts en L2, mais qui appartiennent à la même catégorie en L1. L’exemple classique en anglais L2 pour des francophones L1 est la difficulté, confirmée par de nombreuses études, à percevoir et produire la différence entre les phonèmes /i:/ et /ɪ/, tous les deux assimilés au /i/ français.

On sait que les auditeurs L2 sont capables d’entendre ces différences dans des tâches simples (par exemple dans un exercice de discrimination où ils doivent décider si deux mots ou pseudo-mots prononcés par la même voix sont identiques ou différents ; Dupoux et al., 1997, expérience 4). Ils travaillent alors, selon Strange (2011) en mode « phonétique » (qualifié aussi de « prélexical » chez Melnik et Peperkamp, 2021), c’est-à-dire focalisé uniquement sur la tâche de détection de la différence. Mais comme cette détection n’est pas automatique, ni effectuée à partir d’indices fiables, il leur est difficile de porter en même temps leur attention sur le sens, ce qui explique pourquoi ils n’arrivent pas forcément à passer au mode « phonologique », par exemple en identifiant correctement le membre d’une paire minimale (ship or sheep) qu’ils ont entendu, ou en décidant si le mot entendu existe (*usband). Cette difficulté peut également être due, d’après Melnik et Peperkamp (2021), à une représentation phonologique en mémoire du mot à reconnaître inexacte ou imprécise.

Pour essayer de montrer qu’un entraînement perceptif peut aider à passer du mode « phonétique » au mode « phonologique », et du « prélexical » au « lexical » -- en d’autres termes qu’un entraînement sur des unités dénuées de sens peut ensuite aider à mieux accéder à ce dernier – nous allons présenter le paradigme d’entraînement appelé High Variability Phonetic (ou perceptual) Training (HVPT), qu’on peut traduire en français par « entraînement perceptif à haute variabilité » (EPHV). Nous décrirons les résultats d’études ayant utilisé ce paradigme avec des apprenants francophones de L2 anglais (même s’il existe beaucoup d’études utilisant l’EPHV avec d’autres langues cibles que l’anglais, nous n’en avons trouvé aucune où la L1 était le français). Afin d’aider à la création de nouvelles catégories phonémiques en L2, l’EPHV présente les caractéristiques suivantes :

  • Exposition importante : une nouvelle catégorie phonémique ne peut pas être créée à partir d’une poignée d’exemplaires, puisque l’extraction de régularités récurrentes dépend de l’utilisation de nos capacités d’apprentissage statistique portant nécessairement sur beaucoup de données ;
  • Variabilité : si on utilise une seule voix ou un seul contexte, l’auditeur pourra s’attacher à des indices qui ne sont valables que pour cette voix ou ce contexte (par exemple, on pourra trop s’attacher à la longueur d’une voyelle parce qu’elle a été uniquement entendue suivie d’une consonne voisée).

Cependant, ces deux premières caractéristiques ne sont pas suffisantes, puisque les apprenants en contexte de langue seconde n’arrivent pas forcément à créer de catégories phonémiques nouvelles dans leur L2, bien qu’ils soient exposés à beaucoup d'exemplaires dans des contextes variés puisqu’ils sont en immersion dans cette langue. Il faut donc ajouter une dernière caractéristique :

  • Systématicité (focalisation de l’attention, et retour sur erreur ou feedback) : les exercices ont lieu dans un environnement qui focalise l’attention sur les contrastes à acquérir, contrairement au contexte naturaliste d’acquisition (immersion en L2). En particulier, il n’y a pas de traitement simultané du sens, ni d’interaction, ce qui libère de l’attention pour le travail sur le signal sonore. Une correction est donnée après chaque réponse.

Un entraînement EPHV utilise un grand nombre de stimuli oraux (qui peuvent être des mots ou des non-mots) produits par plusieurs locuteurs ; les séances de travail sont réparties en courtes sessions espacées de quelques jours, et totalisent plusieurs heures. Deux sortes de tâches sont proposées : la discrimination (en général, les auditeurs doivent trouver l’intrus parmi trois propositions) et l’identification, dont les figures 1 et 2 montrent deux variantes.

Figure 2 - Exemple d'écran EPHV (Krzonowski, 2020, 71)

La première tâche d’identification (figure 1) porte sur la distinction entre /æ/ et /ʌ/ en anglais. Les options de réponse à l’écran proposent deux symboles phonétiques, chacun étant accompagné d’un mot exemple très fréquent contenant le phonème correspondant. Cela permet d’encourager le travail au niveau phonologique, puisqu’il ne s’agit pas simplement d’entendre la différence entre 2 ou 3 stimuli, mais bien d’associer la voyelle entendue à un symbole abstrait, ou de la classer sous la même étiquette que celle d’un autre mot connu.

Dans la deuxième figure rassemblant trois écrans différents dans trois langues (figure 2), les options de réponse sont des représentations orthographiques possibles du mot existant entendu (en espagnol, la cible est l’accent lexical ; en japonais, la distinction entre les voyelles /i/ et /e/, et en français, entre /y/ et /u/). Même si les représentations orthographiques qui apparaissent à l’écran sont lexicales, les apprenants peuvent accomplir la tâche sans faire appel au sens des mots correspondants (donc sans « accès lexical »). Cette tâche est ainsi considérée comme étant « pré-lexicale » : elle peut être accomplie même sans familiarité avec les mots présentés. Cependant, la connaissance des correspondances graphème-phonème est nécessaire, et elle s’éloigne en cela des tâches EPHV classiques (même si certains chercheurs soulignent qu’elle peut permettre en même temps d’acquérir ou d’améliorer la connaissance de ces correspondances, Iverson et al., 2012).

Figure 3 - Trois exemples d'écrans EPHV en espagnol, japonais et français avec options de réponse orthographique (Reaves et al., 2022)

3.2 Conclusions de la recherche sur les entraînements réceptifs

Le paradigme EPHV a été créé dans les années 1990 pour aider les apprenants japonophones de l’anglais à entendre et produire la différence entre /l/ et /r/ (Lively et al., 1993). Il a ensuite été étendu à d’autres L1 et L2, et a fait l’objet de nombreuses études. Sa relative simplicité en fait un bon candidat pour une utilisation dans des contextes scolaires (Thomson, 2018). Nous présenterons ici les résultats de trois études assez récentes portant sur l’acquisition des phonèmes de l’anglais par des francophones : Iverson et al. (2012), Krzonowski et al. (2016), et Melnik et Peperkamp (2021). Les 36 participants de Iverson et al. (2012) (dont 21 de niveau élémentaire résidant en France, et 15 de niveau intermédiaire-avancé résidant en Angleterre) ont été soumis à 8 sessions d’entraînement de 45 minutes sur toutes les voyelles de l’anglais britannique standard sur une période de deux semaines environ. Chez Krzonowski et al. (2016), 16 étudiants inscrits en première année de licence d’anglais ont reçu 5 séances d’entraînement d’une heure maximum, portant sur 5 voyelles (/i:/, /ɪ/, /æ/, /ʌ/ et /ɑ:/). Enfin, Melnik et Peperkamp (2021) ont étudié l’effet de 8 sessions d’entraînement espacées d’un ou deux jours sur l’acquisition du /h/ initial de l’anglais chez 24 étudiants francophones de niveau intermédiaire.

Dans les trois cas, les participants améliorent leur perception des sons ou contrastes cibles. Chez Melnik et Peperkamp (2021), l’identification de la présence ou de l’absence du /h/ en début de mot progresse de façon importante (passant de 67% à 80% de bonnes réponses environ), et cette progression est conservée dans un post-test différé quatre mois après la fin des entraînements, y compris pour des non-mots qui n’avaient pas été entendus. De même, les participants de Krzonowski et al. (2016) améliorent leur identification de toutes les voyelles testées, ainsi que la discrimination des paires minimales correspondantes (/i:/ - /ɪ/, /æ/- /ʌ/ et /ɑ:/ - /ʌ/). Chez Iverson et al. (2012), les apprenants intermédiaires s’améliorent en identification de toutes les voyelles anglaises (même si les résultats pour la discrimination des paires minimales sont moindres, et plus contrastés – la discrimination entre /i:/ et /ɪ/, par exemple, n’est pas meilleure après entraînement). Nous pouvons donc répondre par l’affirmative à notre première question, qui était de savoir si un entraînement EPVH améliore effectivement les capacités d’identification des phonèmes de l’anglais (ici, les voyelles et la consonne initiale /h/).

Deux de ces études examinent aussi la production, et montrent qu’elle progresse également suite à l’EPHV. Iverson et al. (2012) constatent un effet significatif sur 3 voyelles : /i:/, /eɪ/, and /aʊ/. Krzonowski et ses collègues observent également une amélioration de la production des voyelles. L’entraînement en perception a donc bien un effet sur la production, même si cet effet est plus limité que celui sur la perception elle-même. Des études antérieures sur l’acquisition des voyelles de l’anglais (par ex. Thomson, 2011, avec des L1 mandarin) avaient déjà mis en évidence un effet en production.

Enfin, Melnik et Peperkamp (2021) ont cherché à savoir si le travail de catégorisation des sons entendus pouvait avoir un effet sur la reconnaissance lexicale. Entre le prétest et le post-test, le pourcentage de mots avec ou sans /h/ initial correctement reconnus (husband, officer) passe de 81 à 87%, et celui de non-mots correctement rejetés (*usband, *hofficer) de 32 à 60%. L’entraînement EPHV a donc permis à ces participants francophones d’améliorer leur capacité à réaliser une tâche au niveau lexical et pas uniquement pré-lexical. Ce résultat était d’ailleurs toujours valable lors du post-test différé, quatre mois plus tard. La réponse à notre dernière question est donc également positive : les effets d’un entraînement décontextualisé (entraînement systématique sur la perception du /h/, sans avoir besoin de s’occuper du sens – le travail EPHV portant essentiellement sur des non-mots) peuvent être transférés en contexte signifiant, lors de la reconnaissance de mots fréquents.

Conclusion et perspectives

Dans cet article, nous avons commencé par décrire les résultats de la recherche en sciences cognitives qui montrent le rôle central des acquisitions phonologiques dans le développement langagier. Nous avons vu à quel point ces acquisitions sont sous-tendues par une exposition massive à la langue maternelle et aboutissent à une spécialisation du cerveau pour son traitement ((Patricia Kuhl dit à ce sujet que nous sommes language-bound, ou « prisonniers de notre langue maternelle » (Kuhl, 1993) ; n’oublions pas que la structuration du cerveau autour de ce système phonologique commence même avant la naissance.)). Lors de l’acquisition d’une langue étrangère, la quantité insuffisante d’exposition et l’existence d’automatismes acquis pour la L1 non adaptés à la L2 conduisent à proposer des entraînements systématiques qui focalisent l’attention des apprenants de langue sur les segments ou contrastes à acquérir, et les libèrent de l’attention concomitante au sens et aux enjeux communicatifs.

Nous focalisant sur une seule démarche – à titre d'exemple – nous avons présenté le paradigme d’« entraînement perceptif à haute variabilité » (EPHV, ou, en anglais, HVPT – High Variability Perceptual Training) qui aide les auditeurs à créer de nouvelles catégories phonémiques en L2, et a des effets non seulement en perception, mais aussi en production. Un des reproches souvent fait à ce genre d’entraînement, en particulier dans le cadre d’une didactique communicative, est l’absence supposée de transfert à des contextes signifiants ((Ce reproche est souvent fait aux entraînements décontextualisés en éducation, mais ne correspond pas aux résultats empiriques en psychologie cognitive (Anderson et al., 1996).))

Nous avons au contraire montré que l’EPHV, qui propose un entraînement focalisé uniquement sur le niveau pré-lexical (travail sur la forme orale des mots ou pseudo-mots sans avoir besoin d’accéder à leur sens), a un effet au niveau lexical, lors d’une tâche de reconnaissance de mots. Il a donc tout à fait sa place dans un cadre communicatif et actionnel, en contribuant à l’automatisation du traitement de la forme afin de (par la suite) libérer de l’attention pour se focaliser sur le traitement du sens.

Cet entraînement systématique, qui a montré son efficacité dans des expériences contrôlées (essentiellement en laboratoire), commence à être utilisé dans des contextes d’enseignement supérieur (Reaves et al., 2022). Il reste cependant à expérimenter son utilisation dans un contexte d'enseignement secondaire. Les participants des trois expériences que nous avons décrites sont de jeunes adultes, mais d’autres études EPHV ont testé le paradigme avec des enfants et ont également obtenu des résultats probants (Shum et al., 2021). Il est donc tout à fait possible d’envisager la mise en œuvre de ce paradigme avec des collégiens ou des lycéens, sans doute en dehors de la classe – ou en laboratoire numérique – afin que chaque apprenant travaille individuellement.

Notes

Bibliographie

ANDERSON, John R., REDER, Lynne M. et SIMON, Herbert A. 1996. « Situated Learning and Education », Educational Researcher, volume 25, n°4, pp.5‑11, https://doi.org/10.3102/0013189X025004005

BARTLETT, Edward L. 2013. « The organization and physiology of the auditory thalamus and its role in processing acoustic features important for speech perception », Brain and language, volume 126, n°1, pp.29‑48, https://doi.org/10.1016/j.bandl.2013.03.003

BERGER, Hans. 1929. « Über das Elektrenkephalogramm des Menschen », Archiv für Psychiatrie und Nervenkrankheiten, volume 87, n°1, pp.527‑570, https://doi.org/10.1007/BF01797193

BOURGUIGNON, Claire. 2006. « De l’approche communicative à l’approche communic’actionnelle : Une rupture épistémologique en didactique des langues-cultures », Synergie Europe, n°1, pp.58‑73.

BYERS‐HEINLEIN, Krista. 2014. « Languages as categories : Reframing the ‘one language or two’ question in early bilingual development », Language Learning, volume 64, n°Suppl 2, pp.184‑201. https://doi.org/10.1111/lang.12055

CALABRIA, Marco, COSTA, Aalbert, GREEN, David W. et ABUTALEBI, Jubin. 2018. « Neural basis of bilingual language control », Annals of the New York Academy of Sciences, volume 1426, n°1, pp.221‑235. https://doi.org/10.1111/nyas.13879

CHRISTIANSEN, Morten H. et CHATER, Nick. 2016. « The Now-or-Never bottleneck: A fundamental constraint on language », Behavioral and Brain Sciences, volume 39, p.e62. https://doi.org/10.1017/S0140525X1500031X

CONSEIL DE L’EUROPE. 2001. Cadre européen commun de référence pour les langues : Apprendre, enseigner, évaluer (1ère éd.). Paris : Editions Didier.

CONWAY, Christopher M. 2020. « How does the brain learn environmental structure? Ten core principles for understanding the neurocognitive mechanisms of statistical learning », Neuroscience & Biobehavioral Reviews, volume 112, pp.279‑299. https://doi.org/10.1016/j.neubiorev.2020.01.032

CUTLER, Anne et CLIFTON, Charles Jr. 1999. « Comprehending spoken language: A blueprint of the listener », in Colin M. Brown et Peter Hagoort (éds.), The neurocognition of language. Oxford : Oxford University Press, pp.123‑166.

DOUGHTY, Catherine J. et WILLIAMS, Jessica (éds.). 1998. Focus on form in classroom second language acquisition. Cambridge : Cambridge University Press.

DUPOUX, Emmanuel, PALLIER, Christophe, SEBASTIAN, Nuria et MEHLER, Jacques. 1997. « A Destressing ‘Deafness’ in French? », Journal of Memory and Language, volume 36, n°3, pp.406‑421. https://doi.org/10.1006/jmla.1996.2500

FERRARI, Marco et QUARESIMA, Valentina. 2012. « A brief review on the history of human functional near-infrared spectroscopy (fNIRS) development and fields of application », NeuroImage, volume 63, n°2, pp.921‑935. https://doi.org/10.1016/j.neuroimage.2012.03.049

FIFER, W. P. et MOON, C. M. 1994. « The role of mother’s voice in the organization of brain function in the newborn », Acta Paediatrica Supplement, volume 397, pp.86‑93. https://doi.org/10.1111/j.1651-2227.1994.tb13270.x

GERNSBACHER, Morton Ann et KASCHAK, Michael P. 2003. « Neuroimaging studies of language production and comprehension », Annual Review of Psychology, volume 54, pp.91‑114. https://doi.org/10.1146/annurev.psych.54.101601.145128

GERVAIN, Judit. 2018. « The role of prenatal experience in language development », Current Opinion in Behavioral Sciences, volume 21, pp.62‑67. https://doi.org/10.1016/j.cobeha.2018.02.004

GESCHWIND, Norman. 1980. « Neurological Knowledge and Complex Behaviors », Cognitive Science, volume 4, n°2, pp.185‑193. https://doi.org/10.1207/s15516709cog0402_3.

GONZALES, Kalim et LOTTO, Andrew J. 2013. « A Bafri, un Pafri: Bilinguals’ Pseudoword Identifications Support Language-Specific Phonetic Systems », Psychological Science, volume 24, n°11, pp.2135‑2142. https://doi.org/10.1177/0956797613486485

HAGOORT, Peter. 2005. « On Broca, brain, and binding: A new framework », Trends in Cognitive Sciences, volume 9, n°9, pp.416‑423. https://doi.org/10.1016/j.tics.2005.07.004

---. 2016. « MUC (Memory, Unification, Control) : A Model on the Neurobiology of Language Beyond Single Word Processing », in Gregory Hickok et Steven L. Small (éds.), Neurobiology of Language. Academic Press, pp.339‑347. https://doi.org/10.1016/B978-0-12-407794-2.00028-6

HASSON, Uri, GHAZANFAR, Asif A., GALANTUCCI, Bruno, GARROD, Simon et KEYSERS, Christian. 2012. « Brain-to-Brain coupling: A mechanism for creating and sharing a social world », Trends in Cognitive Sciences, volume 16, n°2, pp.114‑121. https://doi.org/10.1016/j.tics.2011.12.007

HILTON, Heather. 2022. Enseigner les langues avec l’apport des sciences cognitives. Paris : Hachette Éducation.

HUTH, Alexander G., DE HEER, Wendy A., GRIFFITHS, Thomas L., THEUNISSEN, Frédéric E. et GALLANT, Jacques L. 2016. « Natural speech reveals the semantic maps that tile human cerebral cortex », Nature, volume 532, n°7600, Article 7600. https://doi.org/10.1038/nature17637

IDSARDI, William J. et MONAHAN, Philip J. 2016. « Phonology », in Gregory Hickok et Steven. L. Small (éds.), Neurobiology of language. Academic Press, pp.141‑151. https://www.sciencedirect.com/science/article/pii/B9780124077942000122

IVERSON, Paul, PINET, Melanie et EVANS, Bronwen G. 2012. « Auditory training for experienced and inexperienced second-language learners: Native French speakers learning English vowels », Applied Psycholinguistics, volume 33, n°1, pp.145‑160. https://doi.org/10.1017/S0142716411000300

JOUANNAUD, Marie-Pierre. 2021. Diagnostic et remédiation orientés vers le lexique en compréhension aurale de l’anglais. Thèse de doctorat, sous la direction de Heather Hilton, Université Lyon 2.

KRASHEN, Stephen D. 1981. Second language acquisition and second language learning (Reprinted). Oxford : Pergamon Press.

KRZONOWSKI, Jennifer. 2020. Perception et production de monophtongues de l’anglais par des apprenants francophones : Effets d’entraînements en perception et en production, Thèse de doctorat, sous la direction de François Pellegrino, Université de Lyon. https://tel.archives-ouvertes.fr/tel-03048439

KRZONOWSKI, Jennifer, FERRAGNE, Emmanuel et PELLEGRINO, François. 2016. « Perception et production de voyelles de l’anglais par des apprenants francophones : Effet d’entraînements en perception et en production », Journées d’Études sur la Parole. https://hal.archives-ouvertes.fr/hal-01485744

KUHL, Patricia K. 1993. « Early linguistic experience and phonetic perception: Implications for theories of developmental speech perception », Journal of Phonetics, volume 21, n°1‑2, pp.125‑139.

KUHL, Patricia K., CONBOY, Barbara T., COFFEY-CORINA, Sharon, PADDEN, Denise, RIVERA-GAXIOLA, Maritza et NELSON, Tobey. 2008. « Phonetic learning as a pathway to language: New data and native language magnet theory expanded (NLM-e) », Philosophical Transactions of the Royal Society B: Biological Sciences, volume 363, n°1493, pp.979‑1000. https://doi.org/10.1098/rstb.2007.2154

KUHL, Patricia K., et IVERSON, Paul. 1995. « Linguistic experience and the ‘perceptual magnet effect’ », in Winifred Strange (éd.), Speech perception and linguistic experience: Issues in cross-language research. Baltimore : York Press, pp.121‑154. http://discovery.ucl.ac.uk/23733/

LEVELT, Willem J. M. 1989. Speaking: From intention to articulation. Cambridge, MA : The MIT Press.

---. 1999. « Producing spoken language: A blueprint of the speaker », in Colin M. Brown et Peter Hagoort (éds.), The neurocognition of language. Oxford : Oxford University Press, pp.83‑122. https://hdl.handle.net/11858/00-001M-0000-0013-44B7-4

LIVELY, Scott E., LOGAN, John S. et PISONI, David B. 1993. « Training Japanese listeners to identify English /r/ and /l/. II: The role of phonetic environment and talker variability in learning new perceptual categories », The Journal of the Acoustical Society of America, volume 94, n°3 Pt 1, pp.1242‑1255. https://doi.org/10.1121/1.408177

LONG, Michael A., KATLOWITZ, Kalman A., SVIRSKY, Mario A., CLARY, Rachel C., BYUN, Tara M., MAJAJ, Najib, OYA, Hiroyuki, HOWARD, Matthew A. et GREENLEE, Jeremy D. W. 2016. « Functional Segregation of Cortical Regions Underlying Speech Timing and Articulation », Neuron, volume 89, n°6, pp.1187‑1193. https://doi.org/10.1016/j.neuron.2016.01.032

LOPEZ-TEIJON, Marisa, GARCIA-FAURA, Álex et PRATS-GALINO, Alberto. 2015. « Fetal facial expression in response to intravaginal music emission », Ultrasound: Journal of the British Medical Ultrasound Society, volume 23, n°4, pp.216‑223. https://doi.org/10.1177/1742271X15609367

MCGURK, Harry et MACDONALD, John. 1976. « Hearing lips and seeing voices », Nature, volume 264, n°5588. https://doi.org/10.1038/264746a0

MECARELLI, Oriano. 2019. « Past, Present and Future of the EEG », in Oriano Mecarelli (éd.), Clinical Electroencephalography. Cham, Suisse : Springer International Publishing, pp.3‑8. https://doi.org/10.1007/978-3-030-04573-9_1

MEHLER, Jacques. 2004, novembre 6. Syllable tiers are important for parsing: Consonantal tiers are not. Journée en l’Honneur de Juan Segui, Université René Descartes.

MELNIK, Gerda A. et PEPERKAMP, Sharon. 2021. « High-Variability Phonetic Training enhances second language lexical processing: Evidence from online training of French learners of English », Bilingualism: Language and Cognition, volume 24, n°3, pp.497‑506. https://doi.org/10.1017/S1366728920000644

MESGARANI, Nima, CHEUNG, Connie, JOHNSON, Keith et CHANG, Edward F. 2014. « Phonetic feature encoding in human superior temporal gyrus », Science, volume 343, n°6174, pp.1006‑1010. https://doi.org/10.1126/science.1245994

MESSUM, Piers et YOUNG, Roslyn. 2021. « Teaching Students to Pronounce English: A Motor Skill Approach in the Classroom », RELC Journal, volume 52, n°1, pp.169‑178. https://doi.org/10.1177/0033688220964107

MINISTERE DE L’EDUCATION NATIONALE. 1987. Bulletin officiel spécial n°3 du 9 juillet 1987—Compléments de programme de la classe de seconde des lycées.

MINISTERE DE L’EDUCATION NATIONALE. 2010. Bulletin officiel spécial n° 4 du 29 avril 2010—Programme d’enseignement des langues vivantes en classe de seconde générale et technologique.

MOON, Christine. 2017. « Prenatal experience with the maternal voice », in Manuela Filippa, Pierre Kuhn et Björn Westrup (éds.), Early vocal contact and preterm infant brain development: Bridging the gaps between research and practice. Cham, Suisse : Springer International Publishing, pp.25‑37. https://doi.org/10.1007/978-3-319-65077-7_2

OGAWA, S., LEE, T. M., KAY, A. R. et TANK, D. W. 1990. « Brain magnetic resonance imaging with contrast dependent on blood oxygenation », Proceedings of the National Academy of Sciences of the United States of America, volume 87, n°24, pp.9868‑9872.

PATTERSON, Michelle L. et WERKER, Janet F. 2003. « Two-month-old infants match phonetic information in lips and voice », Developmental Science, volume 6, n°2, pp.191‑196. https://doi.org/10.1111/1467-7687.00271

PÉREZ, Alejandro, DUMAS, Guillaume, KARADAG, Melek et DUÑABEITIA, Jon A. 2019. « Differential brain-to-brain entrainment while speaking and listening in native and foreign languages », Cortex, volume 111, pp.303‑315. https://doi.org/10.1016/j.cortex.2018.11.026

PÉREZ CAÑADO, María L. 2021. « CLIL and ELF : Friends or Foes? » in María L. Pérez Cañado (éd.), Content and Language Integrated Learning in Monolingual Settings : New Insights from the Spanish Context. Cham : Springer International Publishing, pp.31‑51. https://doi.org/10.1007/978-3-030-68329-0_3

PINÉDA, Anne-Isabelle. 2017. La didactique au CAPES d’anglais—Préparation aux 2 épreuves d’admission. Paris : Ophrys.

RAMOS NUÑEZ, Aurora I., YUE, Qiuhai, PASALAR, Siavash et MARTIN, Randi C. 2020. « The role of left vs. right superior temporal gyrus in speech perception: An fMRI-guided TMS study », Brain and Language, volume 209, p.104838. https://doi.org/10.1016/j.bandl.2020.104838

REAVES, Alisha, DAIDONE, Danielle, LIDSTER, Ryan, BONGIOVANNI, Silvina, KOJIMA, Chisato et ROOT, Jamie. 2022 (mars). High variability phonetic training (HVPT) in the classroom: Student and teacher perceptions and lessons learned. AAAL, Pittsburgh, PA.

SHUM, Kathy K., AU, Terry K., ROMO, Laura F. et JUN, Sun-Ah. 2021. « Learning Challenging L2 Sounds Via Computer Training: High-Variability Perceptual Training for Children and Adults », Language Learning and Development, volume 17, n°4, pp.327‑342. https://doi.org/10.1080/15475441.2021.1876699

SNOW, Catherine E. 1977. « Mothers’ Speech Research: From Input to Interaction », in Catherine E. Snow et Charles A. Ferguson (éds.), Talking to Children. Cambridge : Cambridge University Press, pp.31‑49.

SQUIRE, Larry R. 1992. « Declarative and nondeclarative memory: Multiple brain systems supporting learning and memory », Journal of Cognitive Neuroscience, volume 4, n°3, pp.232‑243. https://doi.org/10.1162/jocn.1992.4.3.232

STRANGE, Winifred. 2011. « Automatic selective perception (ASP) of first and second language speech: A working model », Journal of Phonetics, volume 39, n°4, pp.456‑466. https://doi.org/10.1016/j.wocn.2010.09.001

SULPIZIO, Simone, DEL MASCHIO, Nicola, DEL MAURO, Gianpolo, FEDELI, Davide et ABUTALEBI, Jubin. 2020. « Bilingualism as a gradient measure modulates functional connectivity of language and control networks », NeuroImage, volume 205, p.116306. https://doi.org/10.1016/j.neuroimage.2019.116306

SULPIZIO, Simone, DEL MASCHIO, Nicola, FEDELI, Davide et ABUTALEBI, Jubin. 2020. « Bilingual language processing: A meta-analysis of functional neuroimaging studies », Neuroscience & Biobehavioral Reviews, volume 108, pp.834‑853. https://doi.org/10.1016/j.neubiorev.2019.12.014

SWAN, Michael. 1985. « A Critical Look at the Communicative Approach (2) », ELT Journal, volume 39, n°2, pp.76‑87.

TAYLOR, Alex, et MANES-BONNISSEAU, Chantal. 2018. Propositions pour une meilleure maîtrise des langues vivantes étrangères : Oser dire le nouveau monde. Ministère de l’Éducation Nationale.

THOMSON, Ron I. 2011. « Computer Assisted Pronunciation Training: Targeting Second Language Vowel Perception Improves Pronunciation », CALICO Journal, volume 28, n°3, pp.744‑765.

---. 2018. « High Variability [Pronunciation] Training (HVPT): A proven technique about which every language teacher and learner ought to know », Journal of Second Language Pronunciation, volume 4, n°2, pp.208‑231. https://doi.org/10.1075/jslp.17038.tho

TREMBLAY, Pascale, DESCHAMPS, Isabelle et GRACCO, Vincent L. 2016. « Neurobiology of Speech Production: A Motor Control Perspective », in Gregory Hickok et Steven L. Small (éds.), Neurobiology of Language. Cambridge, MA : Academic Press, pp.741‑750. https://doi.org/10.1016/B978-0-12-407794-2.00059-6

VANPATTEN, Bill et CADIERNO, Teresa. 1993. « Input Processing and Second Language Acquisition: A Role for Instruction », The Modern Language Journal, volume 77, n°1, pp.45‑57. https://doi.org/10.1111/j.1540-4781.1993.tb01944.x

WARRINGTON, Elizabeth K. 1975. « The Selective Impairment of Semantic Memory », Quarterly Journal of Experimental Psychology, volume 27, n°4, pp.635‑657. https://doi.org/10.1080/14640747508400525

WERNICKE, Carl. 1974. Der aphasische Symptomenkomplex. Berlin : Springer. https://doi.org/10.1007/978-3-642-65950-8

Pour citer cette ressource :

Heather Hilton, Marie-Pierre Jouannaud, La prononciation en (anglais) L2 : perspectives cognitives et questions de fond pour une didactique focalisée sur "le sens", La Clé des Langues [en ligne], Lyon, ENS de LYON/DGESCO (ISSN 2107-7029), décembre 2024. Consulté le 18/12/2024. URL: https://cle.ens-lyon.fr/anglais/langue/la-prononciation-en-anglais-l2-perspectives-cognitives-et-questions-de-fond-pour-une-didactique-focalisee-sur-le-sens

Sommaire du dossier

Introduction, Olivier Glain, Léo Clerc, Christophe Coupé-Jamet, Anne Przewozny-Desriaux et Julie Rouaud

Ritualiser la pratique de la phonologie en anglais au collège ? Bilan d’une expérience réalisée en classe de 6e, Olivier Divin

Intégrer l’objectif phonologique dans la quête du sens à l’oral en anglais, Frank Bardol et Daniel Petit

Efficacité d'une méthode de phonologie incarnée pour des apprenants au collège : Le projet PAC-PICL!, Julie Rouaud, Nathalie Huet, Anne Przewozny-Desriaux, Cécile Baron et Murièle Barou 

Réflexion sur la place de l’hésitation dans un corpus oral d’apprenants en anglais LANSAD et perspectives didactiques pour l’enseignement-apprentissage des compétences prosodiques, Léo Clerc

La prononciation en (anglais) L2 : perspectives cognitives et questions de fond pour une didactique focalisée sur "le sens", Heather Hilton et Marie-Pierre Jouannaud

Quand l’accent standard n’est pas le plus facile à comprendre, Kizzi Edensor-Costille

Choisir un accent en classe d’anglais : que disent les textes officiels ?, Dylan Michari

Retour d’expérience sur le projet Solutions pour l’Enseignement de la Phonétique Appliquée aux Langues Etrangères (SEPALE), Emmanuel Ferragne, Anne Guyot Talbot, Sylvain Navarro et Francesca Sanvicente

Online courses and their integration into the studying process (on the example of online course “Connected Speech Processes”), Ksenia Efremova

Guidelines for decision-making in English pronunciation and listening instruction, Alice Henderson