Logo EHESS

baobab
Base de données des enseignements et séminaires de l'EHESS

Modèles computationnels de l’acquisition du langage

  • Emmanuel Dupoux, directeur d'études de l'EHESS ( LSCP )

    Cet enseignant est référent pour cette UE

S'il s'agit de l'enseignement principal d'un enseignant, le nom de celui-ci est indiqué en gras.

(ENS, 29 rue d'Ulm 75005 Paris), pour le programme contacter syntheticlearner@gmail.com

L'une des choses les plus fascinante à observer chez les bébés humains est la vitesse avec laquelle ils apprennent leur langue maternelle. La recherche en sciences cognitive des derniers 30 ans a montré que cet apprentissage démarre pendant la première année de vie, alors que l'enfant ne parle pas encore. En quelques mois, le bébé arrive à déterminer quelles sont les consonnes et les voyelles de sa langue, à découper la parole continue en mots et à comprendre le sens de certains d'entre eux. Cet apprentissage, difficile chez l'adulte qui apprends une langue étrangère, a lieu spontanément, sans effort apparent, alors que le bébé est plongé dans un environnement complexe, et souvent confronté à plusieurs langues à la fois. Particulièrement troublant est le fait que cet apprentissage ne semble pas suivre un ordre hiérarchique (apprendre les sons, puis les mots, puis les phrases), comme le ferait un adulte, mais plutôt, le bébé semble mener les apprentissages de tous ces niveaux linguistiques en parallèle.
Dans le séminaire, nous examinons les travaux récents issus du domaine des sciences de l'ingénieur (traitement du signal, reconnaissance de la parole, apprentissage statistique, intelligence artificielle), qui peuvent donner un éclairage théorique nouveau à ce problème. Ces travaux proposent des algorithmes que l'on peut considérer comme autant de propositions théoriques concernant l'apprentissage du langage. Ils sont évalués du point de vue de leur plausibilité aux niveaux socio-linguistique (caractéristique de la parole dirigée vers les enfants), psychologique (architecture cognitive sous-jacente) et biologique (possibilité d'implémentation neuro-mimétique).
Nous discutons les problèmes méthodologiques soulevés par ce type d'étude, en particulier, la question de la fiabilité des données expérimentales et des idéalisations réalisées par rapport aux données linguistiques dans les approches de modélisation. Les discussions issues de ce séminaire sont consignées dans un blog (bootphon.blogspot.fr).

Domaine de l'affiche : Psychologie et sciences cognitives

Intitulés généraux :

  • Emmanuel Dupoux- Le langage et son acquisition : bases biologiques et psychologiques
  • Site web : http://syntheticlearner.net/

    Site web : http://lscp.net/persons/dupoux

    Adresse(s) électronique(s) de contact : syntheticlearner(at)gmail.com

    Compte rendu

    L’une des choses les plus fascinantes à observer chez les bébés humains est la vitesse avec laquelle ils apprennent leur langue maternelle. La recherche en sciences cognitives des derniers 30 ans a montré que cet apprentissage démarre pendant la première année de vie, alors que l’enfant ne parle pas encore. En quelques mois, le bébé arrive à déterminer quelles sont les consonnes et les voyelles de sa langue et à découper la parole continue en mots. Cet apprentissage, très difficile chez l’adulte qui apprend une langue étrangère, a lieu spontanément, sans effort apparent, alors que le bébé est plongé dans un environnement complexe, et souvent confronté à plusieurs langues à la fois. Particulièrement troublant est le fait que cet apprentissage ne semble pas suivre un ordre hiérarchique (apprendre les sons, puis les mots, puis les phrases), comme le ferait un adulte, mais plutôt, le bébé semble mener les apprentissages de tous ces niveaux linguistiques en parallèle.
    Dans le séminaire, nous examinons les travaux récents issus du domaine des sciences de l’ingénieur (traitement du signal, reconnaissance de la parole, apprentissage statistique, intelligence artificielle), qui peuvent donner un éclairage théorique nouveau à ce problème. Ces travaux proposent des algorithmes que l’on peut considérer comme autant de propositions théoriques concernant l’apprentissage du langage. Ils sont évalués du point de vue de leur plausibilité aux niveaux sociolinguistique (caractéristique de la parole dirigée vers les enfants), psychologique (architecture cognitive sous-jacente) et biologique (possibilité d’implémentation neuro-mimétique).
    Nous discutons les problèmes méthodologiques soulevés par ce type d’étude, en particulier, la question de la fiabilité des données expérimentales et des idéalisations réalisées par rapport aux données linguistiques dans les approches de modélisation. Les discussions issues de ce séminaire ont été consignées dans un blog (bootphon.blogspot.fr).

    Publications

    • Avec A. Guevara-Rukoz, A. Cristia, B. Ludusan, R. Thiollière, A. Martin et R. Mazuka, « Are words easier to learn from infant- than adult- directed speech ? A quantitative corpus-based investigation », Cognitive Science, 42(5), 2018.
    • «Cognitive Science in the era of Artificial Intelligence : A roadmap for reverse-engineering the infant language-learner », Cognition, 173, 2018, p. 34-59.
    • Avec T. Schatz et F. Bach, « Evaluating automatic speech recognition systems as quantitative models of cross-lingual phonetic category perception », Journal of the Acoustical Society of America : Express Letters, 143, EL372, 2018.
    • Avec S. Tsuji, P. Fikkert, Y. Minagawa-Kawai, L. Filippin, M. Versteegh, P. Hagoort et A. Cristia, « The more, the better ? Behavioral and neural correlates of frequent and infrequent vowel exposure », Developmental Psychobiology, 59(5), p. 603-612, 2017.
    • Avec A. Cristia, M. Gurven et J. Stieglitz, « Child-directed speech is infrequent in a forager-farmer population : a time allocation study », Child Development, 2017.
    • Avec A. Guevara-Rukoz, I. Lin, M. Morii, M. Minagawa et S. Peperkamp, « Which epenthetic vowel ? Phonetic categories versus acoustic detail in perceptual vowel epenthesis », Journal of the Acoustical Society of America : Express Letters, 142(2), EL211, 2017.

    Dernière modification de cette fiche par le service des enseignements (sg12@ehess.fr) : 20 juillet 2017.

    Contact : service des enseignements ✉ sg12@ehess.fr ☎ 01 49 54 23 17 ou 01 49 54 23 28
    Réalisation : Direction des Systèmes d'Information
    [Accès réservé]