Skip to main content
Publication

Codage et interprétation du langage spontané d’enfants de 1 à 3 ans

La transcription de corpus de langage oral est un art difficile car c’est une activité langagière. En particulier, elle inclut le processus d’interprétation des propos d’autrui que l’on trouve dans toute interaction langagière. Or ce qu’attend le scientifique est une description des données de langage qui s’affranchirait de cette interprétation, ce qui est impossible. On doit donc chercher à générer un processus d’interprétation simple, consensuel, qui puisse être compris par tout utilisateur d’un corpus. Pour cela, on utilise des normes de codage précises, claires, aussi peu ambiguës que possible, ainsi qu’un alignement sur du matériel sonore ou audiovisuel. On peut aussi accompagner les transcriptions d’un contexte très riche, soit langagier (phonologique, syntaxique, sémantique, pragmatique), soit extra-langagier (situation, actions, description de scène). Ces difficultés techniques sont présentées dans le cas de corpus de jeunes enfants (projet Léonard) qui exemplifie les problèmes de transcription de langage oral. Les outils et formats utilisés sont ceux du projet CHILDES avec des évolutions spécifiques qui reflètent les difficultés que nous avons relevées dans notre travail de corpus et les solutions adoptées.

European Union flag

The SSH Open Marketplace is maintained and will be further developed by three European Research Infrastructures - DARIAH, CLARIN and CESSDA - and their national partners. It was developed as part of the "Social Sciences and Humanities Open Cloud" SSHOC project, European Union's Horizon 2020 project call H2020-INFRAEOSC-04-2018, grant agreement #823782.

CESSDACLARINDARIAH-EU