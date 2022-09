Le camion "écouter-parler" du CNRS et du ministère de la Culture part en tournée dans toute la France. L'enjeu : collecter et enregistrer toutes les langues parlées dans notre pays. Tout a commencé il y a 100 ans, quand on a pu commencer à enregistrer la parole. Un linguiste qui s'appelait Ferdinand Brunot a eu l'idée de sillonner la France avec un camion enregistreur. En 1912 par exemple, il gare son camion laboratoire dans le Berry et il enregistre deux dames qui discutent.

"L'idée, c'était de se dire que la diversité des langues était en train de disparaître", explique Olivier Baude, enseignant chercheur en linguistique au CNRS. 100 ans après, le CNRS et le ministère de la Culture lancent donc une nouvelle tournée, l'idée étant de voir comment les langues de notre pays ont évolué. "Il y a plus de 600 langues qui sont aujourd'hui transmises sur l'ensemble du territoire. Il y a des centaines de variétés qui existent. On va les collecter, aller voir les gens", dit-il.

Le CNRS décortique ensuite les accents, le lexique, le vocabulaire, la tournure des phrases. Tout se passe dans un camion, avec des petits fauteuils et une borne enregistreuse au milieu. "On demande aux gens de s'asseoir et de discuter. L'ensemble de ces conversations sont conservées, traitées sur des plateformes technologiques du CNRS pour qu'immédiatement des chercheurs, quelle que soit leur discipline, puissent travailler dessus", poursuit Olivier Baude.

Il y a l'aspect patrimonial évidemment, mais ces enregistrements ont aussi une visée très pratique. Pour l'industrie du langage, c'est tout simplement l'assistant vocal de votre téléphone, Siri. "Il y a même maintenant des industriels du côté des technologies du langage qui utilisent ces enregistrements-là avec de l'intelligence artificielle pour justement créer des bases de données importantes pour qu'on puisse parler à son téléphone avec un accent de Bretagne, du nord, du sud", explique Olivier Baude.

