Séminaires Llacan

Séminaire du Llacan – 23 novembre 2022‎ – Tolúlọpẹ́ Ògúnrẹ̀mí : «Grandes architectures, peu de ressources: l’application du traitement automatique de langage naturel et de la parole sur les langues Africaines peu dotées‎»‎

Le mercredi 23 novembre 2022, de 10h à 11h, Tolúlọpẹ́ Ògúnrẹ̀mí (Stanford University) partagera ses recherches de Doctorat avec une présentation en français intitulée Grandes architectures, peu de ressources: l’application du traitement automatique de langage naturel et de la parole sur les langues Africaines peu dotées (Big architectures, few resources: Applying state of the art NLP and Speech Processing to low-resource African languages).

Résumé: 

Les avancées récentes en matière de NLP et de traitement de la parole ont montré que les architectures gourmandes en données fournissent les meilleures ressources pour les langages avec de nombreuses ressources, par ex. le français. Que se passe-t-il alors avec les langues peu dotées ? Nous examinons comment le pretraining et finetuning des architectures BERT et wav2vec 2.0 peuvent être utilisés pour permettre des tâches de traitement de la parole et du langage naturel dans diverses langues africaines.

Recent advancements in NLP and Speech Processing have shown that data-hungry architectures provide the best results for languages with many resources e.g. French. What then happens with low-resource languages? We look at how both pre-training and finetuning of BERT and wav2vec 2.0 architectures can be used to enable speech and natural language processing tasks in various African languages.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35