Félicitations à notre collègue Louise Esher qui vient de publier son premier article en tant qu’africaniste patentée. Et pour l’instant, l’article est disponible gratuitement en ligne : Esher, L., « Swahili verbs and the value of abstractive accounts for agglutinating inflection« , in Word Structure vol. 14.1, p. 148-173.
Mois : novembre 2022
Marché de Noël du Campus de Villejuif : ce mardi 29 novembre
Si vous êtes dans le coin, ne manquez pas le marché de Noël du Campus de Villejuif ce mardi 29 novembre de 11H à 14H30. Qui nous rappelle que nos collègues ont des talents cachés : Jeanne Zerner y tiendra un stand où vous pourrez notamment acheter ses pâtes de coing et biscuits maison, ses créations de bijoux, et également commander cidre et jus de pommes produits par le fils de Claire Moïse, notre collègue spécialiste des vanuatu (mais le cidre, lui, vient de Dordogne). Magali, elle, se fera le relais des créations chocolatières de la déjà célèbre Tiphaine Corvez pour qui elle fera livraison dans les jours prochains si vos commandez le chocolat en ligne (https://tiphainechocolat.com/).
Le Llacan souhaite la bienvenue à Salka Benoît Nouanti
Le Llacan a le plaisir d’annoncer l’arrivée de Salka Benoît Nouanti, qui a obtenu une bourse doctorale de l’Inalco pour son projet de thèse sur le notre, une langue Gur du Benin, sous la direction de Mark van de Velde. Salka souhaite faire une analyse grammaticale de la langue, avec une attention particulière pour la relation entre l’Aktionsart et la conjugaison des verbes, les constructions verbales sérielles (CVS) et la classification nominale. La relation entre l’Aktionsart (sémantique verbale) et la conjugaison des verbes est un sujet peu étudié dans les langues Gur (Sambiéni 2020). Donc il revient à Salka de déterminer les classes sémantiques verbales du notre, puis établir la relation entre celles-ci et les catégories TAM (Temps Aspects Modes). La classification nominale et les constructions verbales sérielles sont particulièrement intéressantes pour son projet à cause du contexte linguistique du notre. Elle est la seule langue du groupe oti-volta-occidental à avoir préservée son système de classes complet. Et nous avons toutes les raisons de croire que cela est dû à son contact avec les langues oti-volta-orientales qui ont aussi conservé les leurs. La différence fondamentale qui existe entre les langues Gur du groupe Oti-Volta-Est et celles du groupe Oti-Volta-Ouest est l’emploi des CVS par les dernières. L’objectif de la recherche est de savoir si dans ce contexte de contact linguistique avec les langues oti-volta-orientales le notre utilise les CVS quand on sait que celles-ci constituent un phénomène dynamique, évolutif, susceptible de réorganisation (cf. Bickerton 1981 ; Heine & Reh 1984). Pour ce qui est du cas typique du notre le contact linguistique peut servir d’environnement favorable à la réorganisation de son système grammatical au niveau des CVS. Ces différents sujets seront traités sur la base des données collectées dans le cadre du projet de documentation financé par Endangered Languages Documentation Programme (ELDP).
Bienvenu, Salka, parmi les doctorants du Llacan !
Séminaire du Llacan – 23 novembre 2022 – Tolúlọpẹ́ Ògúnrẹ̀mí : «Grandes architectures, peu de ressources: l’application du traitement automatique de langage naturel et de la parole sur les langues Africaines peu dotées»
Le mercredi 23 novembre 2022, de 10h à 11h, Tolúlọpẹ́ Ògúnrẹ̀mí (Stanford University) partagera ses recherches de Doctorat avec une présentation en français intitulée Grandes architectures, peu de ressources: l’application du traitement automatique de langage naturel et de la parole sur les langues Africaines peu dotées (Big architectures, few resources: Applying state of the art NLP and Speech Processing to low-resource African languages).
Résumé:
Les avancées récentes en matière de NLP et de traitement de la parole ont montré que les architectures gourmandes en données fournissent les meilleures ressources pour les langages avec de nombreuses ressources, par ex. le français. Que se passe-t-il alors avec les langues peu dotées ? Nous examinons comment le pretraining et finetuning des architectures BERT et wav2vec 2.0 peuvent être utilisés pour permettre des tâches de traitement de la parole et du langage naturel dans diverses langues africaines.
Recent advancements in NLP and Speech Processing have shown that data-hungry architectures provide the best results for languages with many resources e.g. French. What then happens with low-resource languages? We look at how both pre-training and finetuning of BERT and wav2vec 2.0 architectures can be used to enable speech and natural language processing tasks in various African languages.
Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763
ID réunion : 956 5474 1763
Code secret : 81Llacan35