Non classé

Séminaire du Llacan – Mercredi 14 avril – Le yorùbá, langue moyenne mais grande langue… sur Internet, par Nicolas Aubry

Mercredi 14 avril de 10H à 11H, Nicolas Aubry nous propose une intervention sur « Le yorùbá, langue moyenne mais grande langue… sur Internet »

Résumé : Le yorùbá bénéficie d’une présence très forte sur Internet, unique parmi les langues africaines si on la rapporte au nombre de locuteurs ou au statut (elle n’est pas langue officielle). Il est difficile de la quantifier, mais pour une première approximation, il y a sur Wikipedia 20 fois plus d’articles en yorùbá qu’en igbo ou en wolof, presque 10 fois plus qu’en zoulou (langue officielle) et en haoussa (qui a plus de locuteurs), et un tiers moins seulement qu’en swahili. Cette présence massive a fini par modifier sensiblement la façon dont je cherche « mes » données, pour l’enseignement ou la recherche, et c’est avant tout cette expérience que je souhaite partager lors de cette séance du séminaire.
Au fil des années en effet, à mesure que le contenu Web en yorùbá augmentait, ma recherche de données a changé petit à petit pour aboutir à une utilisation massive d’Internet comme corpus. Bien sûr, Internet est surtout pratique pour trouver des données écrites, qui concernent donc les niveaux d’analyse à partir de la morphologie, mais la quantité de données audio (et vidéos) devient aussi impressionnante.
J’essaierai de couvrir, par des exemples brefs, les différents types de contenus utiles (posts de réseaux sociaux, mémoires de traduction, fiches wikipedia, blogs, podcasts et streams de « vraies » radios, webtvs, webradios, documents multilingues d’institutions, le nouveau BBC yorùbá, etc.), de montrer leur intérêt ainsi que certains pièges.

Et pour assister au séminaire, toujours le même lien zoom: https://zoom.us/j/97478550216?pwd=Y25OQWhER1luSTRnRnZlWGN1SWpPZz09
ID de réunion : 974 7855 0216
Code secret : EQaw9B