Catégorie : Séminaires Llacan

Séminaires Llacan

Séminaires Llacan

Séminaire pratique des doctorants – le lundi 23 mai, de 14h00 à 15h30 : « Recherche de plusieurs fichiers Elan »

Le lundi 23 mai, de 14h00 à 15h30, aura lieu le séminaire pratique des doctorants : « Recherche de plusieurs fichiers » Elan par Ekaterina Aplonova & Izabela Jordanoska (LACITO & LLACAN).

ELAN est l’un des outils les plus fréquemment utilisés pour l’annotation linguistique des enregistrements audio et vidéo. Beaucoup de linguistes connaissent le processus d’annotation de fichiers dans ELAN, mais peu sont conscients de son remarquable potentiel en tant qu’outil de recherche de ces fichiers. Dans notre tutoriel, nous allons montrer comment fonctionne la fonction de structural search multiple Elan files. Nous commencerons par des requêtes simples lorsque vous aurez besoin de trouver un mot / une glose / une traduction spécifique dans plusieurs fichiers Elan, puis, étape par étape, nous complexifierons nos requêtes en requêtes à plusieurs couches et à expressions régulières.

Le public cible de ce tutoriel sont les linguistes qui ont déjà des fichiers annotés dans Elan et qui ont l’intention d’apprendre à utiliser Elan comme outil de recherche de corpus. Cependant, si vous commencez tout juste à utiliser Elan et que vous n’avez pas beaucoup de fichiers annotés ou que vous envisagez simplement de commencer à l’utiliser, le didacticiel montrera le potentiel du logiciel, vous êtes donc également le bienvenu.

Vous pouvez rejoindre le séminaire en utilisant le lien Zoom suivant :

https://hu-berlin.zoom.us/j/66607058296?pwd=SzRDNWY4T1ZQdmJsTUsyVU1EK3R6UT09

ID de réunion : 666 0705 8296
Mot de passe : 473369

[…]

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 18 mai 2022 – Konstantin Pozdniakov : «Les exceptions régulières dans les systèmes des classes nominales Niger-Congo»

Le mercredi 18 mai 2022, de 10h à 11h, Konstantin Pozdniakov fera une présentation intitulée «Les exceptions régulières dans les systèmes des classes nominales Niger-Congo».

Résumé:

Je vais vous présenter une recherche pilote sur un sujet qui m’intrigue depuis très longtemps. Dans de nombreuses langues Niger-Congo,  à côté des classes nominales qui comprennent des centaines de noms, il existe des classes spécifiques réservées juste pour un, deux ou bien trois noms. Ces classes spécifiques sont particulièrement répandues dans les langues de l’Afrique de l’Ouest.

Les questions. Est-ce que ces classes spécifiques comportent des noms avec les mêmes valeurs sémantiques dans toutes ces langues ou pas ? Est-ce qu’un marquage spécifique dans les systèmes de classes est une chose régulière ou non ? Si oui, quelles sont ces valeurs exclusives?  Qu’est-ce qui détermine leur exclusivité ?

D’après ma connaissance, ces questions n’ont jamais été étudiées. La typologie des exceptions dans les systèmes de classes n’existe pas.

Dans la recherche dont je présente les résultats (inattendus !), j’ai analysé les données de 370 langues qui font partie de toutes les branches Niger-Congo.

Finalement j’arrive à la conclusion que ces questions sont centrales pour la description des catégories des classes nominales et du nombre.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 4 mai 2022 – Bertille DJOUPEE : «Conceptualisation et terminologie concernant le Covid-19 par les Baka du Cameroun»

Le mercredi 4 mai 2022, de 10h à 11h, Bertille DJOUPEE fera un exposé intitulé «Conceptualisation et terminologie concernant le Covid-19 par les Baka du Cameroun».

Résumé :

Le présent projet est consacré à l’impact des maladies émergentes comme le VIH-SIDA, et plus récemment le Covid-19 sur la langue des populations Baka du Cameroun. De fait, l’annonce de la pandémie de Covid-19 a entraîné une révolution dans les langues du monde avec l’avènement des termes et expressions nouveaux pour nommer les efforts des pouvoirs publiques et des scientifiques en vue de limiter la propagation du virus et d’éradiquer la maladie. Au Cameroun, le français et l’anglais, adoptés comme langues officielles, expriment bien ces nouvelles réalités. Mais étant dans un environnement multilingue où le français et l’anglais côtoient environ 239 langues locales jouissant chacune du statut de « langue nationale », comment ces dernières réagissent-elles face à cette terminologie nouvelle ? Je me propose d’analyser la façon dont les populations ɓaka élaborent, à partir de leur vécu, le vocabulaire relatif au VIH-SIDA et au Covid-19. Toutes leurs connaissances au sujet des pratiques thérapeutiques ancestrales (Brisson : 1988) m’amènent à me pencher sur la représentation de la façon dont ces populations des chasseurs cueilleurs appréhendent traditionnellement la maladie, en montrant ce qui relève du soin ou au contraire d’une approche magique. Et partant sur cette base, j’enquêterai pour situer la façon dont ils prennent en compte les pandémies du VIH-SIDA et du coronavirus. Ce sera également pour moi l’occasion d’analyser les stratégies mises en œuvre par les locuteurs ɓaka pour créer des néologismes.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 20 avril 2022 – Elena Perekhvalskaya : «Tonal Density Index»

Le mercredi 20 avril 2022, de 10h à 11h, Elena Perekhvalskaya fera un exposé intitulé «Tonal Density Index(TDI)».

Abstract

Tonal density index is based on the notion of “tonal density” introduced by Carlos Gussenhoven. This index is counted as the ratio between the number of meaningful tones and the number of potential tone-bearing units of the language (Gussenhoven 2004). The concept of tonal density is extremely fruitful. It makes it possible to operate with more subtle differences than the dichotomy “tonal / non-tonal” while describing the phonological system of a language. The degree of tonality when taken into account will show more precisely the relative importance of tones for coding meanings in a particular language. Tonal density has not yet become an exact term, it is still rather impressionistic. A language may be defined as having rather high or rather low tonal density, but this estimation is not supported by accurate calculations. However, the tonal density is a very important parameter: it may provide an opportunity to compare phonological systems of different languages and also different subsystems within one language. It will also make it possible to find correlations between the structure of tonal system and other characteristics of the language. In order to make “tonal density” work, it should be precisely defined in the frames of quantitative approach. It is proposed to count this index for tonal languages as the number of relevant tonal oppositions per 100 potential tone carriers  made on the basis of text of a certain length (for example, 10,000 characters).

Principles of TDI counting. Since any pronounced vowel can be characterized by its F0 (that is, it is pronounced with some pitch), it is necessary to establish certain principles of counting the TDI.

(1) If pitch of a segment is completely predictable by the phonological context, the segment should be counted as non-tonal;

(2) only pitch distinctions relevant for coding meanings are counted as tones;

(3) if lexical and / or grammatical context determines the choice of a unit, it should be counted as non-bearing a tone;

(4) in most two-tone systems one tone is marked; therefore, only segments which bear the marked tone are considered tone carriers, those bearing the default tone are marked as toneless;

Case studies

Mwan (South Mande < Mande < Niger-Congo)

Navajo (Na-Dene)

Tibetan (Bodic < Sino-Tibetan)

Chakavian dialect of Serbo-Croatian (Slavonic < Indo-European)

References

Gussenhoven, Carlos. 2004. The phonology of tone and intonation. Cambridge University Press.

 

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 6 avril 2022 – Maria Khachaturyan: «Language contact and multilingual language socialization: a case study of Mano and Kpelle in Guinea»

Le mercredi 6 avril 2022, de 10h à 11h, Maria Khachaturyan fera une présentation intitulée «Language contact and multilingual language socialization: a case study of Mano and Kpelle in Guinea».

Résumé:

This talk presents an ongoing project on multilingualism and language contact between Mano and Kpelle, two Mande languages spoken in the South-East of Guinea. It aims to address the following puzzle: while language contact can be responsible for convergence in certain structural features and yield in particular areal phenomena, languages in contact have an option to remain distinct, such that overall differences do not diminish and in some cases even increase (Evans 2019). One key to the puzzle, I argue, lies in individual language socialization trajectories, whereby transfer features in early stages of acquisition get « sorted out » and discriminated in the process of lifelong learning. Some residue of transfer effects may remain, however, leading to stable contact-induced change. I discuss language ecology and ideology as factors shaping the language learning process in complex ways. I address these questions through a case study of the acquisition of reflexive marking in Mano under the influence of Kpelle.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 23 mars 2022 – Emily Prud’hommeaux : «Integrating machine learning in the language documentation pipeline»

Le mercredi 23 mars 2022, de 10h à 11h, Emily Prud’hommeaux fera un exposé intitulé «Integrating machine learning in the language documentation pipeline».

Abstract:

Despite many advances in technology for capturing, transcribing, and annotating speech recordings, linguists and language communities engaged in language documentation projects continue to face the obstacle of the “transcription bottleneck”. This is especially true for endangered languages, which have few first-language speakers and often lack an established writing system. In this talk, I describe three ongoing technology-driven efforts to support the transcription and morphological annotation of three critically endangered languages indigenous to North America. We find that while documentation is often faster and more accurate when using machine learning support, individuals vary in their opinions on the utility of these technologies. In addition, our results suggest that the quality of the data used to train machine learning models is often not as crucial for accuracy as the overall quantity of data. Finally, I discuss ideas for further stimulating the integration of machine learning tools into language documentation projects.

Biography:

Emily Prud’hommeaux is the Gianinno Family Sesquicentennial Assistant Professor of Computer Science at Boston College. She received her BA (Harvard) and MA (University of California, Los Angeles) in Linguistics, and her PhD in Computer Science and Engineering (Oregon Health and Science University). Her research focuses on natural language processing and speech signal processing for small datasets, with a particular focus on endangered languages and child language.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 9 mars 2022 – Mark VAN DE VELDE et Dmitry IDIATOV : «Une première analyse du mbula, langue du groupe Jarawan Bantu»

Le mercredi 9 mars 2022, de 10h à 11h, Mark VAN DE VELDE et Dmitry IDIATOV feront une présentation intitulée «Une première analyse du mbula, langue du groupe Jarawan Bantu».

Résumé:

Nous présenterons une première analyse de la langue mbula. Le mbula est parlée aux bords du fleuve Bénoué dans l’état d’Adamawa du Nigeria et appartient au groupe Jarawa, dont on estime qu’elle fait partie des langues bantoues, malgré sa situation géographique excentrée. Cette classification a été faite sur la base de quelques listes de mots qui circulent depuis le début du 20ème siècle. Par ailleurs, relativement peu était connu sur les langues Jarawa jusqu’à présent. Si le mbula est clairement bantoïde de par son vocabulaire, sa structure grammaticale diffère fortement de celle des langues bantoues au sens stricte. Il n’y a plus aucune trace d’un système de classe (hormis les traces d’anciens préfixes dans les thèmes nominaux), et le système temporel riche des langues bantoues a été remplacé par un système relativement plus simple, où le domaine temporel est divisé entre futur et non-futur.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 23 février 2022 – Pius Wuchu AKUMBU : «Literal and metaphorical usages of Babanki EAT and DRINK verbs»

Le mercredi 23 février 2022, de 10h à 11h, Pius Wuchu AKUMBU fera un exposé intitulé «Literal and metaphorical usages of Babanki EAT and DRINK verbs».

Abstract:

In Babanki, a Grassfields Bantu language of North-West Cameroon, two of the numerous consumption verbs, namely the generic verbs ʒɨ́ ‘eat’ and ɲʉ́ ‘drink’, constitute a major source of metaphorical extensions outside the domain of ingestion. Setting out from a characterisation of the basic meanings of these two lexical items as they emerge from their paradigmatic relations within the semantic field of alimentation processes, this paper explores the figurative usages of the two verbs and their underlying semantic motivations. Semantic extensions that radiate from eat can be subsumed under two closely related structural metaphors, i.e. appropriation of resources is eating and winning is eating. Both metaphors have further entailments, i.e. the derivation of pleasure from consumption of resources, the depletion of resources via consumption and the deprivation of a third party from access to these resources. Semantic extensions that radiate from drink can be accounted for in two structural metaphors, i.e. inhalation is drinking and absorption is drinking. Remarkably, some metaphorical extensions of consumption verbs attested in other African languages, such as extensions of eat for sexual intercourse and for killing, and the extensions of drink for undergoing trouble and enduring painful experiences are absent in Babanki.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 9 février 2022 – Mohamed HASSAN KAMIL : «Les idéophones en afar : morphophonologie, syntaxe et sémantique»

Le mercredi 9 février 2022, de 10h à 11h, Mohamed HASSAN KAMIL fera une présentation intitulée «Les idéophones en afar : morphophonologie, syntaxe et sémantique».

Résumé :

Les idéophones en afar affichent leur particularité par rapport aux autres parties du discours aussi bien au niveau morphophonologique que sémantique.

Sur le plan morphophonologique, la grande majorité des idéophones se distinguent par une structure syllabique qui leur est propre et une phonologie atypique par rapport au système de l’afar. Les idéophones, qu’ils soient ou non formellement reconnaissables, ne sont jamais employés seuls. Ils sont toujours insérés dans une périphrase verbale du type IDEO+verbe (support). L’idéophone porte le sémantisme du prédicat et le verbe, selon la valence, « dire » ou « poser/mettre », véritable verbe support, est dénudé de son sens plein, et porte seul les marques TAM.

Ces constructions ont une valeur expressive. Elles permettent au locuteur de prédiquer des sensations visuelles, auditives ou émotives. Nous verrons que le procédé est extrêmement productif et couvre de très nombreux champs sémantiques et nous essaierons de déterminer à quel type d’énoncé est liée la fréquence de leurs occurrences.

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus
Séminaires Llacan

Séminaire du Llacan – mercredi 26 janvier 2022 – Louise ESHER : «Morphological units in Swahili verb inflection»

Le mercredi 26 janvier 2022, de 10h à 11h, Louise ESHER fera un exposé intitulé «Morphological units in Swahili verb inflection».

Résumé : Standard Swahili is commonly cited as an example of ‘agglutinating’ inflection, usually analysed as concatenation of morphemes according to a position-class template comprising a series of slots and an inventory of the exponents which can appear within each. The slots are conventionally labelled as representing morphological features or feature values.

The popularity of ‘constructive’ analyses of Swahili, proceeding from individual morphemes to full words, reflects the fact that it is near-exhaustively possible to segment Swahili verb forms into distinct substrings, and to assign these substrings to position classes. Yet the status of the substrings themselves invites question. Constructive analyses overlook several known examples of cumulative, overlapping and extended exponence, and of mismatch between function and slot, as well as the fact that not all inflectional forms require or even permit certain slots to be filled, i.e. inflectional contrasts can be expressed by distinctive combinations of filled and unfilled slots. Furthermore, in both human and machine learning of Swahili, segmentation is possible without knowledge of meaning; the process illustrated is one in which subword units are inferred by generalisation across multiple inflected wordforms, as in ‘abstractive’, word-based approaches.

These observations combine to indicate that abstractive, paradigmatic approaches are of demonstrable descriptive advantage over morpheme-based approaches, even for near-canonical, ‘agglutinative’ systems such as that of Swahili.

 

Lien Zoom pour assister au séminaire : https://cnrs.zoom.us/j/95654741763

ID  réunion : 956 5474 1763

Code secret : 81Llacan35

Lire plus