UMR 8135 CNRS - INALCO - EPHE

ELAN-CorpA

ELAN-CorpA est une version étendue du logiciel ELAN du Max Planck Institute for Psycholinguistics de Nijmegen, Pays-bas. Les nouvelles fonctionnalités ont été développées successivement par Coralie Villes, puis Uyên-To Rabier et finalement Mourad Aouini sous la direction de Christian Chanard du laboratoire de CNRS LLACAN (UMR 8135), initialement dans le cadre du programme de recherche ANR CorpAfroAs (A Spoken Corpus for Afro-Asiatic Languages), puis du programme CorTypo (Constitution de Corpus Oraux pour des Recherches Typologiques) tous deux coordonnés par Amina Mettouchi.

Windows:
  • Après téléchargement, double-cliquer sur le fichier install
  • Rien de plus n'est à installer, la machine virtuelle Java est incluse dans le dossier.
Mac OS X:
  • Après téléchargement, double-cliquer sur le fichier téléchargé et déplacer l'application ELAN-CorpA dans le dossier Applications
  • Si l'application apparaît endommagée lorque vous voulez la lancer, ouvrez un terminal, déplacez-vous dans le dossier contenant le fichier ELAN-CorpA_6.4.app (cd /Applications) et tapez la commande : sudo xattr -rc ELAN-CorpA_6.4.app puis valider et donnez le mot de passe de votre machine. ELAN-CorpA devrait se lancer lorsque vous double-cliquez sur son icône. Créez un alias (ctrl/click) et déplacez-le sur le bureau s'il n'y est pas déjà.

Vous trouverez *** ici *** un document PDF sur l'utilisation de ELAN-CorpA

Citer ELAN-CorpA:
    ELAN-CorpA (Version 6.4) [logiciel]. (30-01-2023). Villejuif: CNRS-LLACAN (Langage, langues et cultures d'Afrique). téléchargé à partir de https://llacan.cnrs.fr/ELAN-CorpA/

Cette version contient un onglet supplémentaire Interlinearize qui permet la gestion d'un lexique XML (d'extension .eafl) servant à annoter les mots de la ligne sélectionnée. Si le mot n'est pas trouvé dans le lexique, un parseur propose les différentes segmentations possibles du mot en morphèmes (sur la base des affixes du lexique). Les morphèmes de la segmentation choisie sont automatiquement ajoutés sous le mot et sont ensuite glosés sur 2 tiers additionnelles (glose et catégorie), avec les informations du lexique.

Un second lexique Parse Lexicon d'extension .eafp peut être créé ou augmenté avec les mots segmentés et annotés du fichier en cours, pour accélérer le processus d'annotation (auto-intelinearize)

Ouils pratiques:
  • Nettoyer un lexique Parse local
  • Extraire le lexique ELAN-CorpA d'un lexique Parse
  • Nettoyer un lexique ELAN-CorpA (supprime les mauvaises entrées)

De plus, la table affichant les résultats d'une recherche dans les textes annotés présente 2 colonnes supplémentaires parent et children (en plus de before et after). ces colonnes contiennent le parent et les enfants de l'élément recherché (par exemple, repectivement le mot dans lequel un morphème recherché a été trouvé et la glose et la catégorie d'un morphème.) Note: Ceci fait partie intégrante de ELAN depuis la version 4.6.1.

Dans l'affichage en Grille (grid) il y a une nouvelle option qui permet de choisir entre multiple tiers with symbolic association et multiple tiers with symbolic subdivision qui permet l'affichage des enfants d'une tier en fonction de son stéréotype. Ceci fait partie intégrante de ELAN depuis la version 4.6.1.

Depuis la version 4.7, un nouvel item apparaît dans le menu Search: CorpA Multiple files Search, à travers lequel une recherche peut être faite en utilisant le langage de requête CorpA Query Language

Depuis la version 4.8, une nouvelle fonctionnalité Group&Link a été ajoutée, qui permet d'une part de regrouper dans des tables, des annotations sélectionnées et d'autre part de lier ces groupes dans d'autres tables. Chaque Group ou Link peut avoir un Type (qui peut être choisi dans un vocabulaire contrôlé) et/ou un Nom (Name). De plus, une annotation recherchée par CorpA Multiple files Search peut être contrainte d'appartenir ou pas (Existing /Not Existing).
Attention !: pour enregistrer ces Groups et Links (dans les versions antérieures à ELAN-corpA 5.1), le fichier ELAN utilise un schéma étendu qui n'est pas compatible avec celui de la version ELAN du MPI (les G&L seront perdues à l'enregistrement).

Dans cette version ELAN-CorpA_5.7, les Groups et Links sont maintenant compatibles avec le nouveau schéma 3.0 de ELAN. Pour ceux qui auraient utilisé cette focntionnalité G&L dans les versions précédentes de ELAN-CorpA, leurs fichiers devront être convertis dans le nouveau schéma compatible avec celui des nouvelles versions du MPI (contacter christian.chanard à cnrs.fr)

Comment utiliser Groups&Links

Cette nouvelle version ELAN-CorpA_6.0, intègre les nouvelles fonctionnalités de ELAN 6.0 (export en format WebAnnotation JSON, ouverture d'un fichier .eaf distant... (cf. https://archive.mpi.nl/tla/elan/release-notes)

Vous pouvez télécharger le fichier modèle Corpo1.etf qui peut être importé dans ELAN pour définir les Types> et Tiers conformes au modèle de CorpAfroAs pour un locuteur, et Corpo2.etf pour 2 locuteurs. Si ces fichiers s'ouvrent dans votre navigateur, enregistrez-les simplement (Fichier, Enregistrer) sur votre ordinateur.

Pour créer un nouveau fichier ELAN avec le modèle CorpAfroAs:

  • Fichier, Nouveau, Sélectionner Media, Rechercher votre fichier Wav, >>
  • Sélectionner Modèle, Rechercher votre modèle Corpo1.etf, >> , OK
  • Supprimer la tier default (clic-droit sur son étiquette, supprimer default
ou bien importer le modèle dans un deuxième temps:
  • Tier, importer Tiers
  • Rechercher le fichier Corpo1.etf (ou Corpo2.etf pour 2 locuteurs)
  • Importer, Fermer
Windows: Mac:
ELAN-CorpA-6.1 ELAN-CorpA-61-install.exe ELAN-CorpA-61.dmg
ELAN-CorpA-512 ELAN-CorpA_512_install.exe ELAN-CorpA_512_install.zip
ELAN-CorpA-474 ELAN-CorpA_474_install.exe ELAN-CorpA_474_install.zip
ELAN-CorpA-462 ELAN-CorpA_462_win_install.exe ELAN-CorpA_462_win_install.zip
ELAN-CorpA-440 install-ELAN-CorpA2.exe Install-ELAN-CorpA_440.zip
ELAN-CorpA2 install-CorpA2.exe install-CorpA2.zip
ELAN-CorpA-433 ELAN-CorpA_433.exe Install-ELAN-CorpA_433.zip