Grammaires Scematique Et Etudes
Pour une première introduction aux langues dans les archives, il est possible d’accéder à toutes les grammaires et à tous les schémas grammaticaux contenus dans les archives ici. En outre, il existe un certain nombre d’études réalisées par les équipes DOBES sur les langues dans les archives
Structure Des Archives et Format
Les archives contiennent des sessions composées d’enregistrements audio et vidéo, généralement avec des annotations sous la forme de .eaf ou de fichiers texte. Chaque session est décrite à l’aide de métadonnées IMDI. Les archives DOBES comprennent de nombreuses sous-archives, une par projet de documentation ; ces sous-archives consistent en une arborescence qui contient les sessions souvent triées par sujet. La structure des arborescences varie selon les objectifs des projets de documentation. De la même façon, les annotations n’ont pas été normalisées et peuvent varier en ce qui concerne les conventions utilisées (pour les noms des niveaux, les glossaires, etc.). La meilleure solution consiste, donc, à naviguer, dans un premier temps, dans les archives en réalisant un certain nombre de recherches d’exploration afin de se faire une première idée du contenu existant et de son organisation.
Outils pour les spécialistes en typologie
- Recherche Annex
- Pour les analyses statistiques des données DOBES, l’ Introduction to R for Typologists de Balthasar Bickel sera très utile.
- More Software for Typologists de Balthasar Bickel
- Le guide des Regular Expressions for ELAN users de Ulrike Mosel rassemble des expressions courantes utilisées dans l’analyse des fichiers ELAN.
- Le Poio Analyzer de Peter Bouda permet de rechercher et d’analyser des séries de fichiers ELAN et Toolbox (outils).
Projets inter-corpus
Certains projets ont été subventionnés et se penchent sur une question de recherche commune à différents corpus. Les chercheurs mettront au point des méthodes et des outils qui seront utiles à d’autres recherches possibles inter-corpus.