Corpus CO2
Page issue du site internet du projet
Description - Description détaillée
Nom et version du corpus | CO2 — Version 1.1 (12 juillet 2013) |
Fournisseur | Laboratoires LI et LLL |
Concepteurs | Judith Muzerelle, Aurore Pelletier, Emmanuel Schang, J.-Y. Antoine |
Type de corpus | Annotation en coréférences et anaphores associatives du corpus ESLO1 (Dialogue oral H-H réel : interviews sociolinguistiques) |
Contenu du corpus | 3 dialogues — 3h28' d'enregistrement — 35192 mots — Transcriptions orthographiques au format .ac GLOZZ et annotations déportées au format .aa GLOZZ |
Licence de distribution | Creative Commons CC-BY-NC-SA |
Annotation | Judith Muzerelle (LLL), Aurore Pelletier (LLL) |
Financement | PRES Centre Val de Loire |
Distribution du corpus - Le corpus n'est distribué que par téléchargement : archive ZIP comportant l'intégralité du corpus
Convention d'utilisation - Licence de distribution
Le corpus CO2 est distribué gratuitement sous licence Creative Commons CC-BY-NC-SA.
Cela signifie que vous devez respecter le contrat d’utilisation suivant :
- BY : paternité - Vous devez citer les auteurs de ce corpus pour toute utilisation du corpus. Dans le cas d’une publication s’appuyant sur ces travaux, nous vous demandons ainsi de citer les articles référencés dans la description de la ressource jointe à la distribution ou dans la liste ci-dessous.
- NC : non commercial - Vous ne pouvez pas faire une utilisation commerciale de cette ressource. Nous ne sommes pas opposés sur le principe à de tels usages, mais il vous est demandé de nous contacter pour étudier ces modalités d’usage.
- SA : partage des conditions initiales à l’identique - Vous ne pouvez créer une nouvelle ressource à partir de la ressource existante et en faire ensuite un usage différent de celui imposé par ce contrat. Là encore, nous sommes ouverts à toute utilisation du corpus pour création de nouvelles ressources, mais nous vous demandons de nous contacter pour discuter de ces nouveaux usages.
Important - Par ailleurs, cette ressource intègre des échanges dont la communication porte atteinte à la protection de la vie privée ou portant appréciation ou jugement de valeur sur une personne physique nommément désignée, ou facilement identifiable, ou qui font apparaître le comportement d'une personne dans des conditions susceptibles de lui porter préjudice. (Code du Patrimoine, art. L. 213-2, I, 3) . A ce titre, ce corpus peut être utilisé à des fins d'analyse, mais en aucun cas ne peut être diffusés publiquement.
Publications liées à la ressource
Emmanuel SCHANG, Aurore BOYER, Judith MUZERELLE, Jean-Yves ANTOINE, Iris ESHKOL, Denis MAUREL (2011) Coreference and anaphoric annotations for spontaneous speech corpos in French. Proc. DAARC'2011, Discourse Anaphora and Anaphor Resolu1on Colloquium, Faro, Portugal [HAL-00831414]