Corpus CO2

Page issue du site internet du projet

Description - Description détaillée document PDF

Nom et version du corpus CO2 — Version 1.1 (12 juillet 2013)
Fournisseur Laboratoires LI et LLL
Concepteurs Judith Muzerelle, Aurore Pelletier, Emmanuel SchangJ.-Y. Antoine
Type de corpus Annotation en coréférences et anaphores associatives du corpus ESLO1 (Dialogue oral H-H réel : interviews sociolinguistiques)
Contenu du corpus 3 dialogues —  3h28' d'enregistrement — 35192 mots — Transcriptions orthographiques au format .ac GLOZZ et annotations déportées au format .aa GLOZZ
Licence de distribution Creative Commons CC-BY-NC-SA
Annotation Judith Muzerelle (LLL), Aurore Pelletier (LLL)
Financement PRES Centre Val de Loire

Distribution du corpus - Le corpus n'est distribué que par téléchargement : archive ZIP comportant l'intégralité du corpus

Convention d'utilisation - Licence de distribution

Le corpus CO2 est distribué gratuitement sous licence Creative Commons CC-BY-NC-SA.

Cela signifie que vous devez respecter le contrat d’utilisation suivant :

    • BY : paternité - Vous devez citer les auteurs de ce corpus pour toute utilisation du corpus. Dans le cas d’une publication s’appuyant sur ces travaux, nous vous demandons ainsi de citer les articles référencés dans la description de la ressource jointe à la distribution ou dans la liste ci-dessous.
    • NC : non commercial  - Vous ne pouvez pas faire une utilisation commerciale de cette ressource. Nous ne sommes pas opposés sur le principe à de tels usages, mais il vous est demandé de nous contacter pour étudier ces modalités d’usage.
    • SA : partage des conditions initiales à l’identique  - Vous ne pouvez créer une nouvelle ressource à partir de la ressource existante et en faire ensuite un usage différent de celui imposé par ce contrat. Là encore, nous sommes ouverts à toute utilisation du corpus pour création de nouvelles ressources, mais nous vous demandons de nous contacter pour discuter de ces nouveaux usages.

Important - Par ailleurs, cette ressource intègre des échanges dont la communication porte atteinte à la protection de la vie privée ou portant appréciation ou jugement de valeur sur une personne physique nommément désignée, ou facilement identifiable, ou qui font apparaître le comportement d'une personne dans des conditions susceptibles de lui porter préjudice. (Code du Patrimoine, art. L. 213-2, I, 3) . A ce titre, ce corpus peut être utilisé à des fins d'analyse, mais en aucun cas ne peut être diffusés publiquement.

Publications liées à la ressource

Emmanuel SCHANG, Aurore BOYER, Judith MUZERELLE, Jean-Yves ANTOINE, Iris ESHKOL, Denis MAUREL (2011) Coreference and anaphoric annotations for spontaneous speech corpos in French. Proc. DAARC'2011, Discourse Anaphora and Anaphor Resolu1on Colloquium, Faro, Portugal [HAL-00831414] document PDF