Le corpus parallèle inuktitut – anglais du Hansard du Nunavut 3.0

Par Conseil national de recherches du Canada

Autre titreThe Nunavut Hansard Inuktitut–English Parallel Corpus 3.0
Téléchargement
  1. (NUNAVUT-HANSARD-INUKTITUT-ENGLISH-PARALLEL-CORPUS-3.0.1.TGZ, 202.0 Mio)
DOITrouver le DOI : https://doi.org/10.4224/40001819
AuteurRechercher : 1; Rechercher : 1; Rechercher : 1; Rechercher : 1; Rechercher : 1; Rechercher : 1; Rechercher : 1; Rechercher : 2
Affiliation
  1. Conseil national de recherches du Canada. Technologies numériques
  2. US Army Research Laboratory
FormatTexte, Ensemble de données
Sujetcorpus parallèle; traduction automatique; alignement des phrases; langues autochtones; langues à faibles ressources
Résumé
Date de publication
Maison d’éditionConseil national de recherches du Canada
Déclaration de droit d’auteur
  • Pour le texte de ce corpus : © Assemblée législative du Nunavut 1999-2020
  • Pour les scripts et la documentation accompagnant ce corpus : © Sa Majesté la reine du chef du Canada 2020
Licence
Conditions d’utilisation
  • Nous avons choisi la licence CC-BY-4.0, qui autorise la production d’œuvres dérivées, tels qu’un alignement amélioré ou un système de traduction automatique entraîné, tout en exigeant que de telles œuvres dérivées préservent nos avis de Copyright, de non-responsabilité, de licence ainsi qu’une description des changements apportés. Prière d’inclure les fichiers LICENSE et README accompagnant le corpus avec toute œuvre dérivée créée à partir de ce corpus.
  • Nous vous encourageons à utiliser ce corpus pour créer des systèmes de traduction automatique ou toute autre technologie langagière.
  • Nous vous encourageons à améliorer les alignements du corpus : c’est la raison pour laquelle nous fournissons non seulement le corpus aligné, mais aussi les textes bruts dans le format d’un paragraphe par ligne, ainsi que les alignements de référence.
  • Une chose qui n’est pas autorisée : ce corpus et toute œuvre dérivée ne doivent pas être utilisés pour tenter de déformer les propos d’un membre de l’Assemblée législative du Nunavut, ni utilisés à des fins diffamatoires.
  • Toute œuvre ou article qui utilise ce corpus devrait citer l’article suivant: Eric Joanis, Rebecca Knowles, Roland Kuhn, Samuel Larkin, Patrick Littell, Chi-kiu Lo, Darlene Stewart et Jeffrey Micher. The Nunavut Hansard Inuktitut–English Parallel Corpus 3.0 with Preliminary Machine Translation Results. Soumis à LREC 2020.
Publication connexe
NoteL'alignement du corpus et la documentation et les scripts qui l'accompagnent ont été produits par le Conseil national de recherches du Canada.
AVIS DE NON-RESPONSABILITÉ : Ce corpus et tout travail dérivé qui en découle ne constituent pas une transcription ou une traduction officielle des débats de l'Assemblée législative du Nunavut et ne peuvent être interprétés comme une preuve de ce que ses membres ont dit. Pour consulter les comptes rendus officiels, veuillez visiter https://www.assembly.nu.ca/.
Langueinuktitut
Exporter la noticeExporter en format RIS
CollectionDonnées de recherche du CNRC
Identificateur de l’enregistrementc7e34fa7-7629-43c2-bd6d-19b32bf64f60
Enregistrement créé2020-01-20
Enregistrement modifié2023-02-24
Date de modification :