Traduction de contenu/Traduction automatique/Yandex
Depuis le 4 novembre 2015, le système de traduction automatique Yandex est mis à la disposition des utilisateurs de la Traduction de contenu. En raison de sa popularité parmi les utilisateurs russes de Wikipédia, l'inclusion du service Yandex.Translate était une fonctionnalité demandée. Initialement, il a été introduit pour traduire les pages Wikipédia de l'anglais vers le russe. Cependant, le service est désormais étendu à toutes les langues fournies via Yandex.
Yandex.Translate est fourni par Yandex – une compagnie de services Internet russe. Depuis fin 2014, l'équipe juridique de la Fondation Wikimedia et Yandex ont collaboré pour élaborer un accord qui permettra l'utilisation de Yandex.Translate sans compromettre la politique d'attribution des droits de Wikipédia, la confidentialité de nos utilisateurs et la représentation de la marque. Les termes de l'accord sont ci-dessous et nous serions heureux de recevoir toute question que vous pourriez avoir à propos de ce service.
Caractéristiques principales
- Aucune information personnelle n'est envoyée à Yandex. Le système MT sera accessible via une API publiquement disponible à l'aide d'une clé. Le contenu de l'article (licence libre) est envoyé aux serveurs Yandex à partir des serveurs de la Fondation Wikimedia. Aucune communication directe n'a lieu entre l'utilisateur et les services externes et aucune information personnelle (IP, nom d'utilisateur) n'est envoyée aux serveurs Yandex. Le client contactant les serveurs Yandex est open source et vous pouvez le vérifier ici. Aucune partie du service ou du code de Yandex ne fera partie de l'infrastructure Wikimedia ou de la base de code de traduction de contenu
- Les informations sont renvoyées par Yandex sous une licence gratuite. Lorsque le service Yandex est utilisé, il fournit une version traduite du contenu de Wikipedia sous une licence gratuite. Les utilisateurs peuvent le modifier et le publier dans le cadre de Wikipedia sans entrer en conflit avec les politiques existantes. Le contenu résultant traduit par Yandex et les modifications de l'utilisateur seront disponibles sous la même licence que celle utilisée pour le reste des articles de Wikipedia.
- Bénéficie à la communauté élargie des traducteurs open source. Les traductions obtenues auprès de Yandex et les modifications des utilisateurs seront accessibles au public. Les traductions post-éditées présentent un intérêt particulier pour la communauté de recherche en traduction qui peut utiliser cette ressource pour créer de nouveaux services de traduction prenant en charge les langues pour lesquelles la traduction automatique open source n'est pas encore disponible. Cela aidera les développeurs à créer et à améliorer les systèmes de traduction automatique.
- Les utilisateurs peuvent le désactiver. La traduction automatique est un outil optionnel de la traduction de contenu. Les utilisateurs ont la possibilité de le désactiver s'ils ne le trouvent pas utile pour une raison quelconque. Bien que de nombreux utilisateurs de la communauté russe aient demandé ce service, chaque utilisateur individuel décide finalement s'il souhaite l'utiliser ou non.
Résumé des termes de la convention avec Yandex
Obligations de Yandex
- Concéder gratuitement leur clé API Yandex.Translate à la Fondation Wikimedia afin de permettre aux bénévoles des sites Wikimedia de traduire les articles
- Permettre aux bénévoles de traduire jusqu'à dix millions de caractères par jour (beaucoup plus que leur option accessible au public)
- Donner à Wikimedia des données statistiques sur la quantité de caractères dans les requêtes envoyées
Obligations de la Fondation Wikimedia
- Fournir les versions éditées par des bénévoles du texte traduit par l'outil de traduction afin que Yandex puisse améliorer son outil
- Aucune donnée personnelle des traducteurs ne sera partagée.
- Actuellement, seuls le contenu original à traduire, sa langue et la langue cible de la traduction sont envoyés dans la demande à Yandex.
- Les traductions publiées par des traducteurs, avec ou sans l'aide de services de traduction automatique, seront fournies sous la forme de corpus parallèles par les API de traduction de contenu. Ces API seront développées progressivement et les résultats seront librement disponibles pour chacun, pas seulement Yandex.
Notes importantes
- Tout le contenu restera sous licence CC BY-SA 3.0
- Yandex n'exige aucune image de sa marque sur les sites Wikimedia en dehors de la liste Yandex.Translate en tant qu'option d'outil de traduction dans le menu déroulant de l'interface de traduction
- Il n'y a pas d'échange d'informations personnelles des bénévoles
- L'accord est limité à 1 an, date à laquelle nous pouvons réévaluer nos besoins
- Nous sommes libres de résilier le contrat pour quelque raison que ce soit, à tout moment (avec un préavis de 30 jours)
- L'accord est régi par la loi américaine
Questions relatives à ce service
Nous avons répondu à quelques questions immédiates sur Yandex dans cette section. Ceci est également disponible dans la page FAQ sur la traduction de contenu.
Quelles langues sont gérées par Yandex ? Est-il prévu d'en ajouter de nouvelles ?
Yandex est actuellement disponible dans plus de 70 langues. Au fur et à mesure que la couverture linguistique de Yandex s'étendra, nous envisagerons de les activer pour la traduction de contenu. Remarque : la traduction automatique Yandex ne sera pas disponible lors de la création de pages en anglais.
En quoi l'utilisation de Yandex diffère-t-elle de celle des autres systèmes de traduction automatique ?
En tant qu'utilisateur de la Traduction de contenu, vous ne verrez aucune différence sur l'interface de traduction car le système de traduction automatique de Yandex affiche le contenu traduit de la même manière qu'Apertium le fait actuellement pour les 45 paires de langues prises en charge.
Comment est réalisée la traduction si je choisis Yandex ?
Yandex fournit une clé d'API gratuite qui permet aux sites Web et à d'autres services d'utiliser leur système de traduction. La Traduction de contenu utilise également une clé API unique pour accéder à ce service sur le serveur de Yandex. Lorsqu'un utilisateur commence à traduire un article, le contenu HTML de chaque section de l'article source est envoyé au serveur Yandex et une version traduite est obtenue et affichée dans la colonne de traduction respective de la Traduction de contenu. Les liens et les références sont adaptés comme d'habitude et les utilisateurs peuvent modifier le contenu selon leurs besoins.
Ce processus se poursuit pour toutes les sections de l'article en cours de traduction. Pour de meilleures performances, les traductions des sections consécutives sont pré-extraites. L'utilisateur peut sauvegarder la traduction non publiée (pour y retravailler ultérieurement) ou publier l'article de la manière habituelle. L'article est publié sur Wikipédia comme tout autre article normal avec l'attribution et les licences appropriées.
Voir le diagramme du processus.
Yandex n'est pas basé sur un logiciel libre. Pourquoi l'utiliser ?
La traduction de contenu a évolué à partir d'un besoin de longue date de combler l'écart dans la quantité de contenu entre les Wikipédia des différentes langues. Comme tous les autres logiciels utilisés sur les sites Wikimedia, la Traduction de contenu est également open source. Dans ce cas particulier également, nous utilisons un client open source pour interagir avec le service externe et importer du contenu sous licence libre afin d'aider les utilisateurs à élargir nos connaissances gratuites.
Pour utiliser le système de traduction automatique de Yandex, nous n'ajoutons aucun logiciel propriétaire dans le code de traduction de contenu, ni sur les sites Web et les serveurs Wikimedia. Le service est gratuit et accessible à tous.
Seul le contenu de l'article Wikipédia librement disponible (par segments) est envoyé au service Yandex et le contenu traduit obtenu est librement utilisable sur les pages Wikipédia. Le contenu traduit peut être modifié par les utilisateurs et ces données sont également disponibles publiquement sous une licence gratuite via l'API de Traduction du contenu. Il s'agit d'une ressource précieuse mise à la disposition de la communauté pour développer des services de traduction open source pour les langues où ils n'existent pas encore.
Après avoir étudié attentivement les implications, nous avons constaté que le fait que le contenu était auparavant stocké dans un service à source fermée ne limite pas la liberté de nos connaissances ou de nos logiciels dans le présent ou le futur. Nous avons pris un soin particulier à nous assurer que le contenu fourni est sous licence libre pour nous assurer qu'il est conforme aux politiques de Wikipédia. Cela comprend un long processus d'évaluation et de conformité juridique et technique. Le résumé des conditions d'utilisation est également disponible.
D'après les commentaires des utilisateurs, nous avons constaté que la prise en charge de la traduction automatique est vraiment utile pour les utilisateurs et nous souhaitons prendre en charge toutes les langues de la meilleure façon possible. Guidés par les principes de la résolution de la Fondation Wikimedia pour soutenir les logiciels libres et open source, nous accorderons la priorité à l'intégration de services open source chaque fois qu'ils sont disponibles pour une langue. Apertium est un élément essentiel de la traduction de contenu depuis sa création, mais actuellement, il ne fournit des traductions automatiques que pour 45 des nombreuses combinaisons de langues possibles que Wikipedia peut prendre en charge.
Devrais-je m'inquiéter au sujet de mes données personnelles en utilisant Yandex ?
Quelque soit le service utilisé, vous pouvez être sûr que seul le contenu Wikipédia des articles existants est envoyé et que seul le contenu sous licence libre sera ajouté à la traduction. Aucune information personnelle n'est envoyée et la communication avec ces services se fait côté serveur, ils sont donc isolés de l'équipement de l'utilisateur. Veuillez vous référer à ce diagramme pour plus de détails.
Que faire si Yandex est le seul outil de traduction automatique disponible et je ne veux pas l'utiliser ?
La traduction automatique est une fonctionnalité facultative de la traduction de contenu que vous pouvez facilement désactiver à volonté. Si d'autres systèmes de traduction automatique sont ajoutés pour vos langues, vous pouvez choisir d'activer à nouveau MT et sélectionner le service MT de votre choix.
Le texte traduit avec Yandex sera-t-il libre d'utilisation dans Wikipédia ?
Oui. Le contenu reçu de Yandex est par ailleurs librement disponible sur la plateforme de traduction Web Yandex. La traduction de contenu le reçoit via une clé API pour le rendre disponible de manière transparente sur l'interface de traduction. Ce contenu peut être modifié par les utilisateurs (si nécessaire) et utilisé dans les articles Wikipédia sous licences libres.
Est-ce que ce contenu peut être utilisé pour améliorer les systèmes de traduction automatique en général ?
Oui. Les traductions effectuées dans la Traduction de contenu sont enregistrées dans notre base de données. Ces informations seront mises à la disposition du public pour que quiconque les utilise comme exemples de traduction afin d'améliorer leurs services de traduction (des groupes de recherche universitaires, des projets open source aux entreprises commerciales, n'importe qui !). Le contenu est accessible via l'API de traduction de contenu. Veuillez noter que seules les informations relatives au texte traduit sont accessibles au public. Cela comprend – le texte source et traduit, les informations sur la langue source et cible et un identifiant pour le segment de texte.