Traduction de contenu/Traduction automatique/Google Translate
Le support de la traduction automatique pour la traduction de contenu a été élargi. En plus de Apertium, LingoCloud, Matxin, Yandex et Youdao, nous sommmes en train d'ajouter Google Translate à la liste des systèmes de traduction automatique (machine translation - MT) disponibles pour les utilisateurs de la traduction de contennu. Ceci rajoutera un support de traduction automatique pour plus de 100 langues, comprenant plusieurs nouvelles langues qui n'étaient pas présentes antérieurement sur les systèmes.
Google Translate est fourni par Google – une compagnie de technologie multinationale basée aux Etats Unis. Différentes équipes à l'intérieur de la Fondation Wikimedia ont collaboré avec Google pour produire un accord qui autorisera l'utilisation de Google Translate sans compromettre les règles de Wikipedia concernant l'attribution des droits, la confidentialité de nos utilisateurs, et la représentation de la marque. Veuillez trouver les détails complémentaires de l'accord ci-dessous ; nous serions heureux de recevoir vos questions à propos de ce service.
Caractéristiques principales
- Aucune information personnelle est transmise à Google Translate. L'accès au service de traduction automatique se fera via les services de Google cloud. Le contenu des articles (sous licence libre) est envoyé vers les serveurs Google à partir des serveurs de la Fondation Wikimedia. Il n'y a pas de communication directe entre l'utilisateur et les services externes et aucune information personnelle (adresse IP, nom d'utilisateur) n'est envoyée aux serveurs Google. Le client qui contacte les serveurs Google est de source libre (open source) et vous pouvez le vérifier ici. Aucune partie du service ou du code Google ne feront partie de l'infrastructure Wikimedia ni de la base de code de la traduction de contenu. Pour plus de détails, voir le diagramme de la configuration technique, à la fin de la section.
- L'information renvoyée par Google Translate est sous licence libre. Lorsque Google Translate est utilisé, une version traduite du contenu Wikipedia sous licence libre, est obtenue. Les utilisateurs peuvent la modifier et la publier comme partie de Wikipedia sans enfreindre les polices existantes. Le contenu résultant traduit par Google Translate ainsi que les modifications de l'utilisateur seront disponibles sous la même licence que celle utilisée pour le reste des articles de Wikipedia.
- Profite à la plus large communauté de traduction des sources libres. Les traductions fournies par Google Translate ainsi que les modifications faites par les utilisateurs seront disponibles publiquement. Les traductions éditées a posteriori ont un intérêt particulier pour la communauté de recherche des traductions qui peut utiliser cette ressource pour créer des services de nouvelles traductions afin de prendre en charge les langues pour lesquelles la traduction automatique n'est pas encore dispponible. Cela va aider les développeurs à créer et à améliorer les systèmes de traduction automatique.
- Les utilisateurs peuvent la désactiver. La traduction automatique est un outil facultatif de la traduction de contenu. Les utilisateurs disposent d'une option pour la désactiver s'ils ne la trouvent pas utile pour quelque raison. Bien que beaucoup d'utilisateurs de la traduction de contenu aient demandé ce service de traduction, chacun peut décider de l'utiliser ou pas.
Résumé de l'accord avec Google
Obligations de Google
- Utiliser la clé de l'API de traduction sans frais pour la Fondation Wikimedia pour permettre aux bénévoles des sites Wikimedia de traduire les articles sur autant de caractères que nécessaire.
Obligations de la Fondation Wikimedia
- De fournir en retour à Google les versions du texte traduit par l'outil de traduction et corrigé par les utilisateurs, afin qu'il puisse améliorer son outil.
- Aucune donnée personnelle concernant les traducteurs ne sera partagée.
- Dans la requête à Google, ne seront envoyés que le contenu original à traduire, sa langue, ainsi que la langue cible.
- La traduction publiée par les traducteurs, avec ou sans l'aide des services de traduction automatique, sera fournie sous la forme de corpus parallèles par les APIs de traduction de contenu. Ces APIs seront développées de manière incrémentale, et les résultats seront disponibles librement pour tous et pas seulement pour Google.
Notes importantes
- Tout le contenu restera sous licence CC BY-SA 3.0
- Google ne requiert aucune « publicité » sur les sites Wikimedia en dehors de l'indication que Google Translate est une option de l'outil de traduction dans le menu déroulant de l'interface de traduction
- Il n'y a aucun échange d'informations personnelles concernant les bénévoles
- L'accord est valable une année à l'issue de laquelle nos besoins seront réévalués
- Nous sommes libres de mettre fin à l'accord pour n'importe quelle raison et à n'importe quel moment
- L'accord est régi par la loi des USA
Questions relatives à ce service
Nous avons évoqué dans cette section quelques questions immédiates à propos de Google. Ceci est également disponible sur la page de la FAQ de la traduction de contenu.
Quelles langues sont gérées par Google Translate ? Est-il prévu d'en ajouter de nouvelles ?
Google Translate peut être utilisé pour traduire dans toutes les langues disponibles sauf l'anglais qu'il n'est actuellement pas permis d'utiliser d'aucune sorte pour la traduction automatique.
En quoi l'utilisation de Google Translate est elle différente de celle d'Apertium ?
En tant qu'utilisateur de la traduction de contenu, vous ne verrez aucune différence dans l'interface de traduction car Google Translate affiche le contenu traduit de la même manière que Apertium le fait pour les paires de langues prises en charge.
Comment est réalisée la traduction automatique si je choisis Google Translate ?
Google Translate fournit une clé d'API qui permet aux sites web et aux autres services d'utiliser son système de traduction. La traduction de contenu utilise également cette unique clé d'API pour accéder aux services de Google Cloud pour Google Translate. Lorsqu'un utilisateur commence à traduire un article, le contenu HTML de chaque section de l'article source est envoyé à Google Translate et une version traduite est renvoyée et affichée dans la colonne de traduction associée à la traduction de contenu. Les liens et les références sont adaptés comme d'habitude et les utilisateurs peuvent modifier leur contenu si nécessaire.
Ce processus est reconduit pour toutes les sections de l'article à traduire. Pour améliorer les performances, les traductions de sections consécutives sont préchargées. L'utilisateur peut sauvegarder la traduction non publiée (pour la reprendre plus tard) ou publier l'article de manière habituelle. L'article est publié sur Wikipedia comme tout autre article normal, avec sa paternité et les licences associées.
Google Translate n'est pas basé sur un logiciel libre. Pourquoi l'utiliser ?
La traduction de contenu a évolué en raison du besoin persistant de réduire l'écart sur la quantité de contenu des Wikipedias des différentes langues. Comme n'importe quel autre logiciel utilisé sur les sites Wikimedia, la traduction de contenu est également du source libre. Dans ce cas particulier également, nous utilisons un client à source ouvert pour interagir avec le service externe et importer le contenu de licence libre pour aider les utilisateurs à développer la connaissance libre.
Pour utiliser Google Translate nous n'ajoutons pas de logiciel propriétaire dans le code de la traduction de contenu, ni sur les sites web, ni dans les serveurs Wikimedia. Le service est gratuit comme faisant partie de l'offre de Google à la Fondation Wikimedia.
Seul le contenu disponible librement des articles Wikipédia (par segment) est envoyé à Google Translate et le contenu traduit obtenu est utilisable librement dans les pages Wikipédia. Le contenu traduit peut être modifié par les utilisateurs et ces données sont également disponibles publiquement sous licence libre à travers l'API de traduction de contenu. Ceci est une ressource de valeur rendue disponible pour que la communauté développe des services de traduction à source ouvert pour les langues où ceux-ci n'existent pas encore.
Après avoir étudié soigneusement les implications, nous arrivons au constat de que le fait que le contenu ait été initialement stocké dans un service à source fermé, ne limite pas la liberté de notre connaissance ni notre logiciel, actuellement ni dans le futur. Nous avons pris un soin spécial pour nous assurer que le contenu fourni est sous licence libre pour garantir qu'il est conforme aux polices de Wikipedia. Cela comprend un long processus d'évaluation et de conformité légale et technique. Le résumé de notre accord est également disponible ci-dessus.
D'après les commentaires des utilisateurs, nous avons vu que le support de traduction automatique est réellement utile pour les utilisateurs et nous voulons prendre en charge toutes les langues de la meilleure manière possible. Guidés par les principes de résolution de la Fondation Wikimedia pour supporter le logiciel libre et ouvert, nous donnerons priorité à l'intégration des services à source ouvert partout où ils seront disponibles pour une langue. Apertium a été une partie critique de la traduction de contenu depuis sa création, mais actuellement, il ne fournit la traduction automatique que pour environ 30 langues parmi toutes celles que Wikipedia peut prendre en charge.
Devrais-je m'inquiéter au sujet de mes données personnelles en utilisant Google Translate ?
Quelque soit le service utilisé, soyez assuré que seul le contenu Wikipedia des articles existants est envoyé, et uniquement le contenu sous licence libre est ajouté en retour dans la traduction. Aucune information personnelle n'est envoyée et la communication avec ces services se fait côté serveur, de sorte à isoler l'équipement de l'utilisateur. Veuillez prendre connaissance de ce diagramme pour plus de détails.
Que faire si Google Translate est le seul outil de traduction automatique disponible et que je ne veux pas l'utiliser ?
La traduction automatique est une fonctionnalité optionnelle de la traduction de contenu, que vous pouvez facilement désactiver à votre guise. Si plusieurs systèmes de traduction automatique sont ajoutés pour vos langues, vous pouvez choisir de réactiver la traduction automatique et sélectionner le service de traduction de votre choix.
Le texte traduit avec Google Translate sera-t-il libre d'utilisation dans Wikipédia ?
Oui. Le contenu reçu de Google Translate est par ailleurs disponible librement sur la plateforme de traduction web. La traduction de contenu le reçoit via une clé d'API pour le rendre parfaitement disponible sur l'interface de traduction. Ce contenu peut être modifié par les utilisateurs (si nécessaire) et être utilisé dans les articles Wikipedia sous des licences libres.
Est-ce que ce contenu peut être utilisé pour améliorer les systèmes de traduction automatique en général ?
Oui. Les traductions faites par la traduction de contenu sont enregistrées dans notre base de données. Cette information sera rendue disponible publiquement pour chacun afin d'être utilisée comme exemples de traduction pour améliorer ses services de traduction (allant des groupes de recherche universitaires, des projets en source libre, jusqu'aux entreprises commerciales, tous ! ). Le contenu peut être accédé via l'API Content Translation. Veuillez noter que seules les informations associées au texte traduit sont rendues publiques. Ceci comprend le texte source et traduit, la source, les informations concernant la langue cible, et un identifiant de la portion de texte.
Voir aussi
- FAQ du projet Glow - FAQ du partenariat entre la Fondation Wikimedia et Google
- Soutenir le programme des Wikipedias en langue indienne - Collaboration de la Fondation Wikimedia et Google avec le Centre for Internet and Society (CIS), le chapître Wikimedia India (WMIN) et les groupes utilisateur pour un pilote; un programme qui encourage les communautés Wikipedia à créer du contenu local et de haute qualité dans les différentes langues indiennes. Avec le projet Tiger
- FAQ à propos des outils de traduction de contenu
- Suivi de la tâche Phabricator pour ajouter davantage de services de traduction automatique