Traduction de contenu/Traduction automatique/Matxin
La prise en charge de la traduction de contenu (Content Translation) est dorénavant étendue. En plus de Apertium, Yandex et Youdao, nous avons ajouté Matxin à la liste des systèmes de traduction automatique (MT - machine translation) disponibles pour les utilisateurs de la traduction de contenu. Cela a pour conséquence la prise en charge supplémentaire de la traduction automatique de quelques langues.
Matxin est fourni par une équipe de l' Université du Pays Basque, en collaboration avec la Fondation Elhuyar. Ce système de traduction automatique a été créé par cette équipe initialement pour leur propres besoins, afin d'écrire les articles Wikipedia en basque et en espagnol. Différentes équipes à l'intérieur de la Fondation Wikimedia ont collaboré avec l'équipe Matxin pour produire un accord qui autorisera l'utilisation de Matxin sans compromettre les règles de Wikipedia concernant l'attribution des droits, la confidentialité de nos utilisateurs, et la représentation de la marque. Matxin est un logiciel libre (open source). Pour la facilité de son utilisation, nous utilisons l'API la plus adaptée à la traduction automatique, pour accéder au service hébergé par l'équipe. Veuillez trouver ci-dessous davantage de détails sur l'accord et nous serions heureux de recevoir vos questions à propos de ce service.
Caractéristiques principales
- Aucune information personnelle est envoyée à Matxin. Le système de traduction automatique sera accédé par une clé d'API. Le contenu des articles (sous licence libre) est envoyé au serveur Matxin à partir des serveurs de la Fondation Wikimedia. Il n'y a pas de communication directe entre l'utilisateur et les services externes et aucune information personnelle (adresse IP, nom d'utilisateur) n'est envoyée au service Matxin. Le client qui contacte Matxin est un source libre et vous pouvez le voir ici. Aucune partie du service Matxin ou de son code, ne fera partie de l'infrastructure Wikimedia ou de la base de code de la traduction de contenu. Voir également un diagramme de cette configuration technique à la fin de la section.
- L'information est renvoyée par Matxin sous une licence libre. Lorsque Matxin est utilisé, une version traduite du contenu Wikipedia sous licence libre, est obtenue. Les utilisateurs peuvent le modifier et le publier en tant que partie de Wikipedia, sans enfreindre les politiques existantes. Le contenu résultant traduit par Matxin ainsi que les modifications de l'utilisateur seront disponibles sous la même licence que celle utilisée pour le reste des articles de Wikipedia.
- Bénéficie à la plus large communauté de traduction des sources libres. Les traductions fournies par Matxin ainsi que les modifications faites par les utilisateurs seront disponibles publiquement. Les traductions corrigées après coup ont un intérêt particulier pour la communauté de recherche sur la traduction (y compris pour l'équipe Matxin elle-même) qui peut utiliser cette ressource pour créer de nouveaux services de traduction afin de prendre en charge des langues pour lesquelles la traduction automatique libre n'est pas encore disponible. Cela va aider les développeurs à créer et à améliorer les systèmes de traduction automatique.
- Les utilisateurs peuvent la désactiver. La traduction automatique est un outil facultatif de la traduction de contenu. Les utilisateurs disposent d'une option pour le désactiver s'ils ne le trouvent pas utile pour quelque raison. Bien que beaucoup d'utilisateurs de la traduction de contenu aient demandé ce service de traduction, chacun peut éventuellement décider de ne pas l'utiliser.
Résumé de la convention avec Matxin
Obligations de Matxin
- Autoriser l'utilisation libre de la clé de son API de traduction automatique par la Fondation Wikimedia pour permettre aux bénévoles des sites Wikimedia de traduire les articles et de prendre en charge au moins 10 millions de caractères de traduction de contenu par jour.
Obligations de la Fondation Wikimedia
- De fournir en retour les versions du texte traduit par l'outil de traduction et modifié par les utilisateurs, à Matxin afin qu'ils améliorent leur outil.
- Aucune donnée personnelle concernant les traducteurs ne sera partagée.
- Dans la requête à Matxin, ne seront envoyés que le contenu original à traduire et sa langue, ainsi que la langue cible.
- La traduction publiée par les traducteurs, avec ou sans l'aide des services de traduction automatique, sera fournie sous la forme de corpus parallèles par les APIs Content Translation. Ces APIs seront développées de manière incrémentale, et les résultats seront disponibles librement à tous et pas seulement pour Matxin.
Notes importantes
- Tous les contenus resteront sous la licence CC BY-SA 3.0
- Matxin ne requiert aucune « publicité » sur les sites Wikimedia en dehors de l'indication que Matxin est une option de l'outil de traduction dans le menu déroulant de l'interface de traduction
- Il n'y a pas d'échange d'informations personnelles concernant les bénévoles
- L'accord est valable une année à l'issue de laquelle nos besoins seront réévalués
- Nous sommes libres de mettre fin à l'accord pour toute raison et à n'importe quel moment (avec un préavis de 30 jours)
- L'accord est régi par la loi des USA
Questions relatives à ce service
Nous avons évoqué dans cette section quelques questions immédiates à propos de Matxin. Ceci est également disponible sur la page de la FAQ de la traduction de contenu.
Quelles langues sont gérées par Matxin ? Est-il prévu d'en ajouter de nouvelles ?
Matxin peut être utilisé pour traduire de l'espagnol vers le basque. Au fur et à mesure que d'autres langues seront ajoutées au service par les développeurs de l'équipe Matxin, nous les incluerons.
En quoi l'utilisation de Matxin diffère de celle des autres services de traduction automatisée ?
En tant qu'utilisateur de la traduction de contenu, vous ne verrez aucune différence dans l'interface de traduction car Matxin affiche le contenu traduit de la même manière que les autres services actuels pour les paires de langues prises en charge.
Comment est réalisée la traduction si je choisis Matxin ?
Matxin fournit une clé d'API qui permet aux sites web et aux autres services d'utiliser son système de traduction. Content Translation utilise aussi cette clé unique d'API pour accéder à Matxin. Lorsqu'un utilisateur commence à traduire un article, le contenu HTML de chaque section de l'article source est envoyé à Matxin et une version traduite est renvoyée et affichée dans la colonne de traduction respective de la traduction de contenu. Les liens et les références sont adaptés comme d'habitude et les utilisateurs peuvent modifier le contenu si nécessaire.
Ce processus est reconduit pour toutes les sections de l'article à traduire. Pour améliorer les performances, les traductions de sections consécutives sont préchargées. L'utilisateur peut sauvegarder la traduction non publiée (pour la reprendre plus tard) ou publier l'article de manière habituelle. L'article est publié sur Wikipedia comme tout autre article normal, avec sa paternité et les licences associées.
Voici un diagramme du processus.
Est-ce que Matxin est un logiciel libre ?
Oui, ceci est un logiciel libre, similaire à Apertium. Elle a été développée par une petite équipe de l'Université du Pays Basque qui a conçu cet outil pour ses propres besoins de traduction des articles Wikipedia. Ils font partie intégrante de la communauté Wikimedia et nous sommes heureux de collaborer avec eux.
Dois-je m'inquiéter au sujet de mes données personnelles quand j'utilise Matxin ?
Quelque soit le service utilisé, soyez assuré que seul le contenu Wikipedia des articles existants est envoyé, et uniquement le contenu sous licence libre est ajouté en retour dans la traduction. Aucune information personnelle n'est envoyée et la communication avec ces services se fait au niveau du serveur, donc elles sont isolées de l'équipement de l'utilisateur. Veuillez vous référer à ce diagramme pour plus de détails.
Que faire si Matxin est le seul outil de traduction automatique disponible et que je ne veux pas l'utiliser ?
La traduction automatisée est une fonctionnalité optionnelle de la traduction de contenu, que vous pouvez facilement désactiver à votre guise. Si plusieurs systèmes de traduction automatique sont ajoutés pour vos langues, vous pouvez choisir de réactiver la traduction automatique et sélectionner le service de traduction de votre choix.
Le texte traduit avec Matxin sera-t-il libre d'utilisation dans Wikipédia ?
Oui. Le contenu reçu de Matxin est par ailleurs disponible librement sur la plateforme de traduction web. C'est un logiciel libre. Par facilité d'utilisation, la traduction de contenu le reçoit via une clé d'API et le rendre parfaitement disponible sur l'interface de traduction. Ce contenu peut être modifié par les utilisateurs (si nécessaire) et utilisé dans les articles Wikipedia sous licences libres.
Est-ce que ce contenu peut être utilisé pour améliorer les systèmes de traduction automatique en général ?
Oui. Les traductions faites par Content Translation sont enregistrées dans notre base de données. Cette information sera rendue disponible publiquement pour chacun afin d'être utilisée comme exemples de traduction pour améliorer ses services de traduction (allant des groupes de recherche universitaires, des projets en source libre, jusqu'aux entreprises commerciales, tous ! ). Le contenu peut être accédé via l' API Content Translation. Veuillez noter que seules les informations associées au texte traduit sont rendues publiques. Ceci comprend les sources avec le texte traduit, les informations concernant la langue source ainsi que la cible, et un identifiant de la portion de texte.