Content translation/Machine Translation/Matxin/nl
De ondersteuning voor machinevertaling voor Content Translation is nu verder uitgebreid. Naast Apertium Yandex en Youdao, voegen we nu Matxin toe aan de lijst met automatische vertaalsystemen (MT) die beschikbaar zijn voor gebruikers van Content Translation. Dit zal resulteren in extra machinevertalingsondersteuning voor een paar talen.
Matxin wordt geleverd door een team van de Universiteit van Baskenland, in samenwerking met de Elhuyar Foundation. Dit machinevertalingsysteem is door dit team voornamelijk gemaakt voor eigen gebruik voor het schrijven van Wikipedia-artikelen in het Baskisch en Spaans. Verschillende teams binnen de Wikimedia Foundation hebben samen met het Matxin-team gewerkt om een overeenkomst uit te werken die het gebruik van Matxin zal toestaan zonder het beleid van Wikipedia over het toewijzen van rechten, de privacy van onze gebruikers en de vertegenwoordiging van het merk te schaden. Matxin is open source software. Voor het gebruiksgemak gebruiken we de handigere API voor machinevertaling om toegang te krijgen tot de service die door het team wordt gehost. Hieronder vindt u meer details van de overeenkomst en we horen graag al uw vragen over deze service.
Belangrijkste functies
- Er worden geen persoonlijke gegevens naar Matxin gestuurd. Het MT-systeem wordt via een API-sleutel benaderd. Artikel-inhoud (vrij gelicentieerd) wordt naar de Matxin-server verzonden vanaf de servers van de Wikimedia Foundation. Er is geen directe communicatie tussen de gebruiker en externe diensten en er worden geen persoonlijke gegevens (IP, gebruikersnaam) naar de Matxin-service verzonden. De cliënt die contact met Matxin heeft is open source en u kunt die source hier bekijken. Geen enkel deel van de service of code van Matxin zal deel uitmaken van de Wikimedia-infrastructuur of de codebasis van Content Translation. Zie ook het diagram van de technische weergave aan het eind van het gedeelte.
- De informatie die wordt geretourneerd door Matxin is onder een vrije licentie. Wanneer Matxin wordt gebruikt, wordt een vertaalde versie van de Wikipedia-inhoud onder een gratis licentie verkregen. Gebruikers kunnen het wijzigen en publiceren als onderdeel van Wikipedia zonder conflicten met bestaande beleid. De inhoud die wordt vertaald door Matxin en de gebruikerswijzigingen zullen beschikbaar zijn onder dezelfde licentie die wordt gebruikt voor de rest van de artikelen in Wikipedia.
- Komt ten goede aan de bredere open source-vertaalgemeenschap. Vertalingen verkregen van Matxin en gebruikerswijzigingen zullen openbaar beschikbaar zijn. De vertalingen na het bewerken zijn van bijzonder belang voor de vertaalonderzoeksgemeenschap (inclusief het Matxin-team) die deze bron kan gebruiken om nieuwe vertaaldiensten te creëren ter ondersteuning van talen waarvoor nog geen open source machinevertaling beschikbaar is. Dit zal de ontwikkelaars helpen om machinevertalingssystemen te creëren en te verbeteren.
- Gebruikers kunnen het uitschakelen. Automatische vertaling is een optioneel hulpmiddel bij het vertalen van inhoud. Gebruikers hebben de mogelijkheid om het te deactiveren als ze het om een of andere reden niet nuttig vinden. Hoewel veel Content Translation-gebruikers deze vertalingsdienst hebben aangevraagd, besluit elke gebruiker uiteindelijk of hij of zij deze wil gebruiken of niet.
Samenvatting van onze overeenkomst met Matxin
Verplichtingen van Matxin
- Om het gebruik van hun machine vertaal API-sleutel gratis te laten plaatsvinden via de Wikimedia Foundation om vrijwilligers op Wikimedia-sites artikelen te laten vertalen en minstens 10 miljoen tekens van vertalingsinhoud per dag te ondersteunen.
Verplichtingen van de Wikimedia Foundation
- Om de door vrijwilligers geredigeerde versies van de tekst te leveren die door het vertaalhulpmiddel zijn vertaald, zodat Matxin hun hulpmiddel kan verbeteren
- Er worden geen persoonsgegevens van vertalers gedeeld.
- Alleen de originele inhoud die moet worden vertaald, de taal en de vertaaldoeltaal worden in het verzoek aan Matxin verzonden.
- De vertalingen die door vertalers worden gepubliceerd, met of zonder de hulp van automatische vertaaldiensten, worden geleverd in de vorm van parallelle corpora door de API's voor inhoudsvertaling. Deze API's zullen geleidelijk worden ontwikkeld en de resultaten zullen vrij beschikbaar zijn voor iedereen, niet alleen voor Matxin.
Belangrijke notities
- Alle inhoud blijft onder licentie CC BY-SA 3.0
- Matxin vereist geen "branding" op Wikimedia-sites buiten het vermelden van Matxin als een vertaalhulpmiddel in het dropdown menu van het vertaalinterface
- Er is geen uitwisseling van persoonlijke informatie van vrijwilligers
- De overeenkomst is beperkt tot 1 jaar, waarop we onze behoeften kunnen herzien
- Wij zijn vrij om de overeenkomst om welke reden dan ook en op elk moment te beëindigen (met 30 dagen voorafgaande kennisgeving)
- Overeenkomst is onderworpen aan het Amerikaanse recht
Vragen over deze service
In dit gedeelte hebben wij enkele vragen over Matxin al behandeld. Dit is ook beschikbaar in de pagina Veelgestelde vragen Content Translation.
Welke talen worden door Matxin behandeld? Zijn er plannen om er meer toe te voegen?
Matxin kan worden gebruikt om van het Spaans naar het Baskisch te vertalen. Als de ontwikkelaars van het Matxin-team meer talen aan de service toevoegen, zullen we ze ook toevoegen.
Is het gebruik van Matxin anders dan bij een ander machinevertalingssysteem?
Als gebruiker van Content Translation zult u geen verschil voelen op de vertaalinterface, omdat Matxin de vertaalde inhoud weergeeft op dezelfde manier als de andere services doen.
Hoe wordt de machinevertaling uitgevoerd als ik voor Maxtin kies?
Matxin biedt een API-sleutel waarmee websites en andere diensten hun vertaalsysteem kunnen gebruiken. Content Translation gebruikt ook die unieke API-sleutel om toegang te krijgen tot Matxin. Wanneer een gebruiker een artikel begint te vertalen, wordt de HTML-inhoud van elk deel van het bronartikel naar Matxin gestuurd en wordt een vertaalde versie verkregen en weergegeven in de respectieve vertalingscolumn van Content Translation. De links en verwijzingen worden zoals gewoonlijk aangepast en de gebruikers kunnen de inhoud zo nodig wijzigen.
Dit proces gaat door voor alle delen van het artikel die worden vertaald. Voor een betere prestatie worden de vertalingen voor opeenvolgende delen vooraf gelezen. De gebruiker kan de ongepubliceerde vertaling opslaan (om later opnieuw aan deze vertaling te werken) of het artikel op de gebruikelijke manier publiceren. Het artikel wordt op Wikipedia gepubliceerd zoals elk ander normaal artikel met passende toeschrijving en licenties.
Is Matxin gebaseerd op open source software?
Ja, dat is het. Het is open source software, vergelijkbaar met Apertium. Het is ontwikkeld door een team van de Universiteit van Baskenland die dit hulpmiddel heeft ontwikkeld voor hun eigen behoefte om Wikipedia-artikelen te vertalen. Ze maken deel uit van de Wikimedia-gemeenschap en we zijn blij om met hen samen te werken.
Moet ik me zorgen maken over mijn persoonlijke gegevens bij het gebruik van Matxin?
Ongeacht welke service u gebruikt, u kunt er zeker van zijn dat alleen Wikipedia-inhoud uit bestaande artikelen wordt verzonden en alleen vrij gelicentieerde inhoud zal worden toegevoegd aan de vertaling. Er wordt geen persoonlijke informatie verzonden en de communicatie met die diensten vindt plaats aan de serverzijde, dus deze worden geïsoleerd van het gebruikersapparaat. Raadpleeg dit diagram voor meer details.
Wat als Matxin het enige beschikbare hulpmiddel voor automatische vertaling is en ik het niet wil gebruiken?
Machine Translation is een optionele functie in Content Translation die u gemakkelijk kunt uitschakelen. Als er voor uw talen meer machinevertalingssystemen worden toegevoegd, kunt u ervoor kiezen om MT opnieuw in te schakelen en de MT-service van uw keuze te selecteren.
Is de door Matxin vertaalde inhoud vrij voor gebruik in Wikipedia?
Ja, dat is het. De inhoud die van Matxin wordt ontvangen is vrij beschikbaar op het webvertalingsplatform. Het is open source software. Om het gebruiksgemak te verbeteren ontvangt Content Translation het via een API-sleutel om het naadloos beschikbaar te maken op de vertaalinterface. Deze inhoud kan door de gebruikers worden gewijzigd (indien nodig) en gebruikt in Wikipedia-artikelen onder vrije licenties.
Kan deze inhoud worden gebruikt voor het verbeteren van automatische vertaalsystemen in het algemeen?
Ja, dat is het. Vertalingen die in Content Translation zijn gemaakt, worden opgeslagen in onze database. Deze informatie zal openbaar worden gemaakt voor iedereen om als vertaalvoorbeelden te gebruiken om hun vertaaldiensten te verbeteren (van universitaire onderzoeksgroepen, open sourceprojecten tot commerciële bedrijven, iedereen!). De inhoud is toegankelijk via de API voor het vertalen van inhoud. Let op: alleen informatie met betrekking tot vertaalde tekst is openbaar. Dit omvat - bron- en vertaalde tekst, bron- en doeltaalinformatie en een identificatiecode voor het tekstsegment.