Content translation/Machine Translation/Yandex/nl
Sinds 4 november 2015 is het Yandex machinevertalingssysteem beschikbaar voor gebruikers van Content Translation. Vanwege de populariteit onder Russische Wikipedia-gebruikers, opname van de service Yandex.Translate was dit een gevraagde functie. Aanvankelijk werd het geïntroduceerd voor het vertalen van Wikipedia-pagina's van het Engels naar het Russisch. De service is nu echter uitgebreid voor alle talen die via Yandex worden geleverd.
Yandex.Translate wordt geleverd door Yandex – een Russisch internetbedrijf. Sinds eind 2014 hebben het juridische team van de Wikimedia Foundation en Yandex samengewerkt om een overeenkomst uit te werken die het gebruik van Yandex.Translate mogelijk maakt zonder het beleid van Wikipedia van toewijzing van rechten, privacy van onze gebruikers en merkvertegenwoordiging in gevaar te brengen. De voorwaarden van de overeenkomst staan hieronder en we horen graag eventuele vragen die u hierover heeft service.
Belangrijkste functies
- Er wordt geen persoonlijke informatie naar Yandex verzonden. Het MT-systeem wordt benaderd via een openbaar beschikbare API met behulp van een sleutel. Artikelinhoud (met vrije licentie) wordt vanaf de servers van de Wikimedia Foundation naar Yandex-servers verzonden. Er vindt geen directe communicatie plaats tussen de gebruiker en externe diensten en er wordt geen persoonlijke informatie (IP, gebruikersnaam) naar yandex-servers verzonden. De client die contact opneemt met Yandex-servers is open source en u kunt het hier controleren. Geen enkel deel van Yandex's service of code zal deel uitmaken van de Wikimedia-infrastructuur of de codebase voor het vertalen van inhoud
- Informatie wordt geretourneerd door Yandex onder een vrije licentie. Wanneer de Yandex-service wordt gebruikt, bieden ze een vertaalde versie van Wikipedia-inhoud onder een vrije licentie. Gebruikers kunnen het wijzigen en publiceren als onderdeel van Wikipedia zonder conflicten met bestaand beleid. De resulterende inhoud vertaald door Yandex en de gebruikerswijzigingen zullen beschikbaar zijn onder dezelfde licentie die wordt gebruikt voor de rest van de artikelen in Wikipedia.
- Voordelen voor de bredere open source vertaalgemeenschap. Vertalingen verkregen van Yandex en gebruikerswijzigingen zullen openbaar beschikbaar zijn. De nabewerkte vertalingen zijn van bijzonder belang voor de vertaalonderzoeksgemeenschap die deze bron kan gebruiken om nieuwe vertaaldiensten te creëren ter ondersteuning van talen waarvoor open source machinevertaling nog niet beschikbaar is. Dit zal ontwikkelaars helpen bij het maken en verbeteren van machinevertalingssystemen.
- Gebruikers kunnen het uitschakelen. Automatische vertaling is een optioneel hulpmiddel in Content Translation. Gebruikers hebben een optie om het uit te schakelen als ze het om de een of andere reden niet nuttig vinden. Hoewel veel gebruikers uit de Russische gemeenschap om deze service hebben gevraagd, beslist elke individuele gebruiker uiteindelijk of ze deze willen gebruiken of niet.
Samenvatting van de voorwaarden van de Yandex-overeenkomst
Verplichtingen van Yandex
- Om hun Yandex.Translate API-sleutel gratis in licentie te geven aan de Wikimedia Foundation om vrijwilligers op Wikimedia-sites in staat te stellen artikelen te vertalen
- Om vrijwilligers in staat te stellen tot tien miljoen tekens per dag te vertalen (veel meer dan hun openbaar beschikbare optie)
- Om Wikimedia statistische gegevens te geven over het aantal tekens in de verzonden verzoeken
Verplichtingen van de Wikimedia Foundation
- Om de door vrijwilligers geredigeerde versies van de door de vertaaltool vertaalde tekst te leveren, zodat Yandex hun tool kan verbeteren
- Er worden geen persoonsgegevens van vertalers gedeeld.
- Nu worden alleen de originele inhoud om te vertalen, de taal en de doeltaal van de vertaling in het verzoek naar Yandex verzonden.
- De vertalingen die door vertalers worden gepubliceerd, met of zonder de hulp van machinevertalingsdiensten, worden geleverd in de vorm van parallel corpora door de API's voor inhoudsvertaling. Deze API's zullen stapsgewijs worden ontwikkeld en de resultaten zullen vrij beschikbaar zijn voor iedereen, niet alleen voor Yandex.
Belangrijke punten
- Alle inhoud blijft gelicentieerd onder CC BY-SA 3.0
- Yandex vereist geen "branding" op Wikimedia-sites buiten het vermelden van Yandex.Translate als een vertaaloptie in het vervolgkeuzemenu van de vertaalinterface
- Er is geen uitwisseling van persoonlijke informatie van vrijwilligers
- De overeenkomst is beperkt tot 1 jaar, op welk moment we onze behoeften opnieuw kunnen evalueren
- Het staat ons vrij om de overeenkomst om welke reden dan ook te beëindigen, op elk moment (met een opzegtermijn van 30 dagen)
- De overeenkomst valt onder het Amerikaanse recht
Vragen over deze service
We hebben in deze sectie enkele directe vragen over Yandex behandeld. Dit staan ook bij de Veelgestelde vragen over contentvertaling.
Welke talen worden door Yandex behandeld? Zijn er plannen om er meer toe te voegen?
Yandex is nu beschikbaar voor meer dan 70 talen. Naarmate de taaldekking van Yandex toeneemt, zullen we overwegen om ze in te schakelen voor contentvertaling. NB: Yandex-machinevertaling is niet beschikbaar bij het maken van pagina's in het Engels.
Is het gebruik van Yandex anders dan bij een ander machinevertalingssysteem?
Als gebruiker van Content Translation zult u geen verschil voelen op de vertaalinterface, omdat het automatische vertaalsysteem van Yandex de vertaalde inhoud op dezelfde manier weergeeft als Apertium nu doet voor de ondersteunde 45 taalparen.
Hoe wordt de machinevertaling uitgevoerd als ik voor Yandex kies?
Yandex biedt een gratis te gebruiken API-sleutel waarmee websites en andere services hun vertaalsysteem kunnen gebruiken. Content Translation maakt ook gebruik van een unieke API-sleutel om toegang te krijgen tot deze service op de server van Yandex. Wanneer een gebruiker begint met het vertalen van een artikel, wordt de HTML-inhoud van elke sectie van het bronartikel naar de Yandex-server verzonden en wordt een vertaalde versie verkregen en weergegeven in de respectieve vertaalkolom van Inhoudsvertaling. Links en verwijzingen worden zoals gewoonlijk aangepast en gebruikers kunnen de inhoud naar wens aanpassen.
Dit proces gaat door voor alle secties van het artikel dat wordt vertaald. Voor betere prestaties worden de vertalingen voor opeenvolgende secties vooraf opgehaald. De gebruiker kan de ongepubliceerde vertaling opslaan (om er op een later tijdstip opnieuw aan te werken) of het artikel op de gebruikelijke manier publiceren. Het artikel wordt op Wikipedia gepubliceerd zoals elk ander normaal artikel met de juiste naamsvermelding en licenties.
Yandex is niet gebaseerd op open source software. Waarom gebruiken we het?
Content Translation is ontstaan uit een al lang bestaande behoefte om de kloof in de hoeveelheid inhoud tussen Wikipedia's in verschillende talen te overbruggen. Net als alle andere software die op Wikimedia-sites wordt gebruikt, is Content Translation ook open source. Ook in dit specifieke geval gebruiken we een open source-client om te communiceren met de externe service en vrij gelicentieerde inhoud te importeren om gebruikers te helpen onze vrije kennis uit te breiden.
Om het automatische vertaalsysteem van Yandex te gebruiken, voegen we geen propriëtaire software toe aan de Content Translation-code of op de wikimedia-websites en -servers. De service is gratis en voor iedereen beschikbaar.
Alleen de vrij beschikbare inhoud van het Wikipedia-artikel (in segmenten) wordt naar de Yandex-service verzonden en de verkregen vertaalde inhoud is vrij bruikbaar op Wikipedia-pagina's. De vertaalde inhoud kan door gebruikers worden gewijzigd en deze gegevens zijn ook openbaar beschikbaar onder een vrije licentie via de Content Translation API. Dit is een waardevolle bron die beschikbaar wordt gesteld voor de gemeenschap om open source vertaaldiensten te ontwikkelen voor die talen waar ze nog niet bestaan.
Na het zorgvuldig bestuderen van de implicaties, ontdekten we dat het feit dat de inhoud eerder werd opgeslagen in een closed source-service de vrijheid van onze kennis of onze software in het heden of de toekomst niet beperkt. We hebben er speciaal voor gezorgd dat de aangeboden inhoud vrij gelicentieerd is om ervoor te zorgen dat deze voldoet aan het Wikipedia-beleid. Dit omvat een lang proces voor juridische en technische evaluatie en naleving. De samenvatting van de gebruiksvoorwaarden is ook beschikbaar.
Uit feedback van gebruikers hebben we gezien dat ondersteuning voor machinevertalingen erg nuttig is voor gebruikers en we willen alle talen op de beste manier ondersteunen. Geleid door de principes van de resolutie van de Wikimedia Foundation om vrije en open source software te ondersteunen, zullen we prioriteit geven aan de integratie van open source diensten wanneer deze beschikbaar zijn voor een taal. Apertium is sinds het begin een cruciaal onderdeel van Content Translation, maar biedt 'maar' machinevertalingen voor 45 van de vele mogelijke talencombinaties die Wikipedia kan ondersteunen.
Moet ik me zorgen maken over mijn persoonlijke gegevens wanneer ik Yandex gebruik?
Ongeacht de service die wordt gebruikt, kunt u er zeker van zijn dat alleen Wikipedia-inhoud van bestaande artikelen wordt verzonden en dat alleen inhoud met een vrije licentie weer aan de vertaling wordt toegevoegd. Er wordt geen persoonlijke informatie verzonden en communicatie met die services vindt plaats aan de serverzijde, dus ze zijn geïsoleerd van het apparaat van de gebruiker. Meer informatie in dit diagram.
Wat als Yandex de enige beschikbare hulpmiddel voor machinevertaling is en ik het niet wil gebruiken?
Machinevertaling is een optionele functie in Content Translation die u eenvoudig naar uw eigen keuze kunt uitschakelen. Als er meer automatische vertaalsystemen voor uw talen worden toegevoegd, kunt u ervoor kiezen om het opnieuw in te schakelen en de service van uw keuze te selecteren.
Is de door Yandex vertaalde inhoud vrij voor gebruik in Wikipedia?
Ja. De inhoud die van Yandex wordt ontvangen, is verder vrij beschikbaar op het Yandex-webvertalingsplatform. Content Translation ontvangt het via een API-sleutel om het naadloos beschikbaar te maken op de vertaalinterface. Deze inhoud kan door de gebruikers worden gewijzigd (indien nodig) en worden gebruikt in Wikipedia-artikelen onder vrije licenties.
Kan deze inhoud worden gebruikt voor het verbeteren van automatische vertaalsystemen in het algemeen?
Ja. Vertalingen gemaakt in Content Translation worden opgeslagen in onze database. Deze informatie zal openbaar worden gemaakt voor iedereen om te gebruiken als vertaalvoorbeelden om hun vertaaldiensten te verbeteren (van universitaire onderzoeksgroepen, open source-projecten tot commerciële bedrijven, iedereen!). De inhoud is toegankelijk via de Api voor inhoudsvertaling. Houd er rekening mee dat alleen informatie met betrekking tot vertaalde tekst openbaar beschikbaar is. Dit omvat bron- en vertaalde tekst, bron- en doeltaalinformatie en een id voor het tekstsegment.