Traducción de contenidos/Traducción automática/Yandex
Desde el 4 de noviembre de 2015, el sistema de traducción automática de Yandex está disponible para los usuarios de Content Translation. Debido a su popularidad entre los usuarios rusos de Wikipedia, la inclusión del servicio Yandex.Translate fue a requested feature. Inicialmente se introdujo para traducir las páginas de Wikipedia del inglés al ruso. Sin embargo, el servicio se ha ampliado para todos los idiomas que se ofrecen a través de Yandex.
Yandex.Translate es proporcionado por Yandex - una empresa rusa de servicios de Internet. Desde finales de 2014, el equipo legal de la Fundación Wikimedia y Yandex colaboraron para elaborar un acuerdo que permita el uso de Yandex.Translate sin comprometer la política de Wikipedia de atribución de derechos, privacidad de nuestros usuarios y representación de marca. Los términos del acuerdo son a continuación y estamos encantados de escuchar cualquier pregunta que pueda tener sobre este servicio.
Características principales
- No se envía información personal a Yandex. Se accederá al sistema de MT a través de una publicly available API utilizando una clave. El contenido de los artículos (con licencia libre) se envía a los servidores de Yandex desde los servidores de la Fundación Wikimedia. No hay comunicación directa entre el usuario y los servicios externos y no se envía información personal (IP, nombre de usuario) a los servidores de Yandex. El cliente que contacta con los servidores de Yandex es de código abierto y puedes check it here. Ninguna parte del servicio o código de Yandex formará parte de la infraestructura de Wikimedia o de la base de código de la Traducción de Contenidos
- La información se devuelve desde Yandex bajo una licencia libre. Cuando se utiliza el servicio de Yandex, ellos proporcionan una versión traducida del contenido de Wikipedia bajo una licencia libre. Los usuarios pueden modificarlo y publicarlo como parte de Wikipedia sin conflictos con las políticas existentes. El contenido resultante traducido por Yandex y las modificaciones del usuario estarán disponibles bajo la misma licencia que se utiliza para el resto de los artículos de Wikipedia.
- Beneficia a la comunidad de traductores de código abierto en general. Las traducciones obtenidas de Yandex y las modificaciones de los usuarios estarán disponibles públicamente. Las traducciones post-editadas son de especial interés para la comunidad de investigadores de la traducción, que pueden utilizar este recurso para crear nuevos servicios de traducción que den soporte a los idiomas para los que la traducción automática de código abierto aún no está disponible. Esto ayudará a los desarrolladores a crear y mejorar los sistemas de traducción automática.
- 'Los usuarios pueden desactivarla. La traducción automática es una herramienta opcional en la Traducción de Contenidos. Los usuarios tienen la opción de desactivarla si no la encuentran útil por alguna razón. Aunque muchos usuarios de la comunidad rusa solicitaron este servicio, cada usuario individual decide finalmente si quiere utilizarlo o no.
Resumen de los términos del acuerdo con Yandex
Las obligaciones de Yandex
- Licenciar su clave API de Yandex.Translate de forma gratuita a la Fundación Wikimedia para permitir a los voluntarios de los sitios de Wikimedia traducir artículos
- Permitir a los voluntarios traducir hasta diez millones de caracteres por día (mucho más que su opción disponible públicamente)
- Dar a Wikimedia datos estadísticos sobre la cantidad de caracteres en las solicitudes enviadas
Obligaciones de la Fundación Wikimedia
- Proporcionar las versiones editadas por voluntarios del texto traducido por la herramienta de traducción para que Yandex pueda mejorar su herramienta
- No se compartirán los datos personales de los traductores.
- Actualmente, sólo se envía a Yandex el contenido original a traducir, su idioma y el idioma de destino de la traducción.
- Las traducciones publicadas por los traductores, con o sin la ayuda de los servicios de traducción automática, se proporcionarán en forma de corpus paralelo mediante las API de traducción de contenidos. Estas API se desarrollarán de forma incremental y los resultados estarán disponibles de forma gratuita para todos, no sólo para Yandex.
Notas importantes
- Todo el contenido permanecerá bajo licencia CC BY-SA 3.0
- Yandex no requiere ninguna "marca" en los Sitios Wikimedia, aparte de incluir Yandex.Translate como una opción de herramienta de traducción en el menú desplegable de la interfaz de traducción
- No hay intercambio de información personal de los voluntarios
- El acuerdo está limitado a 1 año, momento en el que podemos reevaluar nuestras necesidades
- Somos libres de rescindir el acuerdo por cualquier motivo, en cualquier momento (con 30 días de preaviso)
- El acuerdo se rige por la legislación estadounidense.
Preguntas sobre este servicio
En esta sección hemos abordado algunas preguntas inmediatas sobre Yandex. También está disponible en la página Traducción de contenidos FAQ.
¿Qué idiomas maneja Yandex? ¿Hay planes para añadir más?
Actualmente, Yandex está disponible para más de 70 idiomas. A medida que la cobertura de idiomas de Yandex se amplíe, consideraremos la posibilidad de habilitarlos para la traducción de contenidos. Nota: La traducción automática de Yandex no estará disponible al crear páginas en inglés.
¿En qué se diferencia el uso de Yandex de cualquier otro sistema de traducción automática?
Como usuario de Content Translation no sentirás ninguna diferencia en la interfaz de traducción ya que el sistema de traducción automática de Yandex mostrará el contenido traducido de la misma manera que Apertium lo hace actualmente para los 45 pares de idiomas soportados.
¿Cómo se realiza la traducción automática si elijo Yandex?
Yandex proporciona una free for use API key que permite a los sitios web y otros servicios utilizar su sistema de traducción. Content Translation también utiliza una clave API única para acceder a este servicio en el servidor de Yandex. Cuando un usuario comienza a traducir un artículo, el contenido HTML de cada sección del artículo fuente se envía al servidor de Yandex y se obtiene una versión traducida que se muestra en la respectiva columna de traducción de Content Translation. Los enlaces y las referencias se adaptan como de costumbre y los usuarios pueden modificar el contenido según sea necesario.
Este proceso continúa para todas las secciones del artículo que se está traduciendo. Para mejorar el rendimiento, las traducciones de las secciones consecutivas se preconfiguran. El usuario puede guardar la traducción no publicada (para volver a trabajar en ella en otro momento) o publicar el artículo de la forma habitual. El artículo se publica en Wikipedia como cualquier otro artículo normal con la atribución y las licencias adecuadas.
Puede ver un diagrama del proceso.
Yandex no está basado en software de código abierto. ¿Por qué lo usamos?
La Traducción de Contenidos evolucionó a partir de una necesidad de larga data de cerrar la brecha en la cantidad de contenido entre las Wikipedias en diferentes idiomas. Al igual que el resto del software utilizado en los sitios de Wikimedia, la Traducción de Contenidos también es de código abierto. En este caso particular también, estamos usando un open source client para interactuar con el servicio externo e importar contenido de licencia libre con el fin de ayudar a los usuarios a expandir nuestro conocimiento libre.
Para utilizar el sistema de traducción automática de Yandex no estamos añadiendo ningún software propietario en el código de traducción de contenidos, ni en los sitios web y servidores de Wikimedia. El servicio es gratuito y está disponible para todos.
Solo se envía al servicio de Yandex el contenido de los artículos de Wikipedia disponible de forma gratuita (en segmentos) y el contenido traducido obtenido se puede utilizar libremente en las páginas de Wikipedia. El contenido traducido puede ser modificado por los usuarios y estos datos también están disponibles públicamente bajo una licencia libre a través de la API de traducción de contenidos. Se trata de un valioso recurso puesto a disposición de la comunidad para desarrollar servicios de traducción de código abierto para aquellos idiomas en los que aún no existen.
Tras estudiar detenidamente las implicaciones, hemos comprobado que el hecho de que el contenido se haya almacenado previamente en un servicio de código cerrado no limita la libertad de nuestro conocimiento o de nuestro software en el presente o en el futuro. Hemos puesto especial cuidado en asegurarnos de que el contenido proporcionado tiene licencia libre para garantizar que cumple con las políticas de Wikipedia. Esto incluye un largo proceso de evaluación y cumplimiento legal y técnico. También está disponible el resumen de las condiciones de uso.
A partir de los comentarios de los usuarios hemos visto que el soporte de la traducción automática es realmente útil para los usuarios y queremos apoyar todos los idiomas de la mejor manera. Guiados por los principios de la resolución de la Fundación Wikimedia de apoyar el software libre y de código abierto, daremos prioridad a la integración de servicios de código abierto siempre que estén disponibles para un idioma. Apertium ha sido una parte fundamental de la Traducción de Contenidos desde su creación, pero actualmente sólo proporciona traducciones automáticas para 45 de las numerosas combinaciones de idiomas posibles que admite Wikipedia.
¿Debo preocuparme por mis datos personales al utilizar Yandex?
Independientemente del servicio que se utilice, puedes estar seguro de que sólo se envía el contenido de Wikipedia de los artículos existentes y que sólo se añadirá a la traducción el contenido con licencia libre. No se envía ninguna información personal y la comunicación con estos servicios se realiza en el lado del servidor, por lo que están aislados del dispositivo del usuario. Por favor, consulte este diagrama para más detalles.
¿Qué pasa si Yandex es la única herramienta de traducción automática disponible y no quiero usarla?
La traducción automática es una función opcional en la traducción de contenidos que puede desactivar fácilmente a voluntad. Si se añaden más sistemas de traducción automática para sus idiomas, puede optar por volver a activar la MT y seleccionar el servicio de MT de su elección.
¿Los contenidos traducidos por Yandex se podrán utilizar libremente en Wikipedia?
Sí. El contenido recibido de Yandex está disponible libremente en la plataforma de traducción web de Yandex. Content Translation lo recibe a través de una clave API para que esté disponible sin problemas en la interfaz de traducción. Este contenido puede ser modificado por los usuarios (si es necesario) y utilizado en los artículos de Wikipedia bajo licencias libres.
¿Se puede utilizar este contenido para mejorar los sistemas de traducción automática en general?
Sí. Las traducciones realizadas en Content Translation se guardan en nuestra base de datos. Esta información se pondrá a disposición del público para que cualquiera pueda utilizarla como ejemplo de traducción para mejorar sus servicios de traducción (desde grupos de investigación universitarios, proyectos de código abierto hasta empresas comerciales, ¡cualquiera!). Se puede acceder al contenido a través de la API de traducción de contenidos. Tenga en cuenta que sólo la información relacionada con el texto traducido está disponible públicamente. Esto incluye: texto de origen y traducido, información sobre el idioma de origen y de destino y un identificador para el segmento de texto.