Traducción de contenidos/Traducción automática/Matxin
La compatibilidad con la traducción automática para la traducción de contenidos se ha ampliado aún más. Además de Apertium, Yandex y Youdao, ahora añadimos Matxin a la lista de sistemas de traducción automática (TA) disponibles para los usuarios de Content Translation. Esto dará lugar a un soporte adicional de traducción automática para algunos idiomas.
Matxin está a cargo de un equipo de la Universidad del País Vasco, en colaboración con la Fundación Elhuyar. Este sistema de traducción automática fue creado por este equipo principalmente para su propio uso en la redacción de artículos de Wikipedia en euskera y español. Varios equipos dentro de la Fundación Wikimedia han colaborado con el equipo de Matxin para elaborar un acuerdo que permita el uso de Matxin sin comprometer la política de atribución de derechos de Wikipedia, la privacidad de nuestros usuarios y la representación de la marca. Matxin es un software de código abierto. Para facilitar el uso, estamos utilizando la API de traducción automática, más conveniente, para acceder al servicio alojado por el equipo. A continuación encontrará más detalles del acuerdo y estaremos encantados de escuchar cualquier pregunta que pueda tener sobre este servicio.
Características principales
- No se envía información personal a Matxin. Se accederá al sistema MT a través de una clave API. El contenido de los artículos (con licencia libre) se envía al servidor Matxin desde los servidores de la Fundación Wikimedia. No hay comunicación directa entre el usuario y los servicios externos y no se envía ninguna información personal (IP, nombre de usuario) al servicio Matxin. El cliente que contacta con Matxin es de código abierto y puedes comprobarlo aquí. Ninguna parte del servicio o código de Matxin formará parte de la infraestructura de Wikimedia o de la base de código de la Traducción de Contenidos. Al final de la sección también se puede ver un diagrama de esta configuración técnica.
- La información se devuelve desde Matxin bajo una licencia libre. Cuando se utiliza Matxin, se obtiene una versión traducida del contenido de Wikipedia bajo licencia libre. Los usuarios pueden modificarlo y publicarlo como parte de la Wikipedia sin crear conflictos con las políticas existentes. El contenido resultante traducido por Matxin y las modificaciones de los usuarios estarán disponibles bajo la misma licencia que se utiliza para el resto de los artículos de Wikipedia.
- Beneficia a la comunidad de traductores de código abierto en general. Las traducciones obtenidas de Matxin y las modificaciones de los usuarios estarán disponibles públicamente. Las traducciones post-editadas son de especial interés para la comunidad de investigadores de la traducción (incluido el equipo de Matxin), que pueden utilizar este recurso para crear nuevos servicios de traducción que den soporte a los idiomas para los que aún no está disponible la traducción automática de código abierto. Esto ayudará a los desarrolladores a crear y mejorar los sistemas de traducción automática.
- Los usuarios pueden desactivarla. La traducción automática es una herramienta opcional en la Traducción de Contenidos. Los usuarios tienen la opción de desactivarla si no la encuentran útil por alguna razón. Aunque muchos usuarios de Content Translation han solicitado este servicio de traducción, cada usuario individual decide finalmente si desea utilizarlo o no.
Resumen de nuestro acuerdo con Matxin
Las obligaciones de Matxin
- Permitir el uso gratuito de su clave API de traducción automática a la Fundación Wikimedia para que los voluntarios de los sitios de Wikimedia puedan traducir artículos y apoyar al menos 10 millones de caracteres de contenido de traducción al día.
Obligaciones de la Fundación Wikimedia
- Proporcionar las versiones editadas por voluntarios del texto traducido por la herramienta de traducción para que Matxin pueda mejorar su herramienta.
- No se compartirán los datos personales de los traductores.
- Solo el contenido original a traducir, su idioma, y el idioma de destino de la traducción serán enviados en la solicitud a Matxin.
- Las traducciones publicadas por los traductores, con o sin ayuda de los servicios de traducción automática, serán proporcionadas en forma de texto paralelo por las API de traducción de contenidos. Estas API se desarrollarán de forma incremental y los resultados estarán disponibles de forma gratuita para todos, no solo para Matxin.
Notas importantes
- Todo el contenido permanecerá bajo licencia CC BY-SA 3.0
- Matxin no requiere ninguna "marca" en los sitios de Wikimedia, aparte de la inclusión de Matxin como opción de herramienta de traducción en el menú desplegable de la interfaz de traducción.
- No hay intercambio de información personal de los voluntarios.
- El acuerdo está limitado a 1 año, momento en el que podemos reevaluar nuestras necesidades.
- Somos libres de rescindir el contrato por cualquier motivo, en cualquier momento (con 30 días de preaviso).
- El acuerdo se rige por la legislación estadounidense.
Preguntas sobre este servicio
En esta sección hemos abordado algunas cuestiones inmediatas sobre Matxin. Esto también está disponible en la página Content Translation FAQ.
¿Qué idiomas gestiona Matxin? ¿Hay planes para añadir más?
Matxin puede utilizarse para traducir del español al euskera. A medida que los desarrolladores del equipo Matxin añadan más idiomas al servicio, los incluiremos.
¿En qué se diferencia el uso de Matxin de otros servicios de traducción automática?
Como usuario de Content Translation no notará ninguna diferencia en la interfaz de traducción, ya que Matxin mostrará el contenido traducido de la misma manera que lo hacen actualmente otros servicios para los pares de idiomas soportados.
¿Cómo se realiza la traducción automática si elijo Matxin?
Matxin proporciona una clave API que permite a los sitios web y otros servicios utilizar su sistema de traducción. Content Translation también utiliza esa clave API única para acceder a Matxin. Cuando un usuario comienza a traducir un artículo, el contenido HTML de cada sección del artículo fuente se envía a Matxin y se obtiene una versión traducida que se muestra en la respectiva columna de traducción de Content Translation. Los enlaces y las referencias se adaptan como siempre y los usuarios pueden modificar el contenido según sus necesidades.
Este proceso continúa para todas las secciones del artículo que se está traduciendo. Para mejorar el rendimiento, las traducciones de las secciones consecutivas se preconfiguran. El usuario puede guardar la traducción no publicada (para volver a trabajar en ella más adelante) o publicar el artículo de la forma habitual. El artículo se publica en Wikipedia como cualquier otro artículo normal con la atribución y las licencias adecuadas.
Aquí hay un diagrama del proceso.
¿Matxin se basa en software de código abierto?
Sí, es un software de código abierto, similar a Apertium. Ha sido desarrollado por un pequeño equipo de la Universidad del País Vasco que desarrolló esta herramienta por su propia necesidad de traducir artículos de Wikipedia. Forman parte de la comunidad Wikimedia y estamos encantados de colaborar con ellos.
¿Debo preocuparme por mis datos personales al utilizar Matxin?
Independientemente del servicio que se utilice, puede estar seguro de que solo se envía el contenido de Wikipedia de los artículos existentes y que solo se añade a la traducción el contenido con licencia libre. No se envía ninguna información personal y la comunicación con esos servicios se produce en el lado del servidor, por lo que están aislados del dispositivo del usuario. Por favor, consulte este diagrama para más detalles.
¿Y si Matxin es la única herramienta de traducción automática disponible y no quiero utilizarla?
La traducción automática es una función opcional en la traducción de contenidos que puede desactivarse fácilmente a voluntad. Si se añaden más sistemas de traducción automática para sus idiomas, puede optar por volver a activar la MT y seleccionar el servicio de MT que desee.
¿El contenido traducido por Matxin se podrá utilizar libremente en Wikipedia?
Sí. Los contenidos recibidos de Matxin están disponibles de forma gratuita en la plataforma de traducción web. Es un software de código abierto. Para facilitar su uso, la Traducción de Contenidos la recibe a través de una clave API para que esté disponible sin problemas en la interfaz de traducción. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.
Can this content be used for improving machine translation systems in general?
Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.