Ayuda:Traducción de contenidos/Traducir/Calidad de la traducción
Nota: Cuando editas esta página, aceptas liberar tu contribución bajo la licencia CC0. Para más información mira las páginas de ayuda de dominio público. |
Cuando creas una traducción, es esencial revisar los contenidos antes de publicarlos. Tienes que asegurarte de que el contenido que se ha producido no altera el significado del original y comprobar que se lee de un modo natural en la lengua a la que se ha traducido La traducción automática inicial proporciona una ayuda para facilitar el proceso de traducción, proporcionando un punto de partida útil, pero la propia herramienta anima a los usuarios a que revisen y editen adecuadamente los contenidos que proporcionado inicialmente.
Diferentes mecanismos garantizan que los traductores revisan de un modo apropiado las traducciones iniciales. El programa de traducción comprueba qué porcentaje de la traducción inicial ha sido modificada por el usuario, y determina los límites que impiden su publicación, o advierte a los usuarios animándoles a continuar revisando los contenidos.
De este modo, la herramienta permite a los usuarios utilizar la traducción automática cuándo hacen un uso bueno de ella, mientras que impide la publicación de traducciones de baja calidad solo ligeramente revisadas. Se incluyen en los siguientes apartados más detalles sobre cómo funcionan estos límites, cómo pueden ser ajustados a las necesidades de cada lengua, y cómo medir la calidad del contenido producido con esta herramienta.
Límites con los que se anima a revisar la traducción
El contenido de la traducción medidas del porcentaje de modificaciones mide el porcentaje de modificaciones que ha realizado el usuario sobre la traducción automática inicial proporcionada. De este modo, el sistema sabe cuántas palabras han sido añadidas, eliminadas o modificadas de la traducción inicial. Estas medidas se realizan en dos niveles diferentes: para cada párrafo y para el conjunto de la traducción. Diferentes límites se aplican en cada nivel, tal y como se detalla a continuación.
Límites para el conjunto de la traducción
La publicación se bloquea si hay un 95% o más de contenidos del conjunto del documento sin modificar, contenido traducido automáticamente. Este límite evita las traducciones automáticas casi sin variar y evita el vandalismo evidente. También evita que los usuarios añadan contenido sin editar la parte traducida automáticamente. Como se explica más adelante, este límite puede ser ajustado sobre la base de los idiomas en que se utiliza.
Límites para cada párrafo
Para cada párrafo, se mide también el porcentaje que suponen las modificaciones del usuario. Un párrafo se considera problemático cuando mantiene más de 85% de la traducción automática inicial (o cuando copiando los contenidos desde el documento original, éste contiene más de 60% de contenido no modificado).
El editor de traducción mostrará un aviso para cada párrafo que se considera problemático, animando el usuario a continuar revisándolo. En algunos casos se permite que el usuario publique la traducción, a pesar de contener párrafos problemáticos, pero la página resultante quedará categorizada como revisada solo parcialmente, de modo que pueda ser revisada por la comunidad. En otros casos, no se permite a los usuarios que publiquen esa traducción problemática.
Estos son algunos de los factores que se consideran para determinar si se permite o no al usuario publicar su traducción (algunos de estos factores están todavía en desarrollo):
- El número de párrafos problemáticos. Los usuarios no pueden hacer públicas las traducciones con 50 o más párrafos problemáticos. Los usuarios podrán publicar traducciones con menos de 50 párrafos problemáticos, pero las traducciones que contengan entre 10 y 49 párrafos problemáticos serán categorizados como revisados solo parcialmente, de modo que puedan ser revisados por la comunidad.
- Traducciones previas eliminadas. Para evitar problemas recurrentes, la herramienta identifica a los usuarios cuyas traducciones publicadas fueron eliminadas en los últimos 30 días e impone límites más estrictos sobre posteriores esfuerzos de traducción. Los usuarios podrán publicar traducciones con menos de 50 párrafos problemáticos, pero las traducciones que contengan entre 10 y 49 párrafos problemáticos serán categorizadas como revisadas solo parcialmente, de modo que puedan continuar siendo revisadas por la comunidad.
- Confirmación de usuario. Un umbral menos estricto se considera para párrafos que los usuarios han marcado como resueltos, señal de que el usuario los ha revisado y confirmado el estado de la traducción. En los párrafos en los que se ha mostrado el aviso de contenido no modificado, pero el usuario lo ha marcado como resuelto, se aplica un umbral menos estricto: se acepta un 95% de la traducción automática o un 75% de contenido de la fuente. Esto proporciona un modo de resolver los casos en los que la traducción automática era excepcionalmente buena, pero evita también abusar de esta característica: no aceptando a ciegas la confirmación del usuario.
Contenido no afectado por los límites
Algunos contenidos se espera que no sean revisados de un modo significativo y no se les aplican los límites que se han explicado anteriormente. Los títulos de sección cortos, las citas o la lista de referencias están excluidos de estos controles. Por otro lado, los usuarios podrían recibir avisos engañosos sobre la traducción de contenido que no deberían, tales como títulos de libros que aparecen en referencias u otros nombres propios.
Límites en la experiencia móvil
Para la experiencia móvil, el conjunto inicial de límites sigue un enfoque más simple. Por el momento, solo se considera el porcentaje global de traducción automática no modificada para toda la traducción. En dispositivos móviles, la traducción completa consta de una sola sección del artículo.
En particular, se muestra un aviso cuando el porcentaje de traducción automática no modificada sea más del 85% para toda la sección, y se impide la publicación cuando el porcentaje de traducción automática es superior al 95%.
La retroalimentación sobre cómo funciona el sistema de límites en el contexto móvil sería muy útil para determinar como evolucionar este enfoque inicial.
Publication of fast unreviewed translations
Campaigns and contests can result in spikes of translations where some user unfamiliar with the community policies may focus on making many translations and not pay enough attention to review their contents. In order to emphasize quality over quantity, a mechanism has been defined to limit the publication of fast unreviewed translations.
After a user translates a large article, the next translation can only be started after some time has passed. The waiting period estimation considers 1 minute per paragraph up to 10 minutes. That is:
- For articles with 10 paragraphs or less, we want to make sure that users spent translating it at least N minutes (one minute per paragraph)
- For articles with more than 10 paragraphs we want to make sure that users spent translating it at least 10 minutes.
This has been applied on mobile initially since it is a space with less activity, and after measuring the impact we'll consider expanding it to desktop too.
Ajustando los límites
Los límites que se han descrito proporcionan un conjunto de mecanismos generales, pero pueden necesitar ser ajustados a las necesidades particulares de cada wiki. Basado en las evaluaciones iniciales, la cantidad de modificaciones que necesita la traducción automática inicial puede variar de 10% a 70% según el par de lenguas que interviene (la del texto que se traduce y a la que se traduce). Para algunos wikis los límites previstos pueden ser demasiado estrictos, generando avisos innecesarios o impidiendo traducciones que serían perfectamente válidas. En otros wikis, los límites podrían no ser suficientemente estrictos, permitiendo la publicación de traducciones que no han sido suficientemente revisadas.
Ajustar los diferentes umbrales permite a cada wiki adecuar los límites de la herramienta según sus necesidades particulares. La retroalimentación que proporcionan los hablantes nativos es esencial para ajustar los límites correctamente. Si al preparar una traducción, o al revisarla, considera que los límites actuales no son adecuados, puede exponer su opinión; de este modo se estudiará el modo de ajustarlos mejor.
Cuando se proporciona información sugiriendo que se ajusten los umbrales, se recomienda que se faciliten varias traducciones de ejemplo (comprobando las opciones para la publicación, si no quiere que su muestra sea publicada como un contenido adecuado). Para comprobar cómo funcionan los límites en su lengua es útil tener en cuenta lo siguiente:
- Control para ambos casos. Asegúrese de comprobar cómo funcionan los límites para las traducciones cuando el contenido no ha sido revisado suficientemente, y también en aquellos en los que la traducción inicial ha sido suficientemente revisada. De este modo puede encontrar más fácilmente un equilibrio adecuado para los límites. Comprobar sólo un tipo de problemas puede obligar a cambiar excesivamente los límites en la dirección contraria.
- Control de diferentes contenidos. El contenido en cada wiki es muy diverso y la traducción automática puede funcionar mucho mejor para algunos casos que para otros. Por ejemplo, un contenido lleno de datos numéricos o de nombres técnicos pueden requerir menos revisiones por los usuarios que un contenido con un texto más descriptivo. Asegúrate de probar a traducir una variedad de tipos de artículos diferentes, de diferentes longitudes y con contenido dispar.
- Preparar para iterar. Ajustar los umbrales es un proceso iterativo. Puede requerirse ajustar los límites o mejorar la aproximación general. De todas formas, después de cada cambio, para verificar las mejoras puede ser necesario hacer más comprobaciones.
Ajustar los límites en colaboración con otros editores se ha comprobado que es lo más eficaz. Por ejemplo, los resultados iniciales muestran que la comunidad indonesia ha reducido significativamente el número de traducciones problemáticas al restringir la publicación de traducciones con más de 70% de la traducción automática sin modificar. Los ajustes similares han sido hechos para los idiomas telugu y asamés No hay ninguna herramienta automática que sea infalible y estos límites no son una excepción.
El proceso de revisión del contenido por la comunidad es todavía esencial, pero estos límites proporcionan a la comunidad unas herramientas para reducir el número de traducciones en las que centrarse, haciendo el proceso de revisión mucho más eficaz. Por favor, comparta su opinión y podremos explorar cómo ajustarlos mejor.
Seguimientos de las traducción parcialmente traducidas
Existe una categoría con el nombre "cx-unreviewed-translation-category" (en español: categoría de traducciones no revisadas) que permite a la comunidad encontrar fácilmente los artículos traducidos que se han publicado con un contenido que supera los límites recomendados.
Puedes encontrar esta categoría en la lista de "Categorías" en cada wiki. Allí puedes encontrar los artículos que pasaron los límites que impide publicar, pero cuya edición mantuvo todavía algunos párrafos no revisados lo suficiente. Por ejemplo la categoría indonesia incluye artículos que tienen menos de 40% de traducción automática en general, pero que tienen algunos párrafos con más de 80% de traducción automática no modificada.
Midiendo la calidad de la traducción
Evaluar automáticamente la calidad de un contenido no es tarea sencilla. La proporción de borrado proporciona una valoración útil para juzgar si el contenido que se ha traducido era lo bastante bueno como para no ser borrado por la comunidad de editores. Según el análisis de los porcentajes de borrado, los artículos creados como traducciones tienen menos probabilidades de ser borrados en comparación con los artículos creados desde cero. Esto sugiere que puede no ser práctico poner unos límites para participar en traducciones mucho más alto que aquellos límites que se establecen para otros modos de crear un artículo.
Encontrar traducciones publicadas La traducción de contenido añade una etiqueta de edición, contenttranslation a las traducciones publicadas. Esto permite a la comunidad la capacidad de usar los cambios recientes, y herramientas similares, para centrarse en páginas creadas usando la herramienta de traducción. Además, datos publicados de traducciones y la estadística para uso de traducción automática están disponibles para que cualquiera pueda analizarlos.
Inspeccionar una traducción específica
El depurador de traducción es una herramienta que permite la inspección de algún metadato para una traducción dada, incluyendo el porcentaje de la traducción automática utilizada para el documento entero y el servicio de traducción utilizado para cada párrafo. Para tipos de contenido específicos como platillas, la API del servidor de traducción [se puede consultar https://cxdebugger.toolforge.org/templates.html para verificar cómo se transferirán las plantillas entre idiomas].
Otros límites basados en la pericia de usuario
Algunos wikis ha establecidos otras restricciones para traducir basado en los derechos de usuario como manera de reducir la creación de traducciones de baja calidad.
Por ejemplo, la Wikipedia en inglés requiere que los usuarios hayan sido confirmados, lo que significa que necesitan haber hecho 500 ediciones en la Wikipedia en inglés antes de que les permita publicar la traducción de un artículo.
Los editores más recientes pueden publicar traducciones artículos en el User:
o en el espacio de borradores (Draft
) y después trasladar el artículo al espacio principal.
Esta restricción se creó antes de que estuviese disponible el sistema de límites que sea ha descrito en esta página, y no es un modo recomendable para animar a la creación de traducciones de calidad buena.
Antes de añadir restricciones que no tienen en cuenta el contenido creado, ser recomienda el procedimiento -que se ha descrito antes- de ajustar los límites del contenido no modificado. Los límites pueden hacerse tan estrictos como sea necesario para impedir traducciones de baja calidad, permitiendo a los usuarios que hagan buenas traducciones para publicarlas.