Sistemas de escritura
Esta página brinda información básica sobre la compatibilidad con varios aspectos de los sistemas de escritura: idiomas escritos en múltiples escrituras; dirección de escritura; representación y entrada de fuentes.
Sistemas múltiples, dialectos múltiples
Muchos idiomas están escritos con múltiples escrituras. A menudo, esto es posible pero carece de soporte en el software y, a veces, es difícil, si no imposible, de implementar. Algunos idiomas tienen un LanguageConverter que agrega soporte para múltiples sistemas de escritura.
Algunos idiomas tienen dialectos muy similares que están escritos en los mismos guiones y pueden—, a nivel técnico, ser tratados de la misma manera que diferentes guiones.
LanguageConverter
Para documentación de cómo usar LanguageConverter, véase Sistemas de escritura/Sintaxis
LanguageConverter (LC) es un sistema basado en variantes de idioma que convierte automáticamente el contenido de una página en una variante diferente. Una variante es principalmente el mismo idioma en una escritura diferente. Para utilizar LanguageConverter, vaya a sus preferencias de internacionalización. Si está en una wiki que admite conversión, verá una opción adicional para elegir el script.
Phab:T21044 -- ¡esto necesita más documentación!
Está implementado para los siguientes idiomas (a julio de 2023; veáse languagesWithVariants para obtener la lista más reciente):
- balinés (ban): Balinese (ban-bali), Latin (ban-latn) [1.36+]
- tártaro de Crimea (crh): Latin (crh-latn), Cyrillic (crh-cyrl)
- inglés (en): Normal (en), Pig Latin (en-x-piglatin) (for testing, only when $wgUsePigLatinVariant is enabled)
- chino gan (gan): Simplified (gan-hans), Traditional (gan-hant)
- inuktitut (iu): Latin (ike-latn), Syllabics (ike-cans) [1.18+]
kazajo (kk): Cyrillic (kk-cyrl), Latin (kk-latn), Arabic (kk-arab)Discontinued in 2023, see reasons at phab:T268143 and phab:T350684.- kurdo (ku): Latin (ku-latn), Arabic (ku-arab) [1.11+]
- serbocroata (sh): Cyrillic (sh-cyrl), Latin (sh-latn) [1.40+]
- tashelhit (shi): Tifinagh (shi-tfng), Latin (shi-latn) [1.19+]
- serbio (sr): Cyrillic (sr-ec), Latin (sr-el)
- tayiko (tg): Cyrillic (tg-cyrl), Latin (tg-latn)
- Talysh (tly): Cyrillic (tly-cyrl), Latin (tly-latn) [1.36+]
- uzbeko (uz): Cyrillic (uz-cyrl), Latin (uz-latin) [1.20+]
- chino wu (wuu): Simplified (wuu-hans), Traditional (wuu-hant) [1.41+]
- tamazight estándar marroquí (zgh): Tamazigh (zgh-tfng), Latin (zgh-latn) [1.42+]
- chino (zh):
- chino simplificado (zh-hans): China (zh-cn), Singapore (zh-sg), Malaysia (zh-my)
- chino tradicional (zh-hant): Taiwan (zh-tw), Hong Kong (zh-hk),[1] Macau (zh-mo)
¡Y es necesario para muchos más idiomas!
Las etiquetas de código de idioma para scripts deben seguir el estándar ISO 15924.
However, for legacy reasons, serbio is an exception, with sr-ec
instead of sr-cyrl
and sr-el
instead of sr-latn
.
This is in discussion in phab:T117845.
Una limitación actual de este sistema es que puede ser particularmente malo para tratar con múltiples sistemas de escritura basados en el mismo script subyacente.
Los wikipedistas chinos ocasionalmente usan =>
(unidireccional) para casos fallidos.
Como LC siempre intenta comerse la mayor parte de palabras usando strtr
en PHP, -{}-
(dividir palabras) a menudo también será útil.
Configuración de soporte
Las funciones WPULS/WPUVS en la biblioteca de sitio de zhwp (obsoleta, véase zh:Wikipedia:HanAssist para la versión actual) permiten una fácil selección de variantes en las IU de usuario.
Esto puede ayudar a los escritores de scripts a producir una interfaz con reconocimiento de variantes para los usuarios.
Para otros lugares inaccesibles por LC, se puede usar {{int:Conversionname}}
para buscar el idioma/variante de la interfaz de usuario actual.
El accesorio PreviewWithVariant permite a los wikipedistas comprobar los resultados de conversión en la vista previa del editor. Puede configurarlo para su propia wiki.
Las plantillas de "marcador de idioma extranjero" como {{lang}} deben agregar marcadores de "inhabilitar conversión" -{ text }-
alrededor de la cita texto extranjero para evitar errores de conversión.
En las wikipedias Hans/Hant, esto se convierte en una preocupación para el kanji japonés y el Han Nom vietnamita, mientras que en las wikipedias con texto en latín marcado para conversión, esta preocupación debería ser inmediata.
El módulo WikitextLC permite insertar fácilmente comandos LC en la salida Lua. Los sistemas NoteTA y CGroup permiten acceder a conjuntos predefinidos de conversiones específicas de materias. Module:地区用词 permite una salida adaptativa de la forma "foo, conocido en LUGAR y LUGAR como bar, y en LUGAR como baz".
La redirección automática de títulos en las URL puede causar aparentes inconvenientes para las interfaces sin esta función. Consulte T49725 para la tarea Lua y T160952 para la tarea de anclaje de sección.
URL Redirection
In some installations of MediaWiki, a short URL is employed.
For example, in Chinese Wikipedia, instead of https://zh.wikipedia.org/wiki/维基百科
(if no variant is specified) or https://zh.wikipedia.org/w/index.php?title=维基百科&variant=zh-cn
(if the variant is specified without rewrite rules), a shortened URL such as https://zh.wikipedia.org/zh-cn/维基百科
can be used as a temporary link to the specified script variant (zh-cn
in this case).
This behaviour can be seen several language Wikipedia such as Chinese Wikipedia, Serbian Wikipedia, etc.
However, others like Gan Chinese Wikipedia and Balinese Wikipedia often keeps the long url with index.php&variant=
.
This is controlled by $wgVariantArticlePath and web server rewrite rules (see manuals for short URL in Apache and nginx ).
Véase también
- m:Conversión automática entre chino simplificado y tradicional
- m:Wikipedias en múltiples sistemas de escritura
- Especificaciones/HTML#Language_conversion_blocks
- Parsoid/lenguaje conversación español
Direccionalidad
La mayoría de los sistemas de escritura funcionan como caracteres escritos de izquierda a derecha (LTR), con líneas apiladas de arriba hacia abajo (TtB).
Algunos scripts comunes (árabe y hebreo en particular) escriben caracteres de derecha a izquierda (RTL); veáse soporte de direccionalidad para obtener más detalles sobre cómo manejamos el texto bidireccional de derecha a izquierda y mixto con salida HTML y Estilos CSS.
Tenga en cuenta que se puede usar un idioma individual con escrituras que tienen diferentes direccionalidades, como el kazajo y el kurdo, que admiten variantes latinas y árabes.
Tenga en cuenta también que el World Wide Web Consortium ha definido más direccionalidades para el uso en páginas web, como las de arriba hacia abajo del noreste de Asia, con líneas apiladas de izquierda a derecha o de derecha. a la izquierda.[2]
Representación y entrada de fuentes
Muchos scripts no tienen fuentes adecuadas fácilmente disponibles para los usuarios. Esto puede deberse a que los sistemas operativos no envían estas fuentes, a que los usuarios no saben cómo instalarlas o no tienen los permisos necesarios para hacerlo. La extensión de Selector Idioma Universal intenta resolver esto incrustando las fuentes en la propia wiki. Las fuentes se servirán desde el servidor y el sistema del usuario no necesitaría tener las fuentes instaladas.
UniversalLanguageSelector agrega soporte para poder escribir un determinado script, por lo que los usuarios no tienen que depender de herramientas externas o soporte en sus sistemas.
Referencias
- ↑ Taiwán y Hong Kong son dos variantes principales escritas en el mismo guión tradicional con diferencias significativas en el uso de frases debido a la separación del mercado y la influencia de los idiomas locales
zho
, por lo que es probable que desee mantener al menos CN, TW y HK en su lista de variantes. Si insiste en acoplar el alcance de las variantes chinas a una separación Simp/Trad basada en guiones, siga lo que hizo el reportero en phab:T149278. - ↑ CSS Writing Modes Level 3