Jump to content

Writing systems/nl

From mediawiki.org
This page is a translated version of the page Writing systems and the translation is 100% complete.
i18n documenten

Deze pagina geeft basisinformatie over verschillende aspecten van het ondersteunen van schriftsystemen: talen geschreven in verschillende scripts; schrijfrichtingen; lettertype opbouw en invoer.

Meerdere scripts, meerdere dialecten

Veel talen zijn geschreven met meerdere scripts. Dit is vaak mogelijk maar ontbreekt er in de software de ondersteuning, het is soms lastig of niet mogelijk om het te implementeren. Sommige talen hebben een LanguageConverter die ondersteuning toevoegt voor meerdere schriftsystemen.

Talen kunnen op elkaar lijkende dialecten hebben die in hetzelfde script(s) zijn geschreven, die op technisch niveau , kunnen worden behandeld alsof het verschillende scripts zijn.

LanguageConverter

Documentatie over hoe het te gebruiken: Writing systems/Syntax/nl

LanguageConverter een systeem gebaseerd op taalvarianten dat automatisch de inhoud van een pagina vertaald naar een andere variant. Een variant is meestal dezelfde taal in een ander script. Om het te gebruiken, ga naar uw voorkeuren voor internationalisatie. Als uw wiki conversie ondersteunt, ziet u een optie waar u het script kunt kiezen.

Phab:T21044 -- hier kan wel wat meer documentatie van zijn!

Het is geïmplementeerd voor de volgende talen (per juli 2023; actuele lijst: languagesWithVariants):

  • Balinees (ban): Balinese (ban-bali), Latin (ban-latn) [1.36+]
  • Krim-Tataars (crh): Latin (crh-latn), Cyrillic (crh-cyrl)
  • Engels (en): Normal (en), Pig Latin (en-x-piglatin) (om te testen, alleen als $wgUsePigLatinVariant is ingeschakeld)
  • Ganyu (gan): Simplified (gan-hans), Traditional (gan-hant)
  • Inuktitut (iu): Latin (ike-latn), Syllabics (ike-cans) [1.18+]
  • Kazachs (kk): Cyrillic (kk-cyrl), Latin (kk-latn), Arabic (kk-arab) Stopgezet in 2023, zie redenen bij phab:T268143 en phab:T350684.
  • Koerdisch (ku): Latin (ku-latn), Arabic (ku-arab) [1.11+]
  • Servo-Kroatisch (sh): Cyrillic (sh-cyrl), Latin (sh-latn) [1.40+]
  • Tashelhiyt (shi): Tifinagh (shi-tfng), Latin (shi-latn) [1.19+]
  • Servisch (sr): Cyrillic (sr-ec), Latin (sr-el)
  • Tadzjieks (tg): Cyrillic (tg-cyrl), Latin (tg-latn)
  • Talysh (tly): Cyrillic (tly-cyrl), Latin (tly-latn) [1.36+]
  • Oezbeeks (uz): Cyrillic (uz-cyrl), Latin (uz-latin) [1.20+]
  • Wuyu (wuu): Simplified (wuu-hans), Traditional (wuu-hant) [1.41+]
  • Standaard Marokkaanse Tamazight (zgh): Tamazigh (zgh-tfng), Latin (zgh-latn) [1.42+]
  • Chinees (zh):
    • Simplified Chinese (zh-hans): China (zh-cn), Singapore (zh-sg), Malaysia (zh-my)
    • Traditional Chinese (zh-hant): Taiwan (zh-tw), Hong Kong (zh-hk),[1] Macau (zh-mo)

Dit is voor veel meer talen nodig!

Tags van taalcodes voor scripts moeten de ISO 15924 standaard volgen. Om compatibel te zijn met oudere versies is Servisch echter een uitzondering, met sr-ec in plaats van sr-cyrl en sr-el in plaats van sr-latn. Dit wordt besproken in phab:T117845.

Een beperking in het huidige systeem is dat het slecht kan zijn om te werken met verschillende schriftsystemen in hetzelfde script. Chinese bewerkers gebruiken soms => (een richting) bij fouten. Omdat LanguageConvertor altijd probeert om zoveel mogelijk tekst in een keer te verwerken met gebruik van strtr in PHP, kan het afbreken van woorden met -{}- nuttig zijn.

Configuratie ondersteunen

De functies wgULS/wgUVS in zhwp's sitelib (nu afgeschaft/ontraden, zie zh:Wikipedia:HanAssist voor de huidige versie) staan een eenvoudige selectie toe uit de gebruikersscripts voor de gebruikersinterface. De makers van een script kunnen hiermee een gebruikersinterface schrijven die de variant herkent. Op voor LanguageConverter onbereikbare plaatsen kan {{int:Conversionname}} worden gebruikt om de huidige taalvariant op te halen.

De PreviewWithVariant gadget maakt het mogelijk dat de bewerker de conversieresultaten kan voorvertonen. U kunt dit op uw eigen wiki instellen.

De zogenaamde "Foreign language marker" sjablonen als {{lang}} moeten de conversie uitschakelen toevoegen, met -{ text }- markeringen rondom de aangehaalde buitenlandse tekst, dit om misverstanden te voorkomen. Op Hans/Hant Wikipedia's wordt dit een punt van zorg Japanese Kanji en Vietnamese Han Nom, terwijl op Wikipedia's met Latijns schrift gemarkeerd voor conversie dit onmiddellijk speelt.

De module WikitextLC staat een eenvoudige toevoeging van LC commando's aan de uitvoer van Lua, toe. Het systeem met het sjabloon NoteTA en de module CGroup staat toegang toe tot vooraf gedefinieerde sets van onderwerpspecifieke conversies. De module Module:地区用词 staat adaptieve uitvoer toe in de vorm "foo, known in PLACE and PLACE as bar, and PLACE as baz".

Automatische titel doorverwijzing op URL kan problemen veroorzaken op interfaces zonder deze functie. Lees T49725 voor de Lua-taak en T160952 voor de sectie-geankerde taak.

URL Doorverwijzing

In sommige installaties van MediaWiki wordt een korte URL gebruikt. Bijvoorbeeld, in Chinese Wikipedia, in plaats van https://zh.wikipedia.org/wiki/维基百科 (als er geen variant is opgegeven) of https://zh.wikipedia.org/w/index.php?title=维基百科&variant=zh-cn (als de variant is gespecificeerd zonder herschrijfregels), kan een verkorte URL zoals https://zh.wikipedia.org/zh-cn/维基百科 worden gebruikt als een tijdelijke link naar de opgegeven scriptvariant (zh-cn in dit geval).

Dit gedrag kan worden gezien in verschillende taal Wikipedia's zoals de Chinese Wikipedia en de Servische Wikipedia. Maar anderen zoals Gan Chinese Wikipedia en Balinese Wikipedia houden vaak de lange URL met index.php&variant=.

Dit wordt geregeld met $wgVariantArticlePath en rewrite-rules voor de webserver (zie handleidingen voor een korte URL in Apache en nginx ).

Zie ook

Schrijfrichting

De meeste schriftsystemen werken met tekens die van links naar rechts worden geschreven (LTR), waarbij de regels van bovenaf worden geschreven (TtB).

Enkele gebruikelijke scripts (o.a. Arabisch en Hebreeuws) schrijven van rechts naar links (RTL). Ondersteuning voor afhandelen RTL en gemengde teksten met HTML uitvoer met CSS stylen.

NB: er kan een individuele taal gebruikt worden met scripts in meerdere richtingen, zoals Kazaks en Koerdisch die zowel Latijnse als Arabischse varianten ondersteunen.

Het World Wide Web Consortium heeft ook meer richtingen gedefinieerd voor gebruik in webpagina's, zoals Noord Oost Aziatisch en Aziatisch boven-naar-beneden, met regels van links-naar-rechts of van rechts-naar-links.[2]

Lettertype opbouw en invoer

Veel scripts hebben geen goede lettertypes die eenvoudig voor gebruikers beschikbaar zijn. Dit kan komen omdat besturingssystemen deze fonts niet meeleveren, of dat gebruikers niet weten hoe ze die moeten installeren, of dat niet mogen doen. De extensie UniversalLanguageSelector/nl probeert dit te verhelpen door de lettertypes te embedden in de wiki. Lettertypes worden verzorgd vanaf de server, deze hoeven niet op het gebruikerssysteem te worden geïnstalleerd.

De UniversalLanguageSelector voegt ondersteuning toe zodat het mogelijk is om een bepaald script in te voeren, gebruikers hoeven niet op een extern hulpmiddel of extern ondersteuning te vertrouwen.

Referenties

  1. Taiwan en Hong Kong zijn twee hoofdvarianten in hetzelfde Traditionele script geschreven met significante verschillen in frase gebruik vanwege de marktscheiding en de invloed van lokale zho talen, u wilt waarschijnlijk op zijn minst CN, TW en HK in uw lijstvarianten houden. Als u het bereik van de Chinese varianten wilt gebruiken met een scriptgebaseerde Vereenvoudigde/Traditionele opdeling, bekijk de acties van de melder in phab:T149278.
  2. CSS Writing modes level 3