Jump to content

مرسته: د منځپانګې ژباړه/ژباړه/ د ژباړې کيفيت

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Translation quality and the translation is 65% complete.
Outdated translations are marked like this.
PD یادونه: کله چې تاسې دا مخ سموۍ، تاسې دا هم منئ چې خپلې ونډې به د CC0 شرطونو سره سم خپروئ. د نورو مالوماتو لپاره د ټولگړي شپول لارښود مخونه وگورئ. PD

کله چې ژباړه جوړه کړئ، دا اړینه ده چې د خپرولو دمخه د منځپانګې بیاکتنه وکړئ. تاسو اړتیا لرئ ډاډ ترلاسه کړئ چې تولید شوې مینځپانګې اصلي مانا په غیر ارادي ډول نه بدلوي، او وګورئ چې دا په طبیعي ډول د لوستلو وړ وي. د لومړني ماشین ژباړه چمتو شوې د ژباړې پروسې په چټکتیا او ګټور پیل کې مرسته کوي، مګر دا وسیله کاروونکي هڅوي چې د لومړنۍ منځپانګې بیاکتنه او د پام وړ سمون وکړي.

یو ډول تګلارې د دې ډاډ ترلاسه کولو لپاره په کار اچول شوي چې ژباړونکي لومړنۍ ژباړې په مناسب ډول ترمیم کړي. د ژباړې مدیردا څاري چې د کارن له خوا څومره لومړنۍ ژباړې سمې شوي، او بېلابېل محدودیتونه ټاکي چې یا یې: د خپرولو مخه ونیسي، یا کاروونکو ته خبرداری ورکړي، تر څو دوی وهڅيږي چې د منځپانګې بیاکتنه وکړي.

په دې توګه، دا وسیله د کاروونکو لپاره دا شونې کوي چې د لومړني ماشین ژباړې څخه ښه ګټه پورته کړي، په داسې حال کې چې د روښانه بیاکتنې له مخې د ټیټ کیفیت پایلو رامینځته کولو مخه نیسي. نور څرګنداوی لاندې وړاندې کیږي چې دا محدودیتونه څنګه کار کوي، څنګه د هرې ژبې اړتیاوو سره سمون موندلی شي، او څنګه د وسیلې سره تولید شوې مینځپانګې کیفیت اندازه کېدای شي.

د ژباړې بیاکتنې هڅولو لپاره محدودیتونه

'د منځپانګې ژباړه وسیله د بدلون سلنه اندازه کوي چې کاروونکي یې لومړنۍ خپلسرې ژباړې چمتو شوي ته کوي. په دې توګه، سیسټم پوهیږي چې څومره کلمې د لومړنۍ ژباړې څخه زياتې شوې، لرې شوي، یا سمې شوې. اندازه کول په دوه مختلف کچو کې ترسره کیږي: د هر پراګراف لپاره او د ټولې ژباړې لپاره. په هره کچه بېلابېل محدودیتونه پلي کیږي، لکه څنګه چې لاندې ښوول شوي.

د ټولې ژباړې لپاره محدوديتونه

تېروتنه ښودل شوې کله چې د ډېرې نه بدلېدونکې ماشیني ژباړې سره د ژباړې خپرولو هڅه کوئ. دا ژباړه د اندونېزيايي سمونوالو په نظرونو تنظيم شوې ده.

نه خپريږي، که چېرې د ټولې ليکنې ۹۹٪ یا ډېره برخه غیر ترمیم شوې ، ماشیني ژباړل شوې مینځپانګې ولري. دا محدوديت د خامې ماشيني ژباړې مخنيوی کوي او د ښکاره تخريب مخه نيسي. په همدې ډول دا د ماشیني ژباړې برخې ترمیمولو پرته یوازې د مینځپانګې اضافه کولو سره د کارن مخه نیسي. د لاندې څرګندونو پر اساس، دا حد د هرې ژبې پراساس تنظيم کېدای شي.

د هر پراګراف لپاره حدود

خبرداری د یو ځانګړي پراګراف لپاره ښودل شوی چېرې چې د ماشین نه بدلېدونکې ژباړه له حد څخه تېریږي.

د کارن د سمونو سلنه هم د هر پراګراف لپاره اندازه کیږي. يو پراګراف هغه وخت ستونزمن ګڼل کيږي چې له ۶۵٪ زياته ماشيني ژباړه ولري( يا، کله چې د سرچینې سند څخه محتويات کاپي شي، او دا د ۶۰٪ څخه زیات ناسمه منځپانګه ولري).

د ژباړې مدیر به د هر پراګراف لپاره یو اخطار ښیې چې ستونزمن ګڼل کیږي، ترڅو کارن نورو سمونونو ته وهڅوي. په ځینو حالتونو کې، کارن لاهم د خپرولو توان لري، خو د پایلې پاڼه کېدای شي د ټولنې له خوا د ژباړې د بیاکتنې او ارزونې لپاره د احتمالي بیاکتنې څار ته ورزياته کړای شي. په نورو قضیو کې، کارن دا اجازه نه لري، چې نور څه خپاره کړي.

لاندې ځینې فکتورونه دي چې د دې مالومولو لپاره په پام کې نیول شوي چې ایا کاروونکو ته د خپرولو اجازه ورکوي یا نه (چې ځینې یې لاهم په پراختیا کې دي):

  • 'د ستونزو لرونکي پراګرافونو شمېر' کارن د ۵۰ یا ډېرو ستونزو لرونکو پراګرافونو سره د ژباړې خپرولو مخه نیسي. د ۵۰ څخه کم ستونزمن پراګرافونو سره د ژباړې خپرولو اجازه لري، مګر هغه چې له ۱۰ څخه تر ۴۹ پورې ستونزې لرونکي پراګرافونه لري د احتمالي غیر بیاکتنې شوې ژباړې تعقیب کټګورۍ کې د ټولنې بیاکتنې لپاره اضافه کیږي.
  • 'مخکینۍ ړنګې شوې ژباړې.' د تکراري ستونزو د مخنیوي لپاره، دا وسیله هغه کارن پېژني چې په تېرو ۳۰ ورځو کې یې خپرې شوې ژباړې حذف شوي، او د دوی د ژباړې په راتلونکو هڅو کې ډېر سخت محدودیتونه وضع کوي. په دې ټولګي کې د کاروونکو لپاره، د ۱۰ ستونزې لرونکي پراګرافونو یا ډېرو ژباړو د خپرولو مخه نیول کیږي، په داسې حال کې چې د ۹ یا لږ ستونزمن پراګرافونو سره د ټولنې لپاره د بیاکتنې لپاره د احتمالي غیر بیاکتنې ژباړې تعقیب کټګورۍ کې اضافه شوي.
  • 'د کارن تایید.' د پراګرافونو لپاره لږ سخت حد په پام کې نیول کیږي چې یو کارن د حل شوي په توګه په نښه کوي — د یو سیګنال په توګه اخیستل شوی چې کارونکي د ژباړې حالت بیاکتنه او تایید کړې. د پراګرافونو لپاره چېرې چې د نه بدلېدونکې مینځپانګې خبرداری ښودل شوی ، مګر کارن یې د حل شوي په توګه په نښه کوي ، لږ سخت حد پلي کیږي (د ماشیني ژباړې ۹۵٪ یا د سرچینې مینځپانګې ۷۵٪ منل). دا به د هغو قضیو ځای په ځای کولو لپاره یوه لاره چمتو کړي چې خپلسرې ژباړه يې په استثنایی ډول ښه وي، مګر بیا هم د فیچر احتمالي ناوړه ګټه اخیستنې څخه مخنیوی وکړئ (د بېلګې په توګه، د کارن تاییدپاڼه په ړندو سترګو مه پلې کوئ).

منځپانګې اه محدوديتونو، نه اغېزمنې کيږي

ځینې منځپانګې تمه نه کیږي چې د پام وړ ترمیم شي، او په دې توګه د پورته بیان شوي محدودیتونو پلي کولو په وخت کې په پام کې نه نیول کیږي. د خورا لنډې برخې سرلیکونه، سرچينې، یا د سرچينو نوملړ د بیاکتنې څخه ایستل شوي دي. که نه نو، کارن کولی شي د منځپانګې ژباړلو په اړه ګومراه کونکي اخطارونه ترلاسه کړي چې باید نه وي، لکه د کتاب سرلیکونه په سرچينې یا نور مناسب نومونو کې څرګندیږي.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.

Publication of fast unreviewed translations

Campaigns and contests can result in spikes of translations where some user unfamiliar with the community policies may focus on making many translations and not pay enough attention to review their contents. In order to emphasize quality over quantity, a mechanism has been defined to limit the publication of fast unreviewed translations.

After a user translates a large article, the next translation can only be started after some time has passed. The waiting period estimation considers 1 minute per paragraph up to 10 minutes. That is:

  • For articles with 10 paragraphs or less, we want to make sure that users spent translating it at least N minutes (one minute per paragraph)
  • For articles with more than 10 paragraphs we want to make sure that users spent translating it at least 10 minutes.


This has been applied on mobile initially since it is a space with less activity, and after measuring the impact we'll consider expanding it to desktop too.


د حدودو سمون

پورته بیان شوي محدودیتونه د عمومي تګلارې ټولګه چمتو کوي، مګر دوی ممکن د هرې ویکي ځانګړو اړتیاو سره سم سمون ته اړتیا ولري. د لومړنۍ ارزونې پر بنسټ، د لومړنۍ ماشیني ژباړې لپاره د اړتیا وړ بدلون اندازه کېدای شي د ۱۰٪ څخه تر ۷۰٪ پورې وي، د ژبو خپلمنځي اړيکو پورې اړه لري. په ځینو ویکیګانو کې، ټاکلي حدونه کېدای شي ډېر سخت وي، ناسم او نااړين پوهای رامنځته کوي او د بشپړې معتبرې ژباړې د خپرېدو مخه نیسي. په نورو ويکيګانو کې، محدوديتونه ښايي دومره سخت نه وي، چې د هغو ژباړو خپرولو ته اجازه ورکوي چې په کافي اندازه تدوين شوي نه وي.

د بېلابېلو حدونو تنظیمول هرې ویکي ته اجازه ورکوي چې د خپلو ځانګړو اړتیاو سره سم د وسیلې حدود تنظیم کړي. د ځایی ویناوالو ارزونه د محدودیتونو په سمه توګه تنظیمولو کې اړینه ده. که اوسنۍ محدودیتونه د ژباړې په جوړولو یا بیاکتنې کې ستاسو د تجربې پراساس ښه کار نه کوي، مهرباني وکړئ ستاسو ارزونه خپره کړئ، او موږ کولی شو دا وڅېړو چې څنګه یې ښه تنظیم کړو.

کله چې د حدونو د تنظیمولو په اړه ارزونه وړاندې کړئ، موږ وړاندیز کوو چې تاسو لومړی د ژباړې څو بېلګې رامینځته کړئ (ډاډ ترلاسه کړئ چې د خپرولو اختیارونه وګورئ که ستاسو ازموینه د منظمې مینځپانګې په توګه د خپرولو لپاره نه وي). کله چې دا ازموینه وکړئ چې محدودیتونه ستاسو د ژبې لپاره څنګه کار کوي، نو دا ګټوره ده چې لاندې خبرې په ذهن کې وساتئ:

  • 'د دواړو قضیو لپاره وګورئ' ډاډ ترلاسه کړئ چې وګورئ چې محدودیتونه د دواړو لپاره څنګه کار کوي: که دژباړې مینځپانګه په کافي اندازه نه وي ترمیم شوې ، په مقابل کې دا چې په کافي اندازه ترمیم شوې. په دې توګه، تاسو کولی شئ په اسانۍ سره د وسیلې د محدودیت ځانګړتیا لپاره سم توازن ومومئ. یوازې د یو ډول ستونزې لټون کولی شي د دې لامل شي چې حدونه په مخالف لوري کې ډېر لرې حرکت وکړي.
  • 'بېلابېلې منځپانګې وڅېړئ' زموږ په ويکيګانو کې منځپانګې خورا متنوع دي، او ماشيني ژباړه ښايي د نورو په پرتله په ځينو مواردو کې ډېره ښه کار وکړي. د بېلګې په توګه، هغه منځپانګې چې د شمېرو مالوماتو یا تخنیکي نومونو څخه ډکې وي کېدای شي د کارن له خوا د منځپانګې د ډېر تشريحي متن پرځای لږ سمون ته اړتیا ولري. له خپلې ژباړې مو د بېلابېلو منځپانګو، بېلابېلو ليکنو او د کرښو په اوږدوالي سره ازمايښت کړئ او ځان ډاډه کړئ.
  • تکرار کولو ته چمتو اوسئ. د حدونو تنظیمول یو تکراري پروسه ده. دا ښايي دودیزو سمونونو ته اړتیا ولري یا دا چې تاسو خپل عمومي چلند ته وده ورکړئ. په هر حالت کې، د هر بدلون وروسته، شايد د پرمختګونو تصدیق کولو لپاره نور ازموینې ته اړتیا وي.

د مدیرانو سره په همکارۍ کې د محدودیتونو تنظیمول اغېزمن ثابت شوي. د بېلګې په ډول، ابتدايي پایلې ښیي چې د اندونیزیا ټولنه د پام وړ کچه د هغو ستونزمنو ژباړو شمېر چې دوی یې ترلاسه کوي د ۷۰٪ څخه زیات د ماشیني ژباړې منځپانګې سره د ژباړې خپرول محدود کړي. د تېلوګو او آسامی ژبو ویکیګانو لپاره ورته سمونونه رامینځته شوي. هیڅ خپلسرې وسيله نشته چې بې ارزښته وي، او دا محدودیتونه استثنا نه دي.

د ټولنې لخوا د منځپانګې بیاکتنې پروسه لاهم اړینه ده، مګر دا محدودیتونه ټولنې ته داسې وسیله چمتو کوي چې د ژباړې شمېر کم کړي چې دوی یې تمرکز کوي، د بیاکتنې پروسه خورا اغېزمنه کوي. Please share your feedback and we can explore how to better adjust them.

Tracking potentially unreviewed translations

A tracking category with the name "cx-unreviewed-translation-category" is provided for communities to easily find articles that have been published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. Using it, you can track articles that passed the limits preventing publication, but that still had some paragraphs that were edited less than expected. For example the Indonesian Wikipedia's category includes articles that have less than 40% of machine translation overall, but which have some paragraphs with more than 80% of unmodified machine translation.

Measuring translation quality

Evaluating content quality automatically is not trivial. Deletion ratios provide a useful measure for estimating whether the content created was good enough for the community involved not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted when compared with articles created from scratch. This suggests that it may not be practical to set the limits for participation through translating much higher than those set for other ways of article creation.

Find published translations

Content translation adds a contenttranslation edit tag to the published translations. This allows communities the ability to use Recent changes, and similar tools, to focus on pages created using the translation tool. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

Inspect a specific translation

Translation debugger example

The Translation debugger is a tool that allows the inspection of some metadata for a given translation, including the percentage of machine translation used for the whole document, and the translation service used for each paragraph. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

Other limits based on user expertise

Error showing a publishing restriction based on the user expertise. This example is based on the decision of the English Wikipedia community to limit publishing directly to the mainspace to extended autoconfirmed users only.

Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low-quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the User: or Draft: namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low-quality translations, while still allowing publication by editors making good translations.