Jump to content

Nápověda:Nové filtry pro editační recenzi/filtry kvality a záměru

From mediawiki.org
This page is a translated version of the page Help:New filters for edit review/Quality and Intent Filters and the translation is 100% complete.
PD Poznámka: Úpravou této stránky souhlasíte s uvolněním vašeho příspěvku pod licencí CC0. Více informací získáte na stránce nápovědy veřejné domény. PD

Nové filtry pro kontrolu úprav zavádí dvě skupiny filtrů – kvalitu příspěvku a záměr uživatele – které fungují odlišně od ostatních filtrů kontroly úprav. Filtry v těchto skupinách nabízejí pravděpodobnostní předpovědi o tom, zda úpravy pravděpodobně obsahují problémy či nikoli a zda uživatelé, kteří je provedli, jednali v dobré víře.

Kromě toho jazykově agnostický model rizika návratu, aktivovaný v roce 2024, poskytuje předpověď o tom, jak pravděpodobně bude úprava vyžadovat vrácení.

Když budete vědět trochu o tom, jak tyto jedinečné nástroje fungují, pomůže vám je používat efektivněji.

Tyto filtry jsou dostupné pouze na některých wikinách.

Na základě strojového učení

Předpovědi, které umožňují filtry kvality a záměru, vypočítává ORES, program strojové učení trénovaný na velké sadě úprav, které předtím zaznamenali lidští editoři. Strojové učení je výkonná technologie, která umožňuje strojům replikovat některé omezené aspekty lidského úsudku.

Filtry kvality a záměru jsou dostupné pouze na wikinách, kde jsou podporovány "modely" ORES "poškozující" a "v dobré víře". Model "poškozování" ORES řeší předpovědi kvality, zatímco jeho model "dobré víry" řeší záměr.

Povolení ORES vyžaduje, aby dobrovolníci hodnotili úpravy na příslušné wiki. Tato stránka vysvětluje proces a jak jej můžete začít na své wiki.

Jazykově agnostický model rizika návratu podporuje všechny jazykové Wikipedie a nevyžaduje manuální školení od dobrovolníků.

Výběr správného nástroje

Při pohledu na filtry Quality, Intent a Revert Risk si můžete všimnout něčeho jiného. Na rozdíl od filtrů v jiných skupinách se různé možnosti nezaměřují na různé vlastnosti úprav. Místo toho se mnoho z nich zaměřuje na stejnou vlastnost, ale nabízí různé úrovně přesnosti.

Proč by se někdo rozhodl použít nástroj, který je méně přesný? Protože taková přesnost může něco stát.

Zvýšení pravděpodobnosti předpovědi (vyšší 'přesnost')

This conceptual diagram illustrates how the Quality filters relate to one another.
Tento koncepční diagram ukazuje, jak spolu filtry kvality na mnoha wikinách souvisí (výkon se liší). Jak vidíte, filtr Velmi pravděpodobně problematická zachycuje výsledky složené téměř výhradně z úprav problému (vysoká přesnost). Zachycuje však pouze malou část všech problémových úprav (nízká vybavitelnost). Všimněte si, že vše v Velmi pravděpodobně problematická (a Pravděpodobně problematická) je také zahrnuto do širšího Možná problematická, který poskytuje vysokou vybavitelnost, ale nízkou přesnost (protože vrací vysoké procento bezproblémových úprav). Možná vás překvapí, že Možná problematická se překrývá s Velmi pravděpodobně dobrá. Oba filtry pokrývají neurčitou zónu mezi problémovými a bezproblémovými úpravami, aby zachytily více svých cílů (širší vyvolání). Z prostorových důvodů diagram přesně neodráží měřítko.

"Přesnější" filtry v nabídce vrátí vyšší procento správných oproti nesprávným předpovědím a následně méně falešně pozitivních výsledků. (V žargonu rozpoznávání vzorů mají tyto filtry vyšší "přesnost".) Této přesnosti dosahují tím, že jsou užší a přísnější. Při hledání nastavili vyšší laťku pravděpodobnosti. Nevýhodou je, že vracejí menší procento svého cíle.

Příklad: Filtr Velmi pravděpodobně problematická je nejpřesnější z filtrů kvality. Výkon se liší wiki od wiki, ale na anglické Wikipedii jsou její předpovědi ve více než 90 % případů správné. Kompromisem je, že tento filtr najde pouze asi 10 % všech úprav problému v dané sadě – protože přechází přes problémy, které je těžší odhalit. Problémy, které tento filtr najde, budou často zahrnovat zjevný vandalismus.

Najděte více svého cíle (vyšší 'připomínání')

Pokud je vaší prioritou nalezení celého cíle nebo jeho většiny, budete chtít širší a méně přesný filtr. Tito lidé najdou více z toho, co hledají, nastavením laťky pravděpodobnosti nižší. Kompromisem je, že vracejí více falešně pozitivních výsledků. (V technické řeči mají tyto filtry vyšší hodnotu "vybavení", definovanou jako procento věcí, které hledáte a které váš dotaz skutečně najde.)

Příklad: Filtr Možná problematická je nejširší filtr kvality. Výkon se na různých wikin liší, ale na anglické Wikipedii zachytí asi 82 ​​% problémových úprav. Na druhou stranu je tento filtr správný pouze v 15 % případů.
Pokud 15 % nezní příliš užitečně, vezměte v úvahu, že problémové úpravy se ve skutečnosti vyskytují v míře menší než 5 ze 100 – neboli 5 %. Takže 15% je 3x zvýšení oproti náhodnému. A samozřejmě, hlídky neodebírají vzorky náhodně. Umí používat různé nástroje a vodítka ke zvýšení míry zásahu. V kombinaci s těmito technikami poskytuje Možná problematická významnou výhodu.

(Jak je uvedeno výše, ORES funguje na různých wikinách odlišně, což znamená, že některé jsou méně předmětem právě diskutovaných kompromisů než jiné. Například na polské Wikipedii filtr Pravděpodobně problematická zachycuje 91 % problémových úprav ve srovnání s 34 % odpovídající filtr na anglické Wikipedii Z tohoto důvodu polská Wikipedie nepotřebuje – ani nemá – širší filtr Možná problematická.)

Získejte to nejlepší z obou světů (se zvýrazněním)

To nejlepší z obou světů můžete získat širokým filtrováním, ale zvýrazněním pomocí přesnějších funkcí. Zde uživatel vrhá širokou síť na poškození tím, že zkontroluje použití nejširšího filtru kvality, Možná problematická. Zároveň identifikuje nejhorší nebo nejzjevnější problémy zvýrazněním (ale ne filtrováním) Pravděpodobně problematická, Velmi pravděpodobně problematická a Pravděpodobně špatný úmysl.

Systém filtrování je navržen tak, aby uživatelům umožnil obejít výše popsané kompromisy. Můžete to udělat širokým filtrováním, zatímco Highlighting informace, na kterých záleží nejvíce.

Chcete-li použít tuto strategii, je užitečné pochopit, že přesnější filtry, jako je Velmi pravděpodobně problematická, vracejí výsledky, které jsou podmnožinou méně přesných filtrů, jako je Možná problematická. Jinými slovy, všechny výsledky "Velmi pravděpodobné" jsou také zahrnuty do širšího Možná problematická. (Tento koncept ilustruje výše uvedený diagram.)

Příklad: Najděte téměř všechna poškození a zároveň zdůrazněte nejhorší/nejpravděpodobnější:
  1. S načteným výchozím nastavením,
  2. Zkontrolujte nejširší filtr kvality, Možná problematická.
  3. Současně zvýrazněte —bez zaškrtnutí políček filtru— Pravděpodobně problematická žlutě a Velmi pravděpodobně problematická červeně.
Protože používáte nejširší filtr kvality, vaše výsledky budou zahrnovat většinu problémových úprav (vysoké "vybavení"). Ale vizuálním skenováním žlutých, červených a oranžových (tj. smíšených červených + žlutých) pruhů budete snadno schopni vybrat nejpravděpodobnější úpravy problému a řešit je jako první. (Nápovědu najdete na používání zvýraznění bez filtrování.)

Najděte dobro (a odměňte to)

Tento recenzent chce poděkovat novým uživatelům, kteří kladně přispívají. Filtr Velmi pravděpodobně dobrá izoluje bezproblémové úpravy s přesností 99 %. Filtrování Nováčci a Začátečníci omezuje vyhledávání na tyto dvě úrovně zkušeností, zatímco použití zeleného zvýraznění na Nováčci (pouze) umožňuje recenzentovi na první pohled rozlišit mezi dvěma úrovněmi.

Dobrá víra se snadno hledá, a to doslova! Stejně tak dobré úpravy.

Filtr Velmi pravděpodobně dobrý úmysl a Velmi pravděpodobně dobrá (Kvalita) vám poskytují nové způsoby, jak najít a povzbudit uživatele, kteří pracují na vylepšení wikin. Můžete například použít filtr Velmi pravděpodobně dobrá v kombinaci s filtrem Nováčci k poděkování novým uživatelům za jejich dobrou práci.

Příklad: Díky dobré víře noví uživatelé
  1. Vymažte filtry kliknutím na Koš. Poté vyberte filtry Editace stránek a Člověk (ne robot).
  2. Zkontrolujte filtr kvality Velmi pravděpodobně dobrá.
  3. Zkontrolujte filtry Registrace a Zkušenosti uživatele Nováčci a Začátečníci (to má skrytý efekt omezení vašich výsledků na registrované uživatele).
  4. Zvýrazněte filtr Nováčci zeleně.
Všechny úpravy ve vašich výsledcích budou dobrými úpravami od nováčků (uživatelé s méně než 10 úpravami a 4 dny aktivity) a studujícími (uživatelé s méně než 500 úpravami a 30 dny aktivity). Zelené zvýraznění vám umožní snadno rozlišit mezi těmito dvěma.

Dobro je všude!

Výše uvedené "dobré" filtry jsou přesné a široké, což znamená, že se na ně nevztahují kompromisy popsané v předchozí části (kombinují vysokou "přesnost" s vysokou "vybaveností"). Tyto filtry jsou správné v 99 % případů a najdou více než 90 % svých cílů. Jak to mohou udělat?

Úspěšnou odpovědí je, že "dobré" filtry fungují tak dobře, protože dobré jsou častější než špatné. To znamená, že dobré úpravy a dobrá víra jsou mnohem, mnohem hojnější než jejich protiklady – a proto se snáze hledají. Možná to některé strážníky překvapí, když to slyší, ale například na anglické Wikipedii má problémy jedna z 20 úprav a jen asi polovina těchto problematických úprav je úmyslný vandalismus.[1]

Seznam filtrů

Na wikinách, kde jsou nasazeny filtry kvality a záměru, mohou některé filtry chybět kvůli lepší kvalitě předpovědí. Čím lepší výkon ORES na wiki, tím méně úrovní filtru je potřeba.

Odhad kvality příspěvků

Velmi pravděpodobně dobrá
Spolehlivě nalezne většinu bezproblémových editací.
Možná problematická
Najde většinu vadných nebo škodlivých editací, ale s menší přesností.
Pravděpodobně problematická
S vysokou přesností najde většinu problematických editací.
Se střední přesností najde prostřední podíl problematických editací.
Velmi pravděpodobně problematická
S velmi vysokou přesností odhalí většinu očividně vadných nebo škodlivých editací.

Odhad úmyslu uživatele

Velmi pravděpodobně dobrý úmysl
Spolehlivě odhalí téměř všechny editace s dobrým úmyslem.
Možná špatný úmysl
Najde většinu editací se špatným úmyslem, ale s menší přesností.
Pravděpodobně špatný úmysl
Se střední přesností najde prostřední podíl editací se špatným úmyslem.

Návrat rizika

Úrovně filtru TBD. Používá model Jazykově agnostické riziko návratu.

Poznámky pod čarou

  1. Tato čísla pocházejí z výzkumu, který se zabýval školením modelů "poškozování" a "dobré víry" ORES na anglické Wikipedii. To znamená, že když dobrovolníci zaznamenali velkou, náhodně vylosovanou sadu testovacích úprav, našli toto.