Jump to content

Formát výpisu Wikibase/Indexování/RDF

From mediawiki.org
This page is a translated version of the page Wikibase/Indexing/RDF Dump Format and the translation is 100% complete.


Změny mapování RDF podléhají Zásadám stabilního rozhraní.

Tato stránka popisuje výpis RDF a formát exportu vytvořený Wikidaty a používaný pro účely exportu a indexování. Všimněte si, že i když se blíží [formátu http://korrekt.org/page/Introducing_Wikidata_to_the_Linked_Data_Web], který používá Wikidata Toolkit , není to stejný kód ani stejný formát. I když se snažíme udržet rozdíly na minimu, mohou se vyskytnout rozdíly a měli bychom používat dokumentaci pouze pro formát, který je skutečně spotřebováván.

Tento dokument popisuje výpis RDF, jak jej lze stáhnout ze zdroje výpisu Wikimedie, a i když jej lze použít k vytváření dotazů pro službu dotazování Wikidata, tato služba může mít malé rozdíly v tom, jak tamní data vypadají. Úplný seznam naleznete v kapitole Data WDQS.

Kanonický URI ontologie RDF Wikibase je http://wikiba.se/ontology. Aktuální verzi najdete na http://wikiba.se/ontology-1.0.owl.

Změny mapování RDF podléhají Zásadám stabilního rozhraní.

Datový model

Údaje použité v popisu jedné položky

Formát RDF je závazný pro datový model Wikibase a představuje pro něj exportní formát. To zejména znamená, že při změně datového modelu se odpovídajícím způsobem změní formát exportu. Tento dokument bude kvůli těmto změnám aktualizován. Následující popis předpokládá znalost datového modelu a použité terminologie.

Tato vazba RDF je založena na té, kterou pro Wikidata Toolkit navrhli Denny Vrandecic a Markus Krötzsch, viz https://web.archive.org/web/20190313052004/http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf.

Následující popis používá předpony k popisu IRI zmíněných zdrojů RDF. Úplný popis najdete v kapitole Předpony. Všechny příklady níže jsou uvedeny ve formátu Turtle.

Verze

Verze datového modelu je určena predikátem schema:softwareVersion uzlu schema:Dataset, což je buď uzel výpisu pro výpis nebo uzel dat entity (wdata:) pro stránku jedné entity.

Vydané verze:

Verze Popis
0.0.1 Počáteční verze.
0.0.2 Změněno pořadí souřadnic WKT (T130049)
0.0.3 Přidána možnost pomůcek stránky na wdata: (T129046)
0.0.4 Přidána podpora převodu jednotek a normalizace (T117031)
0.0.5 Přidaná množství bez omezení. (T115269)
0.1.0 Změněno kódování odkazu (T131960)
1.0.0 Odstraněno -beta z předpony ontologie (T112127). Mapování RDF je nyní považováno za stabilní.

Záhlaví

Pro výpis RDF je zde hlavička wikibase:Dump obsahující informace o licenci, verzi softwaru generátoru a datu, kdy byla data vytvořena. Při exportu jedné entity jsou tato data připojena k datovému uzlu (viz níže).

Příklad záhlaví:

 wikibase:Dump a schema:Dataset ;
     cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
     schema:softwareVersion "1.0.1" ;
     schema:dateModified "2015-03-21T06:03:55Z"^^xsd:dateTime .
  • cc:license - specifikuje IRI licence, která se vztahuje na celý dokument RDF.
  • schema:softwareVersion - určuje, která verze formátu výpisu se používá (aktuálně 1.0.0), bude aktualizována při změně formátu, jakmile formát skončí období beta. Aktualizace verzí budou prováděny v souladu se sémantickým verzováním, přičemž hlavní změny jsou ty, které porušují BC, menší jsou velké změny kompatibilní s BC a změny částí opravy na drobných vylepšeních.
  • schema:dateModified - určuje datum platnosti dat výpisu. Některá data obsažená ve výpisu mohou být novější než toto datum, ale je zaručeno, že žádná data ve výpisu nejsou starší než toto datum. Datum by se mělo blížit času nejstarších dat obsažených ve výpisu, ale z technických důvodů nemusí být přesně stejné jako čas nejstarších dat ve výpisu.

Reprezentace entity

Entita je popsána ve dvou uzlech – datový uzel a uzel entity. Pro entitu Q1 je datový uzel wdata:Q1 a uzel entity je wd:Q1.

Datový uzel popisuje metadata o záznamu entity ve Wikibázi – tedy data, která nejsou součástí informací entity, ale místo toho popisují stav entity ve Wikibázi. Má typ schema:Dataset a obsahuje následující metadata:

  • Informace o revizi entity (schema:version) – toto je počítadlo, které se zvyšuje s každou úpravou dat entity
  • Čas poslední úpravy dat entity (schema:dateModified) – jako časové razítko xsd:dateTime
  • Odkaz na uzel entity s predikátem schema:about

Příklad:

 wdata:Q2 schema:version "59"^^xsd:integer ;
     schema:dateModified "2015-03-18T22:38:36Z"^^xsd:dateTime ;
     a schema:Dataset ;
     schema:about wd:Q2 .

Uzel entity popisuje skutečná data entity a má typ wikibase:Item nebo wikibase:Property v závislosti na druhu entity. V budoucnu mohou být zavedeny další typy entit.

Popis entity zahrnuje následující:

  • Štítky entit – hlavní název entity. Štítky jsou definovány jako schema:name, rdfs:label a skos:prefLabel predikáty s objekty, které jsou jazykem označené řetězcové literály.
  • Aliasy entity – sekundární názvy entity. Aliasy jsou definovány jako predikáty skos:altLabel, přičemž objekty jsou řetězcové literály označené jazykem.
  • Popis entity – delší popis entity. Definováno jako predikáty schema:description s objekty jako řetězcové literály označené jazykem.
  • Pravdivá prohlášení (viz níže)
  • Predikáty jej spojují s úplnými výroky

Příklad definice entity:

 wd:Q3 a wikibase:Item ;
     rdfs:label "The Universe"@en ;
     skos:prefLabel "The Universe"@en ;
     schema:name "The Universe"@en ;
     schema:description "The Universe is big"@en ;
     skos:altLabel "everything"@en ;
     wdt:P2 wd:Q3 ;
     wdt:P7 "value1", "value2" ;
     p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
     p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37,
          wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c .

Vlastnosti stránky

Jednotka subjektu může také nést další informace o entitě, jako je počet odkazů nebo příkazů.

Data pocházejí z vlastností stránky a lze je specifikovat v konfiguračním souboru. Například:

 wdata:Q42 a schema:Dataset ;
 	schema:about wd:Q42 ;
 	wikibase:statements "275"^^xsd:integer ;
    wikibase:identifiers "206"^^xsd:integer ;
 	wikibase:sitelinks "116"^^xsd:integer .

wikibase:statements specifies how many statements this entity has, wikibase:identifiers specifiers the number of statements with External Id values , and wikibase:sitelinks specifies the number of sitelinks . V budoucnu mohou být zavedena další prohlášení.

Položky

Entity, které představují položky, mají běžná data entity, jak je popsáno výše, a navíc k nim mohou být připojeny odkazy na podstránky, jak je popsáno níže.

Vlastnosti

Entity, které představují vlastnosti, mají navíc typ vlastnosti pomocí predikátu wikibase:propertyType. Předmět predikátu je typ vlastnosti popsaný v Reprezentaci hodnoty níže, s předponou wikibase: a každé slovo velké, bez oddělovačů. To znamená, že z wikibase-item se stane wikibase:WikibaseItem.

Každá vlastnost je také spojena s predikáty, které jsou z ní odvozeny. Příklad:

 wd:P22 a wikibase:Property ;
     rdfs:label "Item property"@en ;
     wikibase:propertyType wikibase:WikibaseItem ;
     wikibase:directClaim wdt:P22 ;
     wikibase:claim p:P22 ;
     wikibase:statementProperty ps:P22 ;
     wikibase:statementValue psv:P22 ;
     wikibase:qualifier pq:P22 ;
     wikibase:qualifierValue pqv:P22 ;
     wikibase:reference pr:P22 ;
     wikibase:referenceValue prv:P22 ;
     wikibase:novalue wdno:P22 .

Predikáty vlastností mají také definice typu:

 prv:P22 a owl:ObjectProperty .
 wdt:P22 a owl:DatatypeProperty .

Typ závisí na typu původní vlastnosti – zda ​​je její hodnota doslovná (DatatypeProperty) nebo IRI (ObjectProperty). Predikáty p:, psv: , pqv: a prv: by však vždy byly owl:ObjectProperty.

Všimněte si, že výše zmíněný wdno:P22 není na rozdíl od jiných predikát, ale třída. Podívejte se na jeho úplný popis v sekci Bez hodnoty.

Lexemy (slovní zásoby)

Úplný popis naleznete na mapování Lexeme RDF .

Lexémy jsou reprezentovány podle Lexeme RDF mapping . Příklad:

wd:L64723 a ontolex:LexicalEntry ;
     # lemma (slovníkový tvar)
     wikibase:lemma "hard"@en ;

     # jazyk
     dct:language wd:Q1860 ;

     # slovní kategorie
     wikibase:lexicalCategory wd:Q34698 ;

     # prohlášení
     wdt:P2 wd:Q3 ;
     wdt:P7 "value1" , "value2" ;
     p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
     p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ,
          wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c ;

     # tvary
     ontolex:lexicalForm wd:L64723-F1 ;

     # smysly
     ontolex:sense wd:L64723-S1 .

MediaInfo

Úplný popis naleznete na MediaInfo RDF mapping .

Entity MediaInfo jsou reprezentovány podle MediaInfo RDF mapping . Příklad:

@prefix sdc: <https://commons.wikimedia.org/entity/> .
@prefix sdcdata: <https://commons.wikimedia.org/wiki/Special:EntityData/> .
@prefix sdcs: <https://commons.wikimedia.org/entity/statement/> .
@prefix sdcref: <https://commons.wikimedia.org/reference/> .
@prefix sdcv: <https://commons.wikimedia.org/value/> .

sdcdata:M6661797 a schema:Dataset ;
	schema:about sdc:M6661797 ;
	cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
	schema:softwareVersion "1.0.0" ;
	schema:version "407884644"^^xsd:integer ;
	schema:dateModified "2020-03-29T15:25:01Z"^^xsd:dateTime .

sdc:M6661797 a wikibase:Mediainfo,
		schema:MediaObject,
		schema:ImageObject ;
	schema:encodingFormat "image/jpeg" ;
	schema:contentUrl <https://upload.wikimedia.org/wikipedia/commons/6/64/Douglas_adams_portrait.jpg> ;
	schema:contentSize "38890"^^xsd:integer ;
	schema:height "386"^^xsd:integer ;
	schema:width "600"^^xsd:integer ;
	schema:caption "Photo de Douglas Adams."@fr ;
	rdfs:label "Photo de Douglas Adams."@fr ;
	schema:caption "Douglas Adams' portrait"@en ;
	rdfs:label "Douglas Adams' portrait"@en ;
	schema:caption "Foto di Douglas Adams"@it ;
	rdfs:label "Foto di Douglas Adams"@it ;
	wdt:P180 wd:Q42 ;
	p:P180 sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec .

sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec a wikibase:Statement,
		wikibase:BestRank ;
	wikibase:rank wikibase:PreferredRank ;
	ps:P180 wd:Q42 .

Tento příklad ukazuje data MediaInfo na WikiMedia commons při použití ve federaci s wikidaty.

Typy výroků

Formát RDF představuje výroky ve dvou formách – pravdivé a úplné výroky.

Pravdivá tvrzení

Pravdivé výroky představují výroky, které mají pro danou vlastnost nejlepší nezavržené hodnocení.

Konkrétně, pokud existuje preferovaný výrok pro vlastnost P2, pak pouze preferované výroky pro P2 budou považovány za pravdivé.

V opačném případě jsou všechna prohlášení normálního supně pro P2 považována za pravdivá.

Predikáty pravdivého prohlášení mají předponu wdt: s názvem vlastnosti (např. wdt:P2) a objekt je jednoduchá hodnota ( viz níže) prohlášení.

Kvalifikátory jsou ignorovány.

Pokud má hodnota jednoduchou normalizaci hodnoty (aktuálně platí pouze pro externí ID), je normalizovaná hodnota uvedena pod předponou wdtn:, např. wdtn:P2.

Úplná prohlášení

Úplné výpisy představují všechna data o výpisu v systému. Úplný výpis je reprezentován jako samostatný uzel s předponou wds: s ID výpisu (např. wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7).

ID příkazu nemá žádný zaručený formát ani význam.

Výpisy jsou spojeny s entitou s predikátem s předponou p: a názvem vlastnosti (např. p:P2).

Reprezentace výroku

Varování Varování: "Je" možné, že výpis odkazuje na vlastnost nebo položku, která již neexistuje. Proto byste neměli předpokládat, že predikáty a objekty jsou vždy definovány.

Uzel příkazu představuje jeden příkaz o entitě. It has type wikibase:Statement. Příkaz může obsahovat hodnost, jednoduchou hodnotu (viz níže) příkazu, odkaz na plnou hodnotu, kvalifikátory a odkazy.

Pořadí příkazu je reprezentováno predikátem wikibase:rank a objektem je jeden z: wikibase:NormalRank , wikibase:PreferredRank, wikibase:DeprecatedRank.

Výpis, který má pro vlastnost nejlepší hodnocení (tj. preferovaný, pokud jsou ve vlastnosti nějaké preferované příkazy, jinak normální), má také typ wikibase:BestRank.

Jednoduchá hodnota je reprezentována predikátem s předponou ps: a názvem vlastnosti (např. ps:P2) a objektem je jednoduchá hodnota.

Plná hodnota (pokud to typ vyžaduje) je reprezentována predikátem s prefixem psv: (např. psv:P2) a objektem je uzel s plnou hodnotou.

Příkaz vždy nemá více než jednu hodnotu, ale může mít více kvalifikátorů a odkazů.

Kvalifikace

Kvalifikátory jsou reprezentovány predikáty s předponou pq: a názvem vlastnosti (např. pq:P2) a objektem, který je jednoduchou hodnotou kvalifikátoru.

Plná hodnota (pokud to typ vyžaduje) je reprezentována predikátem s prefixem pqv: (např. pqv:P2) a objektem je uzel s plnou hodnotou.

Reference

Reference jsou reprezentovány predikátem prov:wasDerivedFrom, přičemž objekt je referenčním uzlem (viz níže).

Příklad výroku:

 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
     ps:P2 wd:Q3 ;
     wikibase:rank wikibase:PreferredRank ;
     pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime ;
     pqv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
     prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a,   
         wdref:d95dde070543a0e0115c8d5061fce6754bb82280 .

Referenční zobrazení

Reference představují informace o původu výroku.

Reference je reprezentována jako uzel s předponou wdref: a místním názvem je hash odvozený z obsahu reference (např. wdref:d95dde070543a0e0115c8d5061fce6754bb82280). Přesná hodnota hashe není zaručena kromě skutečnosti, že stejné reference (tj. ty s identickým obsahem) vygenerují stejný hash a jiný bude generovat jiný. Stejná reference (tj. reference se stejnými vlastnostmi se stejnými hodnotami) bude obvykle reprezentována jedním uzlem, ačkoli v datech jsou možné duplicitní referenční uzly.

Typ uzlu je wikibase:Reference.

Referenční hodnoty jsou reprezentovány stejně jako hodnoty příkazů, přičemž jednoduché hodnoty používají predikáty s předponou pr: (např. pr:P2) a plné hodnoty s předponou prv: (např. prv:P2) a objekt je uzel s plnou hodnotou. Na rozdíl od příkazů mohou mít odkazy libovolný počet hodnot.

Příklad referenčního uzlu:

 wdref:d95dde070543a0e0115c8d5061fce6754bb82280 a wikibase:Reference ;
     pr:P7 "Some data" ;
     pr:P8 "1976-01-12T00:00:00Z"^^xsd:dateTime ;
     prv:P8 wdv:b74072c03a5ced412a336ff213d69ef1 .

Reprezentace hodnoty

Ve formátu RDF jsou hodnoty reprezentovány ve dvou formách – jednoduchá hodnota a plná hodnota. Jednoduchá hodnota je vždy literál nebo IRI a používá se jako přímá hodnota, kterou lze pohodlně vyhledávat, indexovat a porovnávat. Úplná hodnota obsahuje další informace o hodnotě, jako jsou rozsahy, přesnost, použitý kalendář atd. Všimněte si, že zatímco pro mnoho dotazů budou stačit jednoduché hodnoty, pro jiné, složitější hodnoty budou postačovat pouze plné hodnoty.

Pokud má příkaz hodnotu (tj. není nastaven na novou hotnotu), pak bude vždy přítomna jednoduchá hodnota.

Úplné hodnoty jsou reprezentovány jako uzly s předponou wdv: a místní název je hash obsahu hodnoty (např. wdv:382603eaa501e15688076291fc47ae54). Neexistuje žádná záruka hodnoty hashe kromě skutečnosti, že různé hodnoty budou reprezentovány různými hashemi a stejná hodnota uvedená na různých místech bude mít stejný hash. Uzel hodnoty má typ wikibase:Value. Obsah uzlu je definován typem hodnoty (viz níže).

Příklad hodnotového uzlu:

 wdv:b74072c03a5ced412a336ff213d69ef1 a wikibase:TimeValue ;
     wikibase:timeValue "+1976-01-12T00:00:00Z"^^xsd:dateTime ;
     wikibase:timePrecision "11"^^xsd:integer ;
     wikibase:timeTimezone "0"^^xsd:integer ;
     wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .

Následující text popisuje zacházení s každým druhem hodnoty v závislosti na typu hodnoty a typu vlastnosti. Všimněte si, že ne všechny aspekty datového modelu jsou v současné době zastoupeny v RDF, některé aspekty, které se v současnosti nepoužívají (jako jsou jednotky nebo hodnoty před/po pro data), jsou vynechány, protože v současnosti nenesou žádné užitečné informace. To se může v budoucnu změnit, pokud/až tyto aspekty začnou používat Wikidata.

Řetězec

Řetězce mají typ hodnoty string a typ vlastnosti string.

Řetězec je reprezentován jako řetězcový literál. Řetězce mají pouze jednoduchou hodnotu.

Commons media

Média na commons: mají typ hodnoty string a typ vlastnosti commonsMedia.

Commons media je reprezentováno jako IRI s úplnou URL zdroje Commons, odvozené od Commons souboru v podkladové datové položce. Např.: <http://commons.wikimedia.org/wiki/Special:FilePath/Universe%20Photo.svg>. Má pouze jednoduchou hodnotu.

URL

Hodnoty adresy URL mají typ hodnoty string a typ vlastnosti url.

Adresa URL je reprezentována jako IRI odpovídající řetězci URL (např. <http://www.wikidata.org/>). Má pouze jednoduchou hodnotu.

Externí ID

Hodnoty externího ID mají typ hodnoty string a typ vlastnosti external-id. Jsou reprezentovány řetězcovým literálem. Má pouze jednoduchou hodnotu.

Pokud má vlastnost nakonfigurovaný URI formátovače pro RDF (na Wikidata: formatter URI for RDF resource (P1921)), bude mít RDF také normalizovanou hodnotu, např.:

 wd:Q123 wdt:P234 "External-ID" ; 
         wdtn:P234 <http://external.example.com/reference/External-ID>

ID entity Wikibase

Hodnoty ID entity Wikibase mají typ hodnoty wikibase-entityid a typ vlastnosti wikibase-item.

Subjekt je reprezentován svým IRI, např. wd:Q2. Má pouze jednoduchou hodnotu.

Jednojazyčný text

Hodnoty jednojazyčného textu mají typ hodnoty monolingualtext a typ vlastnosti monolingualtext.

Text je reprezentován jako řetězcový literál s jazykovou značkou. Má pouze jednoduchou hodnotu.

Zeměpisné souřadnice

Hodnoty textu souřadnic mají typ hodnoty globecoordinate a typ vlastnosti globe-coordinate.

Jednoduchá hodnota souřadnice je řetězec WKT se souřadnicemi typu geo:wktLiteral, např.: "Point(35.3 12.93)"^^geo:wktLiteral. Pořadí souřadnic ve WKT je zeměpisná délka a šířka (od verze formátu 0.0.2).

Úplná hodnota má zeměpisnou šířku, délku a přesnost jako dvojnásobek a zeměkoule jako IRI.

Příklad:

 wdv:a10564107110b2d5739b8fe235cddf73 a wikibase:GlobecoordinateValue ;
     wikibase:geoLatitude "12.933333333333"^^xsd:double ;
     wikibase:geoLongitude "35.3"^^xsd:double ;
     wikibase:geoPrecision "0.000277778"^^xsd:double ;
     wikibase:geoGlobe <http://www.wikidata.org/entity/Q2> .

Množství

Hodnoty množství mají typ hodnoty quantity a typ vlastnosti quantity.

Jednoduchá hodnota veličiny je zadané množství jako desetinný literál.

Úplná hodnota zahrnuje částku, jednotku URI (výchozí hodnota pro hodnoty bez jednotky je http://www.wikidata.org/entity/Q199) a volitelně horní a dolní hranici. Pokud není uvedena žádná horní a dolní mez, není nejistota veličiny definována. Přesné hodnoty jsou reprezentovány veličinami, které mají stejnou hodnotu pro množství, horní mez a dolní mez.

Příklad:

wdv:cb213eea7a0b90d1d7f65c6eabfab9da a wikibase:QuantityValue ;
  wikibase:quantityAmount "+123"^^xsd:decimal ;
  wikibase:quantityUpperBound "+124"^^xsd:decimal ;
  wikibase:quantityLowerBound "+122"^^xsd:decimal ;
  wikibase:quantityUnit <http://www.wikimedia.org/entity/Q199> .

Čas

Časové hodnoty mají typ hodnoty time a typ vlastnosti time.

Jednoduchá hodnota časové hodnoty je buď datetime hodnota typu xsd:dateTime, pokud lze hodnotu převést na gregoriánské datum ve formátu ISO, nebo řetězec, jak je reprezentován v databázi, pokud ne. Data xsd:dateTime se řídí XSD 1.1 standard, který používá proleptický gregoriánský kalendář a představuje rok 1 BCE jako +0000. To je v kontrastu s JSON reprezentací juliánských a gregoriánských dat, která se řídí tradičním číslováním roku, reprezentujícím rok 1 BCE jako -0001.

Plná hodnota zahrnuje jednoduchou hodnotu výše pod wikibase:timeValue, přesnost a časové pásmo jako celá čísla a kalendářní model jako IRI. Všimněte si, že model kalendáře je původní model kalendáře hodnot, i když byl wikibase:timeValue převeden na gregoriánský.

Příklad:

 wdv:85374678f22bda99efb44a5617d76e51 a wikibase:Time ;
     wikibase:timeValue "+1948-04-12T00:00:00Z"^^xsd:dateTime ;
     wikibase:timePrecision "11"^^xsd:integer ;
     wikibase:timeTimezone "0"^^xsd:integer ;
     wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .

Normalizované hodnoty

Některé hodnoty mohou být reprezentovány v několika formách, v závislosti na účelu. Délka může být například vyjádřena v různých jednotkách – stopách, palcích, metrech, mílích atd. Aby byly poskytnuty prostředky pro sjednocení těchto variant a tím i přívětivější data pro automatické zpracování, jsou zavedeny normalizované hodnoty, které jednotným způsobem představují různorodá data.

V současné době je podporována pouze normalizace hodnot převádění jednotek pro veličiny na základní jednotky – např. délka na metry. V budoucnu mohou přibýt další jednotky a další normalizace, které zde budou zdokumentovány. Konverzní tabulka je v případě potřeby k dispozici na Mediawiki gerrit.

Jediné normalizované jednoduché hodnoty jsou externí ID (viz níže).

Normalizované množství

Hodnoty normalizovaných veličin jsou uzly hodnot, které jsou paralelní s původními datovými uzly, ale jsou reprezentovány v základních jednotkách. Jsou spojeny se svými nadřazenými uzly predikáty s předponou, ve které je "v" nahrazeno "n" - tj. psn:, prn: a pqn:, například:

 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
     ps:P8 "123"^^xsd:decimal ;
     psv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
     psn:P8 wdv:85374998f22bda54efb44a5617d76e51 .

Hodnota původního množství je spojena s normalizovanou hodnotou predikátem wikibase:quantityNormalized:

 wdv:382603eaa501e15688076291fc47ae54 a wikibase:QuantityValue ;
     wikibase:quantityAmount "+123"^^xsd:decimal ;
     wikibase:quantityUpperBound "+124"^^xsd:decimal ;
     wikibase:quantityLowerBound "+122"^^xsd:decimal ;
     wikibase:quantityUnit <http://www.wikidata.org/entity/Q218593> ;
     wikibase:quantityNormalized wdv:85374998f22bda54efb44a5617d76e51.

Normalizovaná hodnota má wikibase:quantityNormalized ukazující na sebe.

Pokud je hodnota již normalizovaná - tj. je vyjádřena v základních jednotkách - potom predikáty "v" i "n" ukazují na stejnou hodnotu a wikibase:quantityNormalized pro tuto hodnotu ukazuje na sebe.

Veličiny bez jednotek nebo s jednotkami, které nelze normalizovat (nemají žádnou základní jednotku, na kterou by se daly redukovat), nemají normalizované predikáty a normalizované hodnoty a nezahrnují wikibase:quantityNormalized.

Doporučení je nemít více než jednu základní jednotku na vlastnost. Základní jednotky závisí na konfiguraci Wikibase a obvykle jsou vybrány tak, aby reprezentovaly všeobecně přijímané standardní jednotky, jako jsou jednotky SI.

Normalizované externí ID

U externích ID normalizace převede hodnotu řetězce na adresu URL, pokud je formátovač adresy URL pro tento účel definován v datech vlastnosti (prostřednictvím nastavení canonicalUriProperty), pak bude normalizovaná hodnota uvedena jako wdtn: hodnota pro pravdivé hodnoty a jako normalizovaná hodnota pro příkazy v psn:, prn: a predikáty pqn: v závislosti na kontextu, kde se hodnota vyskytuje.

Zvláštní hodnoty

Datový model Wikibase má dva speciální druhy snaks – PropertySomeValueSnak, určující hodnotu, která existuje, ale jejíž identita nebo hodnota je neznámá, a PropertyNoValueSnak, určující, že hodnota neexistuje.

Neznámá hodnota

Neznámá hodnota je reprezentována jako prázdný uzel RDF ve zjednodušených i úplných příkazech:

 wd:Q3 a wikibase:Item, wdt:P2 _:genid1 .
 wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c a wikibase:Statement ;
     ps:P2 _:genid2 ;
     wikibase:rank wikibase:NormalRank .

Novalue

Novalue není reprezentována běžnou hodnotou, ale jako třída entity nebo prohlášení nebo reference, s předponou wdno: a názvem vlastnosti. Příklad:

 wd:Q3 a wikibase:Item, wdno:P7 .
 
 wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb777c a wikibase:Statement,  wdno:P7 ;
     wikibase:rank wikibase:NormalRank .

Entita má třídu wdno:, pokud má pro danou vlastnost pravdivý příkaz novalue.

Novalue v hlavním snaku nebo kvalifikátorech příkazu odpovídá třídě wdno: v uzlu příkazu a novalue v referenčním snaku odpovídá wdno: třída na referenčním uzlu.

Třídy pro wdno: jsou definovány takto:

 wdno:P2 a owl:Class ;
    owl:complementOf _:genid1 .
 
 _:genid1 a owl:Restriction ;
    owl:onProperty wdt:P2 ;
    owl:someValuesFrom owl:Thing .

Odkazy na články

Odkazy jsou reprezentovány jako sada predikátů popisujících URL odkazu. Typ uzlu je schema:Article a je spojen s entitou prostřednictvím predikátu schema:about.

Znaky jsou popsány s predikáty wikibase:badge. Predikát schema:name obsahuje název článku v prostém textu v jazyce odkazované wiki.

Příklad:

 <https://en.wikipedia.org/wiki/Duck> a schema:Article ;
     schema:about wd:Q3 ;
     schema:inLanguage "en" ;
     schema:isPartOf <https://en.wikipedia.org/> ;
     schema:name "Duck"@en ;
     wikibase:badge wd:Q5 .

 <https://en.wikipedia.org/> wikibase:wikiGroup "wikipedia" .

Adresa URL předmětu se skládá z předpony jazykového webu a názvu článku, adresa URL je zakódována podle RFC 3986, např.:

<https://ru.wikipedia.org/wiki/%D0%A3%D1%82%D0%BA%D0%B0>

Přesněji řečeno, použité kódování je následující:

  1. Normalizujte název nahrazením mezer podtržítky (_).
  2. Použijte funkci wfUrlencode(), která procentuálně zakóduje všechny nealfanumerické znaky kromě ";:@$!*(),/-_~".

Přesměrování

Přesměrované entity jsou implementovány jako predikáty owl:sameAs, například pokud Q6 přesměrovává na Q1, výpis bude:

 wd:Q6 owl:sameAs wd:Q1 .

Použité předpony

Předpony se používají ve formátech RDF, které umožňují krátké předpony (jako Turtle a RDF). U ostatních formátů se používá úplná adresa URL.

Všechny adresy URL s předponou, které neobsahují název hostitele, mají předponu s názvem hostitele generující wiki. Všechny adresy URL s předponami, které obsahují název hostitele, jsou pevné a nezávisí na generování wiki.

Předpona Úplná adresa URL Použití Příklad
wikibase: http://wikiba.se/ontology# Ontologie Wikibase
 wd:Q2 a wikibase:Item
Uzly
wdata: /Special:EntityData/ Soubor dat popisující určitou entitu
wdata:Q2 schema:about wd:Q2 .
wd: /entity/ Entita Wikibase – položka nebo vlastnost.
wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6a
wds: /entity/statement/ Uzel příkazu, popisuje tvrzení o entitě.
wds:Q2-a4078553-4ec1-a64a-79e7-c5b5e17b2782
  a wikibase:Statement
wdv: /value/ Hodnotový uzel
wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Value
wdref: /reference/ Referenční uzel
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a .
wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Reference .
Předpovědi
wdt: /prop/direct/ Pravdivá tvrzení o datech, spojuje entitu přímo s hodnotou.
wd:Q2  wdt:P9 <http://acme.com/>
wdtn: /prop/direct-normalized/ Pravdivá tvrzení o datech, spojuje entitu přímo s normalizovanou hodnotou.
wd:Q2  wdtn:P9 <http://acme.com/ABCDE>
p: /prop/ Propojuje entitu s výpisem
wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6awd
wdno: /prop/novalue/ Třída, která se použije, když má entita pro tuto vlastnost novalue.
wd:Q2 a wdno:P9 .
ps: /prop/statement/ Propojuje hodnotu s příkazem
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ps:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
psv: /prop/statement/value/ Spojuje hlubokou hodnotu s prohlášením
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
psn: /prop/statement/value-normalized/ Připojí normalizovanou hodnotu k uzlu příkazu
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
pq: /prop/qualifier/ Spojuje kvalifikátor s uzlem příkazu
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
pqv: /prop/qualifier/value/ Připojí hlubokou hodnotu kvalifikátoru k uzlu příkazu
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
pqn: /prop/qualifier/value-normalized/ Připojí normalizovanou hodnotu kvalifikátoru k uzlu příkazu
 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
pr: /prop/reference/ Odkazy odkazují na hodnotu
 wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a pr:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
prv: /prop/reference/value/ Odkazy odkazují na hlubokou hodnotu
 wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
prn: /prop/reference/value-normalized/ Odkazuje na normalizovanou hodnotu
 wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a

Používané standardní předpony:

Předpona Úplná adresa URL
rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
rdfs: http://www.w3.org/2000/01/rdf-schema#
xsd: http://www.w3.org/2001/XMLSchema#
owl: http://www.w3.org/2002/07/owl#
skos: http://www.w3.org/2004/02/skos/core#
schema: http://schema.org/
prov: http://www.w3.org/ns/prov#
geo: http://www.opengis.net/ont/geosparql#

Úplný seznam předpon

Tento seznam lze použít pro dotazy ve SPARQL:

PREFIX bd: <http://www.bigdata.com/rdf#>
PREFIX cc: <http://creativecommons.org/ns#>
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX geo: <http://www.opengis.net/ont/geosparql#>
PREFIX hint: <http://www.bigdata.com/queryHints#> 
PREFIX ontolex: <http://www.w3.org/ns/lemon/ontolex#>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX prov: <http://www.w3.org/ns/prov#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX schema: <http://schema.org/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>

PREFIX p: <http://www.wikidata.org/prop/>
PREFIX pq: <http://www.wikidata.org/prop/qualifier/>
PREFIX pqn: <http://www.wikidata.org/prop/qualifier/value-normalized/>
PREFIX pqv: <http://www.wikidata.org/prop/qualifier/value/>
PREFIX pr: <http://www.wikidata.org/prop/reference/>
PREFIX prn: <http://www.wikidata.org/prop/reference/value-normalized/>
PREFIX prv: <http://www.wikidata.org/prop/reference/value/>
PREFIX psv: <http://www.wikidata.org/prop/statement/value/>
PREFIX ps: <http://www.wikidata.org/prop/statement/>
PREFIX psn: <http://www.wikidata.org/prop/statement/value-normalized/>
PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdata: <http://www.wikidata.org/wiki/Special:EntityData/>
PREFIX wdno: <http://www.wikidata.org/prop/novalue/>
PREFIX wdref: <http://www.wikidata.org/reference/>
PREFIX wds: <http://www.wikidata.org/entity/statement/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
PREFIX wdtn: <http://www.wikidata.org/prop/direct-normalized/>
PREFIX wdv: <http://www.wikidata.org/value/>
PREFIX wikibase: <http://wikiba.se/ontology#>

Ontologie

Tím se zkompiluje seznam všech objektů a predikátů, které jsou interní ve formátu. Význam prefixů naleznete v seznamu prefixů.

Objekty

Název Použití Kontext
wikibase:Item Položka Wikibase Zadejte wd:Q123 popisující položku
wikibase:Property Vlastnost Wikibase Zadejte wd:P123 popisující vlastnost
wikibase:Lexeme Wikibase lexeme Zadejte wd:L123 popisující lexém
wikibase:Form Tvar lexému Wikibase Zadejte popisný formulář wd:L123-F1
wikibase:Sense Smysl lexému Wikibase Zadejte wd:L123-S1 popisující smysl
wikibase:Statement Prohlášení o entitě Zadejte popisný příkaz wds:1234
wikibase:Reference Referenční uzel Zadejte wdref:1234 popisující referenci
wikibase:TimeValue Hodnotový uzel představující časovou hodnotu Zadejte wdv:1234 popisující časovou hodnotu
wikibase:QuantityValue Uzel hodnoty představující hodnotu veličiny Zadejte wdv:1234 popisující hodnotu množství
wikibase:GlobecoordinateValue Hodnotový uzel představující hodnotu souřadnice Zadejte wdv:1234 popisující hodnotu souřadnic
wikibase:Dump Uzel popisující datovou sadu výpisu Používá se v hlavičce výpisu k popisu metadat pro celý výpis
wikibase:PreferredRank Představuje preferované uspořádání pro výrok Použito jako objekt wikibase:rank
wikibase:NormalRank Představuje normální uspořádání pro výrok Použito jako objekt wikibase:rank
wikibase:DeprecatedRank Představuje zastaralé uspořádání pro výrok Použito jako objekt wikibase:rank
wikibase:BestRank Představuje prohlášení, které má pro vlastnost nejlepší hodnocení – tj. vhodné pro zahrnutí jako pravdivé prohlášení Používá se jako typ wikibase:Statement
wikibase:WikibaseItem Typ odkazu na entitu Použito jako objekt wikibase:propertyType
wikibase:CommonsMedia Typ odkazu na Commons media Použito jako objekt wikibase:propertyType
wikibase:GlobeCoordinate Typ zeměpisných souřadnic Použito jako objekt wikibase:propertyType
wikibase:Monolingualtext Hodnota textu v jednom jazyce Použito jako objekt wikibase:propertyType
wikibase:Quantity Typ množství Použito jako objekt wikibase:propertyType
wikibase:String Hodnota řetězce Použito jako objekt wikibase:propertyType
wikibase:Time Hodnota času Použito jako objekt wikibase:propertyType
wikibase:Url Typ odkazu URL Použito jako objekt wikibase:propertyType

Predikáty

Názvy kurzívou znamenají, že místo příkladu názvu P123 lze nahradit libovolný název vlastnosti.

Název Použití Doména Rozsah
wdt:P123 Propojte entitu s hodnotou pravdivého prohlášení wikibase:Item|wikibase:Property Jednoduchá hodnota
wdtn:P123 Propojte entitu s normalizovanou hodnotou pravdivého výroku wikibase:Item|wikibase:Property Jednoduchá hodnota
p:P123 Propojit entitu s výpisem wikibase:Item|wikibase:Property wikibase:Statement
ps:P123 Propojte příkaz s jednoduchou hodnotou wikibase:Statement Jednoduchá hodnota
pr:P123 Odkaz na jednoduchou hodnotu wikibase:Reference Jednoduchá hodnota
pq:P123 Propojit příkaz s hodnotou kvalifikátoru wikibase:Statement Jednoduchá hodnota
psv:P123 Propojit příkaz s hodnotou uzlu wikibase:Statement wikibase:Value
psn:P123 Propojení příkazu k uzlu normalizované hodnoty wikibase:Statement wikibase:Value
prv:P123 Odkaz odkazu na uzel hodnoty wikibase:Reference wikibase:Value
prn:P123 Odkaz na uzel normalizované hodnoty wikibase:Reference wikibase:Value
pqv:P123 Propojit příkaz s uzlem hodnoty kvalifikátoru wikibase:Statement wikibase:Value
pqn:P123 Propojit příkaz s normalizovaným uzlem hodnoty kvalifikátoru wikibase:Statement wikibase:Value
wikibase:rank Určuje uspořádání příkazu wikibase:Statement Jeden z výše uvedených objektů
wikibase:badge Odznak připojený k odkazu na podstránku schema:Article wikibase:Item - URL odznaku
wikibase:propertyType Typ vlastnosti entity vlastnosti wikibase:Property Jeden z výše uvedených objektů typu vlastnosti
wikibase:directClaim Propojuje entitu vlastnictví s predikátem přímého nároku wikibase:Property wdt:P123
wikibase:directClaimNormalized Propojuje entitu vlastnictví s normalizovaným predikátem přímého nároku wikibase:Property wdtn:P123
wikibase:claim Propojuje entitu vlastnictví s predikátem tvrzení/výroku wikibase:Property p:P123
wikibase:statementProperty Propojuje entitu vlastnosti s predikátem jednoduché hodnoty wikibase:Property ps:P123
wikibase:statementValue Propojí entitu vlastnosti s predikátem plné hodnoty výpisu wikibase:Property psv:P123
wikibase:statementValueNormalized Propojí entitu vlastnosti s predikátem normalizované hodnoty wikibase:Property psn:P123
wikibase:qualifier Propojuje entitu vlastnosti s predikátem jednoduché hodnoty kvalifikátoru wikibase:Property pq:P123
wikibase:qualifierValue Propojí entitu vlastnosti s predikátem plné hodnoty kvalifikátoru wikibase:Property pqv:P123
wikibase:qualifierValueNormalized Propojuje entitu vlastnosti s predikátem normalizované hodnoty kvalifikátoru wikibase:Property pqn:P123
wikibase:reference Propojí entitu vlastnosti s odkazem na jednoduchý predikát hodnoty wikibase:Property pr:P123
wikibase:referenceValue Propojí entitu vlastnosti s odkazem na predikát s plnou hodnotou wikibase:Property prv:P123
wikibase:referenceValueNormalized Propojuje entitu vlastnosti s referenčním predikátem normalizované hodnoty wikibase:Property prn:P123
wikibase:hasViolationForConstraint Propojí prohlášení porušující omezení na prohlášení o omezení wikibase:Statement wikibase:Statement
wikibase:lemma Propojuje lexém Wikibase s textem lemmatu wikibase:Lexeme Jednoduchá hodnota řetězce
wikibase:lexicalCategory Propojuje lexém Wikibase s jeho položkou lexikální kategorie wikibase:Lexeme wikibase:Item
wikibase:grammaticalFeature Propojuje formu lexému Wikibase s jeho gramatickými rysy wikibase:Form/ontolex:Form wikibase:Item

Následující predikáty se používají v hlubokých hodnotách pro hodnoty konkrétních typů. Všechny tyto predikáty mají doménu wikibase:Value a rozsah závisí na níže uvedeném typu.

Predikáty pro Globecoordinate

Název Typ Význam
wikibase:geoLatitude xsd:double Zeměpisná složka souřadnice
wikibase:geoLongitude xsd:double Zeměpisná složka souřadnice
wikibase:geoPrecision xsd:double Přesnost souřadnic
wikibase:geoGlobe IRI Adresa URL zeměkoule, např. http://www.wikidata.org/entity/Q2 (Země)

Predikáty pro množství

Název Typ Význam
wikibase:quantityAmount xsd:decimal Uvedená částka
wikibase:quantityUpperBound xsd:decimal Horní hranice rozsahu hodnot
wikibase:quantityLowerBound xsd:decimal Spodní mez rozsahu hodnot
wikibase:quantityUnit IRI Jednotka měření pro množství bez jednotky je http://www.wikidata.org/entity/Q199 (tj. "1")
wikibase:quantityNormalized IRI Ukazuje na normalizovanou hodnotu, pokud existuje.

Predikáty pro čas

Název Typ Význam
wikibase:timeValue xsd:dateTime|string Gregoriánský čas nebo řetězec, pokud hodnotu nelze reprezentovat jako Gregoriánský čas
wikibase:timePrecision xsd:integer Konstanta přesnosti času
wikibase:timeTimezone xsd:integer Posun časového pásma od UTC v minutách
wikibase:timeCalendarModel IRI URL použitého kalendáře, např. http://www.wikidata.org/entity/Q1985727 (gregoriánský)

Rozdíly v datech WDQS

Dotazovací služba Wikidata má data ve výše popsaném formátu, ale existují malé rozdíly, které mohou být důležité při psaní SPARQL dotazů:

  1. Typy (a nebo rdf:type) na wikibase:Item, wikibase:Statement, wikibase:Reference , wikibase:Lexeme, wikibase:Form, wikibase:Sense jsou v současné době z důvodu výkonu vynechány.
    • Chcete-li filtrovat položky, můžete místo a wikibase:Item použít wikibase:sitelinks [] (pouze položky mají určitý počet odkazů na podstránky).
    • Chcete-li filtrovat výpisy, můžete místo a wikibase:Statement použít wikibase:rank [] (hodnotu mají pouze výpisy).
    • Chcete-li filtrovat reference, můžete použít [] prov:wasDerivedFrom ?reference místo ?reference a wikibase:Reference, ale mějte na paměti, že to může vrátit referenci více než jednou. (Obvykle stejně získáte reference prostřednictvím prov:wasDerivedFrom z výpisu.)
    • Chcete-li filtrovat významy, můžete použít ontolex:LexicalSense místo wikibase:Sense.
    • Chcete-li filtrovat tvary, můžete místo wikibase:Form použít ontolex:Form.
  2. Datové uzly (wdata:Q2) se neukládají, všechny informace jako verze, revize a props stránky jsou místo toho uloženy v uzlu entity (wd:Q2). To se provádí z důvodů výkonu.
  3. U štítků je uložen pouze rdfs:label, ale nikoli schema:name nebo skos:prefLabel. Protože všechny mají stejná data, ukládání všech tří je nadbytečné.
  4. Přesměrování jsou zaznamenána, ale v současné době nemají implementovanou žádnou další sémantiku.
  5. WDQS nyní používá místní IRI (Skolem IRI) místo prázdných uzlů k reprezentaci nějaké hodnoty. Ty lze testovat pomocí FILTER wikibase:isSomeValue(?node) rather than FILTER isBlank(?node)

Viz také Příklady dotazů SPARQL, kde se dozvíte, jak se dotazovat na data pomocí služby WDQS.