Formát výpisu Wikibase/Indexování/RDF
Indexování Wikibase
Export RDF pro indexování wikibase
|
Tato stránka popisuje výpis RDF a formát exportu vytvořený Wikidaty a používaný pro účely exportu a indexování. Všimněte si, že i když se blíží [formátu http://korrekt.org/page/Introducing_Wikidata_to_the_Linked_Data_Web], který používá Wikidata Toolkit , není to stejný kód ani stejný formát. I když se snažíme udržet rozdíly na minimu, mohou se vyskytnout rozdíly a měli bychom používat dokumentaci pouze pro formát, který je skutečně spotřebováván.
Tento dokument popisuje výpis RDF, jak jej lze stáhnout ze zdroje výpisu Wikimedie, a i když jej lze použít k vytváření dotazů pro službu dotazování Wikidata, tato služba může mít malé rozdíly v tom, jak tamní data vypadají. Úplný seznam naleznete v kapitole Data WDQS.
Kanonický URI ontologie RDF Wikibase je http://wikiba.se/ontology. Aktuální verzi najdete na http://wikiba.se/ontology-1.0.owl.
Změny mapování RDF podléhají Zásadám stabilního rozhraní.
Datový model
Formát RDF je závazný pro datový model Wikibase a představuje pro něj exportní formát. To zejména znamená, že při změně datového modelu se odpovídajícím způsobem změní formát exportu. Tento dokument bude kvůli těmto změnám aktualizován. Následující popis předpokládá znalost datového modelu a použité terminologie.
Tato vazba RDF je založena na té, kterou pro Wikidata Toolkit navrhli Denny Vrandecic a Markus Krötzsch, viz https://web.archive.org/web/20190313052004/http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf.
Následující popis používá předpony k popisu IRI zmíněných zdrojů RDF. Úplný popis najdete v kapitole Předpony. Všechny příklady níže jsou uvedeny ve formátu Turtle.
Verze
Verze datového modelu je určena predikátem schema:softwareVersion
uzlu schema:Dataset
, což je buď uzel výpisu pro výpis nebo uzel dat entity (wdata:
) pro stránku jedné entity.
Vydané verze:
Verze | Popis |
---|---|
0.0.1 | Počáteční verze. |
0.0.2 | Změněno pořadí souřadnic WKT (T130049) |
0.0.3 | Přidána možnost pomůcek stránky na wdata: (T129046)
|
0.0.4 | Přidána podpora převodu jednotek a normalizace (T117031) |
0.0.5 | Přidaná množství bez omezení. (T115269) |
0.1.0 | Změněno kódování odkazu (T131960) |
1.0.0 | Odstraněno -beta z předpony ontologie (T112127). Mapování RDF je nyní považováno za stabilní.
|
Záhlaví
Pro výpis RDF je zde hlavička wikibase:Dump
obsahující informace o licenci, verzi softwaru generátoru a datu, kdy byla data vytvořena.
Při exportu jedné entity jsou tato data připojena k datovému uzlu (viz níže).
Příklad záhlaví:
wikibase:Dump a schema:Dataset ;
cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
schema:softwareVersion "1.0.1" ;
schema:dateModified "2015-03-21T06:03:55Z"^^xsd:dateTime .
cc:license
- specifikuje IRI licence, která se vztahuje na celý dokument RDF.schema:softwareVersion
- určuje, která verze formátu výpisu se používá (aktuálně1.0.0
), bude aktualizována při změně formátu, jakmile formát skončí období beta. Aktualizace verzí budou prováděny v souladu se sémantickým verzováním, přičemž hlavní změny jsou ty, které porušují BC, menší jsou velké změny kompatibilní s BC a změny částí opravy na drobných vylepšeních.schema:dateModified
- určuje datum platnosti dat výpisu. Některá data obsažená ve výpisu mohou být novější než toto datum, ale je zaručeno, že žádná data ve výpisu nejsou starší než toto datum. Datum by se mělo blížit času nejstarších dat obsažených ve výpisu, ale z technických důvodů nemusí být přesně stejné jako čas nejstarších dat ve výpisu.
Reprezentace entity
Entita je popsána ve dvou uzlech – datový uzel a uzel entity.
Pro entitu Q1 je datový uzel wdata:Q1
a uzel entity je wd:Q1
.
Datový uzel popisuje metadata o záznamu entity ve Wikibázi – tedy data, která nejsou součástí informací entity, ale místo toho popisují stav entity ve Wikibázi.
Má typ schema:Dataset
a obsahuje následující metadata:
- Informace o revizi entity (
schema:version
) – toto je počítadlo, které se zvyšuje s každou úpravou dat entity - Čas poslední úpravy dat entity (
schema:dateModified
) – jako časové razítkoxsd:dateTime
- Odkaz na uzel entity s predikátem
schema:about
Příklad:
wdata:Q2 schema:version "59"^^xsd:integer ;
schema:dateModified "2015-03-18T22:38:36Z"^^xsd:dateTime ;
a schema:Dataset ;
schema:about wd:Q2 .
Uzel entity popisuje skutečná data entity a má typ wikibase:Item
nebo wikibase:Property
v závislosti na druhu entity.
V budoucnu mohou být zavedeny další typy entit.
Popis entity zahrnuje následující:
- Štítky entit – hlavní název entity. Štítky jsou definovány jako
schema:name
,rdfs:label
askos:prefLabel
predikáty s objekty, které jsou jazykem označené řetězcové literály. - Aliasy entity – sekundární názvy entity. Aliasy jsou definovány jako predikáty
skos:altLabel
, přičemž objekty jsou řetězcové literály označené jazykem. - Popis entity – delší popis entity. Definováno jako predikáty
schema:description
s objekty jako řetězcové literály označené jazykem. - Pravdivá prohlášení (viz níže)
- Predikáty jej spojují s úplnými výroky
Příklad definice entity:
wd:Q3 a wikibase:Item ;
rdfs:label "The Universe"@en ;
skos:prefLabel "The Universe"@en ;
schema:name "The Universe"@en ;
schema:description "The Universe is big"@en ;
skos:altLabel "everything"@en ;
wdt:P2 wd:Q3 ;
wdt:P7 "value1", "value2" ;
p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37,
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c .
Vlastnosti stránky
Jednotka subjektu může také nést další informace o entitě, jako je počet odkazů nebo příkazů.
Data pocházejí z vlastností stránky a lze je specifikovat v konfiguračním souboru. Například:
wdata:Q42 a schema:Dataset ;
schema:about wd:Q42 ;
wikibase:statements "275"^^xsd:integer ;
wikibase:identifiers "206"^^xsd:integer ;
wikibase:sitelinks "116"^^xsd:integer .
wikibase:statements
specifies how many statements this entity has, wikibase:identifiers
specifiers the number of statements with External Id values , and wikibase:sitelinks
specifies the number of sitelinks .
V budoucnu mohou být zavedena další prohlášení.
Položky
Entity, které představují položky, mají běžná data entity, jak je popsáno výše, a navíc k nim mohou být připojeny odkazy na podstránky, jak je popsáno níže.
Vlastnosti
Entity, které představují vlastnosti, mají navíc typ vlastnosti pomocí predikátu wikibase:propertyType
.
Předmět predikátu je typ vlastnosti popsaný v Reprezentaci hodnoty níže, s předponou wikibase:
a každé slovo velké, bez oddělovačů.
To znamená, že z wikibase-item
se stane wikibase:WikibaseItem
.
Každá vlastnost je také spojena s predikáty, které jsou z ní odvozeny. Příklad:
wd:P22 a wikibase:Property ;
rdfs:label "Item property"@en ;
wikibase:propertyType wikibase:WikibaseItem ;
wikibase:directClaim wdt:P22 ;
wikibase:claim p:P22 ;
wikibase:statementProperty ps:P22 ;
wikibase:statementValue psv:P22 ;
wikibase:qualifier pq:P22 ;
wikibase:qualifierValue pqv:P22 ;
wikibase:reference pr:P22 ;
wikibase:referenceValue prv:P22 ;
wikibase:novalue wdno:P22 .
Predikáty vlastností mají také definice typu:
prv:P22 a owl:ObjectProperty .
wdt:P22 a owl:DatatypeProperty .
Typ závisí na typu původní vlastnosti – zda je její hodnota doslovná (DatatypeProperty
) nebo IRI (ObjectProperty
).
Predikáty p:
, psv:
, pqv:
a prv:
by však vždy byly owl:ObjectProperty
.
Všimněte si, že výše zmíněný wdno:P22 není na rozdíl od jiných predikát, ale třída. Podívejte se na jeho úplný popis v sekci Bez hodnoty.
Lexemy (slovní zásoby)
Úplný popis naleznete na mapování Lexeme RDF .
Lexémy jsou reprezentovány podle Lexeme RDF mapping . Příklad:
wd:L64723 a ontolex:LexicalEntry ;
# lemma (slovníkový tvar)
wikibase:lemma "hard"@en ;
# jazyk
dct:language wd:Q1860 ;
# slovní kategorie
wikibase:lexicalCategory wd:Q34698 ;
# prohlášení
wdt:P2 wd:Q3 ;
wdt:P7 "value1" , "value2" ;
p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ,
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c ;
# tvary
ontolex:lexicalForm wd:L64723-F1 ;
# smysly
ontolex:sense wd:L64723-S1 .
MediaInfo
Úplný popis naleznete na MediaInfo RDF mapping .
Entity MediaInfo jsou reprezentovány podle MediaInfo RDF mapping . Příklad:
@prefix sdc: <https://commons.wikimedia.org/entity/> .
@prefix sdcdata: <https://commons.wikimedia.org/wiki/Special:EntityData/> .
@prefix sdcs: <https://commons.wikimedia.org/entity/statement/> .
@prefix sdcref: <https://commons.wikimedia.org/reference/> .
@prefix sdcv: <https://commons.wikimedia.org/value/> .
sdcdata:M6661797 a schema:Dataset ;
schema:about sdc:M6661797 ;
cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
schema:softwareVersion "1.0.0" ;
schema:version "407884644"^^xsd:integer ;
schema:dateModified "2020-03-29T15:25:01Z"^^xsd:dateTime .
sdc:M6661797 a wikibase:Mediainfo,
schema:MediaObject,
schema:ImageObject ;
schema:encodingFormat "image/jpeg" ;
schema:contentUrl <https://upload.wikimedia.org/wikipedia/commons/6/64/Douglas_adams_portrait.jpg> ;
schema:contentSize "38890"^^xsd:integer ;
schema:height "386"^^xsd:integer ;
schema:width "600"^^xsd:integer ;
schema:caption "Photo de Douglas Adams."@fr ;
rdfs:label "Photo de Douglas Adams."@fr ;
schema:caption "Douglas Adams' portrait"@en ;
rdfs:label "Douglas Adams' portrait"@en ;
schema:caption "Foto di Douglas Adams"@it ;
rdfs:label "Foto di Douglas Adams"@it ;
wdt:P180 wd:Q42 ;
p:P180 sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec .
sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec a wikibase:Statement,
wikibase:BestRank ;
wikibase:rank wikibase:PreferredRank ;
ps:P180 wd:Q42 .
Tento příklad ukazuje data MediaInfo na WikiMedia commons při použití ve federaci s wikidaty.
Typy výroků
Formát RDF představuje výroky ve dvou formách – pravdivé a úplné výroky.
Pravdivá tvrzení
Pravdivé výroky představují výroky, které mají pro danou vlastnost nejlepší nezavržené hodnocení.
Konkrétně, pokud existuje preferovaný výrok pro vlastnost P2, pak pouze preferované výroky pro P2 budou považovány za pravdivé.
V opačném případě jsou všechna prohlášení normálního supně pro P2 považována za pravdivá.
Predikáty pravdivého prohlášení mají předponu wdt:
s názvem vlastnosti (např. wdt:P2
) a objekt je jednoduchá hodnota ( viz níže) prohlášení.
Kvalifikátory jsou ignorovány.
Pokud má hodnota jednoduchou normalizaci hodnoty (aktuálně platí pouze pro externí ID), je normalizovaná hodnota uvedena pod předponou wdtn:
, např. wdtn:P2
.
Úplná prohlášení
Úplné výpisy představují všechna data o výpisu v systému.
Úplný výpis je reprezentován jako samostatný uzel s předponou wds:
s ID výpisu (např. wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7
).
ID příkazu nemá žádný zaručený formát ani význam.
Výpisy jsou spojeny s entitou s predikátem s předponou p:
a názvem vlastnosti (např. p:P2
).
Reprezentace výroku
Uzel příkazu představuje jeden příkaz o entitě.
It has type wikibase:Statement
.
Příkaz může obsahovat hodnost, jednoduchou hodnotu (viz níže) příkazu, odkaz na plnou hodnotu, kvalifikátory a odkazy.
Pořadí příkazu je reprezentováno predikátem wikibase:rank
a objektem je jeden z: wikibase:NormalRank
, wikibase:PreferredRank
, wikibase:DeprecatedRank
.
Výpis, který má pro vlastnost nejlepší hodnocení (tj. preferovaný, pokud jsou ve vlastnosti nějaké preferované příkazy, jinak normální), má také typ wikibase:BestRank
.
Jednoduchá hodnota je reprezentována predikátem s předponou ps:
a názvem vlastnosti (např. ps:P2
) a objektem je jednoduchá hodnota.
Plná hodnota (pokud to typ vyžaduje) je reprezentována predikátem s prefixem psv:
(např. psv:P2
) a objektem je uzel s plnou hodnotou.
Příkaz vždy nemá více než jednu hodnotu, ale může mít více kvalifikátorů a odkazů.
Kvalifikace
Kvalifikátory jsou reprezentovány predikáty s předponou pq:
a názvem vlastnosti (např. pq:P2
) a objektem, který je jednoduchou hodnotou kvalifikátoru.
Plná hodnota (pokud to typ vyžaduje) je reprezentována predikátem s prefixem pqv:
(např. pqv:P2
) a objektem je uzel s plnou hodnotou.
Reference
Reference jsou reprezentovány predikátem prov:wasDerivedFrom
, přičemž objekt je referenčním uzlem (viz níže).
Příklad výroku:
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
ps:P2 wd:Q3 ;
wikibase:rank wikibase:PreferredRank ;
pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime ;
pqv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a,
wdref:d95dde070543a0e0115c8d5061fce6754bb82280 .
Referenční zobrazení
Reference představují informace o původu výroku.
Reference je reprezentována jako uzel s předponou wdref:
a místním názvem je hash odvozený z obsahu reference (např. wdref:d95dde070543a0e0115c8d5061fce6754bb82280
).
Přesná hodnota hashe není zaručena kromě skutečnosti, že stejné reference (tj. ty s identickým obsahem) vygenerují stejný hash a jiný bude generovat jiný.
Stejná reference (tj. reference se stejnými vlastnostmi se stejnými hodnotami) bude obvykle reprezentována jedním uzlem, ačkoli v datech jsou možné duplicitní referenční uzly.
Typ uzlu je wikibase:Reference
.
Referenční hodnoty jsou reprezentovány stejně jako hodnoty příkazů, přičemž jednoduché hodnoty používají predikáty s předponou pr:
(např. pr:P2
) a plné hodnoty s předponou prv:
(např. prv:P2
) a objekt je uzel s plnou hodnotou.
Na rozdíl od příkazů mohou mít odkazy libovolný počet hodnot.
Příklad referenčního uzlu:
wdref:d95dde070543a0e0115c8d5061fce6754bb82280 a wikibase:Reference ;
pr:P7 "Some data" ;
pr:P8 "1976-01-12T00:00:00Z"^^xsd:dateTime ;
prv:P8 wdv:b74072c03a5ced412a336ff213d69ef1 .
Reprezentace hodnoty
Ve formátu RDF jsou hodnoty reprezentovány ve dvou formách – jednoduchá hodnota a plná hodnota. Jednoduchá hodnota je vždy literál nebo IRI a používá se jako přímá hodnota, kterou lze pohodlně vyhledávat, indexovat a porovnávat. Úplná hodnota obsahuje další informace o hodnotě, jako jsou rozsahy, přesnost, použitý kalendář atd. Všimněte si, že zatímco pro mnoho dotazů budou stačit jednoduché hodnoty, pro jiné, složitější hodnoty budou postačovat pouze plné hodnoty.
Pokud má příkaz hodnotu (tj. není nastaven na novou hotnotu), pak bude vždy přítomna jednoduchá hodnota.
Úplné hodnoty jsou reprezentovány jako uzly s předponou wdv:
a místní název je hash obsahu hodnoty (např. wdv:382603eaa501e15688076291fc47ae54
).
Neexistuje žádná záruka hodnoty hashe kromě skutečnosti, že různé hodnoty budou reprezentovány různými hashemi a stejná hodnota uvedená na různých místech bude mít stejný hash.
Uzel hodnoty má typ wikibase:Value
.
Obsah uzlu je definován typem hodnoty (viz níže).
Příklad hodnotového uzlu:
wdv:b74072c03a5ced412a336ff213d69ef1 a wikibase:TimeValue ;
wikibase:timeValue "+1976-01-12T00:00:00Z"^^xsd:dateTime ;
wikibase:timePrecision "11"^^xsd:integer ;
wikibase:timeTimezone "0"^^xsd:integer ;
wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .
Následující text popisuje zacházení s každým druhem hodnoty v závislosti na typu hodnoty a typu vlastnosti. Všimněte si, že ne všechny aspekty datového modelu jsou v současné době zastoupeny v RDF, některé aspekty, které se v současnosti nepoužívají (jako jsou jednotky nebo hodnoty před/po pro data), jsou vynechány, protože v současnosti nenesou žádné užitečné informace. To se může v budoucnu změnit, pokud/až tyto aspekty začnou používat Wikidata.
Řetězec
Řetězce mají typ hodnoty string
a typ vlastnosti string
.
Řetězec je reprezentován jako řetězcový literál. Řetězce mají pouze jednoduchou hodnotu.
Commons media
Média na commons: mají typ hodnoty string
a typ vlastnosti commonsMedia
.
Commons media je reprezentováno jako IRI s úplnou URL zdroje Commons, odvozené od Commons souboru v podkladové datové položce.
Např.: <http://commons.wikimedia.org/wiki/Special:FilePath/Universe%20Photo.svg>
.
Má pouze jednoduchou hodnotu.
URL
Hodnoty adresy URL mají typ hodnoty string
a typ vlastnosti url
.
Adresa URL je reprezentována jako IRI odpovídající řetězci URL (např. <http://www.wikidata.org/>)
.
Má pouze jednoduchou hodnotu.
Externí ID
Hodnoty externího ID mají typ hodnoty string
a typ vlastnosti external-id
.
Jsou reprezentovány řetězcovým literálem.
Má pouze jednoduchou hodnotu.
Pokud má vlastnost nakonfigurovaný URI formátovače pro RDF (na Wikidata: formatter URI for RDF resource (P1921)), bude mít RDF také normalizovanou hodnotu, např.:
wd:Q123 wdt:P234 "External-ID" ;
wdtn:P234 <http://external.example.com/reference/External-ID>
ID entity Wikibase
Hodnoty ID entity Wikibase mají typ hodnoty wikibase-entityid
a typ vlastnosti wikibase-item
.
Subjekt je reprezentován svým IRI, např. wd:Q2
.
Má pouze jednoduchou hodnotu.
Jednojazyčný text
Hodnoty jednojazyčného textu mají typ hodnoty monolingualtext
a typ vlastnosti monolingualtext
.
Text je reprezentován jako řetězcový literál s jazykovou značkou. Má pouze jednoduchou hodnotu.
Zeměpisné souřadnice
Hodnoty textu souřadnic mají typ hodnoty globecoordinate
a typ vlastnosti globe-coordinate
.
Jednoduchá hodnota souřadnice je řetězec WKT se souřadnicemi typu geo:wktLiteral
, např.: "Point(35.3 12.93)"^^geo:wktLiteral
.
Pořadí souřadnic ve WKT je zeměpisná délka a šířka (od verze formátu 0.0.2).
Úplná hodnota má zeměpisnou šířku, délku a přesnost jako dvojnásobek a zeměkoule jako IRI.
Příklad:
wdv:a10564107110b2d5739b8fe235cddf73 a wikibase:GlobecoordinateValue ;
wikibase:geoLatitude "12.933333333333"^^xsd:double ;
wikibase:geoLongitude "35.3"^^xsd:double ;
wikibase:geoPrecision "0.000277778"^^xsd:double ;
wikibase:geoGlobe <http://www.wikidata.org/entity/Q2> .
Množství
Hodnoty množství mají typ hodnoty quantity
a typ vlastnosti quantity
.
Jednoduchá hodnota veličiny je zadané množství jako desetinný literál.
Úplná hodnota zahrnuje částku, jednotku URI (výchozí hodnota pro hodnoty bez jednotky je http://www.wikidata.org/entity/Q199) a volitelně horní a dolní hranici. Pokud není uvedena žádná horní a dolní mez, není nejistota veličiny definována. Přesné hodnoty jsou reprezentovány veličinami, které mají stejnou hodnotu pro množství, horní mez a dolní mez.
Příklad:
wdv:cb213eea7a0b90d1d7f65c6eabfab9da a wikibase:QuantityValue ;
wikibase:quantityAmount "+123"^^xsd:decimal ;
wikibase:quantityUpperBound "+124"^^xsd:decimal ;
wikibase:quantityLowerBound "+122"^^xsd:decimal ;
wikibase:quantityUnit <http://www.wikimedia.org/entity/Q199> .
Čas
Časové hodnoty mají typ hodnoty time
a typ vlastnosti time
.
Jednoduchá hodnota časové hodnoty je buď datetime hodnota typu xsd:dateTime
, pokud lze hodnotu převést na gregoriánské datum ve formátu ISO, nebo řetězec, jak je reprezentován v databázi, pokud ne.
Data xsd:dateTime
se řídí XSD 1.1 standard, který používá proleptický gregoriánský kalendář a představuje rok 1 BCE jako +0000.
To je v kontrastu s JSON reprezentací juliánských a gregoriánských dat, která se řídí tradičním číslováním roku, reprezentujícím rok 1 BCE jako -0001.
Plná hodnota zahrnuje jednoduchou hodnotu výše pod wikibase:timeValue
, přesnost a časové pásmo jako celá čísla a kalendářní model jako IRI.
Všimněte si, že model kalendáře je původní model kalendáře hodnot, i když byl wikibase:timeValue
převeden na gregoriánský.
Příklad:
wdv:85374678f22bda99efb44a5617d76e51 a wikibase:Time ;
wikibase:timeValue "+1948-04-12T00:00:00Z"^^xsd:dateTime ;
wikibase:timePrecision "11"^^xsd:integer ;
wikibase:timeTimezone "0"^^xsd:integer ;
wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .
Normalizované hodnoty
Některé hodnoty mohou být reprezentovány v několika formách, v závislosti na účelu. Délka může být například vyjádřena v různých jednotkách – stopách, palcích, metrech, mílích atd. Aby byly poskytnuty prostředky pro sjednocení těchto variant a tím i přívětivější data pro automatické zpracování, jsou zavedeny normalizované hodnoty, které jednotným způsobem představují různorodá data.
V současné době je podporována pouze normalizace hodnot převádění jednotek pro veličiny na základní jednotky – např. délka na metry. V budoucnu mohou přibýt další jednotky a další normalizace, které zde budou zdokumentovány. Konverzní tabulka je v případě potřeby k dispozici na Mediawiki gerrit.
Jediné normalizované jednoduché hodnoty jsou externí ID (viz níže).
Normalizované množství
Hodnoty normalizovaných veličin jsou uzly hodnot, které jsou paralelní s původními datovými uzly, ale jsou reprezentovány v základních jednotkách.
Jsou spojeny se svými nadřazenými uzly predikáty s předponou, ve které je "v" nahrazeno "n" - tj. psn:
, prn:
a pqn:
, například:
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
ps:P8 "123"^^xsd:decimal ;
psv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
psn:P8 wdv:85374998f22bda54efb44a5617d76e51 .
Hodnota původního množství je spojena s normalizovanou hodnotou predikátem wikibase:quantityNormalized
:
wdv:382603eaa501e15688076291fc47ae54 a wikibase:QuantityValue ;
wikibase:quantityAmount "+123"^^xsd:decimal ;
wikibase:quantityUpperBound "+124"^^xsd:decimal ;
wikibase:quantityLowerBound "+122"^^xsd:decimal ;
wikibase:quantityUnit <http://www.wikidata.org/entity/Q218593> ;
wikibase:quantityNormalized wdv:85374998f22bda54efb44a5617d76e51.
Normalizovaná hodnota má wikibase:quantityNormalized
ukazující na sebe.
Pokud je hodnota již normalizovaná - tj. je vyjádřena v základních jednotkách - potom predikáty "v" i "n" ukazují na stejnou hodnotu a wikibase:quantityNormalized
pro tuto hodnotu ukazuje na sebe.
Veličiny bez jednotek nebo s jednotkami, které nelze normalizovat (nemají žádnou základní jednotku, na kterou by se daly redukovat), nemají normalizované predikáty a normalizované hodnoty a nezahrnují wikibase:quantityNormalized
.
Doporučení je nemít více než jednu základní jednotku na vlastnost. Základní jednotky závisí na konfiguraci Wikibase a obvykle jsou vybrány tak, aby reprezentovaly všeobecně přijímané standardní jednotky, jako jsou jednotky SI.
Normalizované externí ID
U externích ID normalizace převede hodnotu řetězce na adresu URL, pokud je formátovač adresy URL pro tento účel definován v datech vlastnosti (prostřednictvím nastavení canonicalUriProperty
), pak bude normalizovaná hodnota uvedena jako wdtn:
hodnota pro pravdivé hodnoty a jako normalizovaná hodnota pro příkazy v psn:
, prn:
a predikáty pqn:
v závislosti na kontextu, kde se hodnota vyskytuje.
Zvláštní hodnoty
Datový model Wikibase má dva speciální druhy snaks – PropertySomeValueSnak, určující hodnotu, která existuje, ale jejíž identita nebo hodnota je neznámá, a PropertyNoValueSnak, určující, že hodnota neexistuje.
Neznámá hodnota
Neznámá hodnota je reprezentována jako prázdný uzel RDF ve zjednodušených i úplných příkazech:
wd:Q3 a wikibase:Item, wdt:P2 _:genid1 .
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c a wikibase:Statement ;
ps:P2 _:genid2 ;
wikibase:rank wikibase:NormalRank .
Novalue
Novalue není reprezentována běžnou hodnotou, ale jako třída entity nebo prohlášení nebo reference, s předponou wdno:
a názvem vlastnosti.
Příklad:
wd:Q3 a wikibase:Item, wdno:P7 .
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb777c a wikibase:Statement, wdno:P7 ;
wikibase:rank wikibase:NormalRank .
Entita má třídu wdno:
, pokud má pro danou vlastnost pravdivý příkaz novalue.
Novalue v hlavním snaku nebo kvalifikátorech příkazu odpovídá třídě wdno:
v uzlu příkazu a novalue v referenčním snaku odpovídá wdno:
třída na referenčním uzlu.
Třídy pro wdno:
jsou definovány takto:
wdno:P2 a owl:Class ;
owl:complementOf _:genid1 .
_:genid1 a owl:Restriction ;
owl:onProperty wdt:P2 ;
owl:someValuesFrom owl:Thing .
Odkazy na články
Odkazy jsou reprezentovány jako sada predikátů popisujících URL odkazu.
Typ uzlu je schema:Article
a je spojen s entitou prostřednictvím predikátu schema:about
.
Znaky jsou popsány s predikáty wikibase:badge
.
Predikát schema:name
obsahuje název článku v prostém textu v jazyce odkazované wiki.
Příklad:
<https://en.wikipedia.org/wiki/Duck> a schema:Article ;
schema:about wd:Q3 ;
schema:inLanguage "en" ;
schema:isPartOf <https://en.wikipedia.org/> ;
schema:name "Duck"@en ;
wikibase:badge wd:Q5 .
<https://en.wikipedia.org/> wikibase:wikiGroup "wikipedia" .
Adresa URL předmětu se skládá z předpony jazykového webu a názvu článku, adresa URL je zakódována podle RFC 3986, např.:
<https://ru.wikipedia.org/wiki/%D0%A3%D1%82%D0%BA%D0%B0>
Přesněji řečeno, použité kódování je následující:
- Normalizujte název nahrazením mezer podtržítky (
_
). - Použijte funkci wfUrlencode(), která procentuálně zakóduje všechny nealfanumerické znaky kromě "
;:@$!*(),/-_~
".
Přesměrování
Přesměrované entity jsou implementovány jako predikáty owl:sameAs
, například pokud Q6 přesměrovává na Q1, výpis bude:
wd:Q6 owl:sameAs wd:Q1 .
Použité předpony
Předpony se používají ve formátech RDF, které umožňují krátké předpony (jako Turtle a RDF). U ostatních formátů se používá úplná adresa URL.
Všechny adresy URL s předponou, které neobsahují název hostitele, mají předponu s názvem hostitele generující wiki. Všechny adresy URL s předponami, které obsahují název hostitele, jsou pevné a nezávisí na generování wiki.
Předpona | Úplná adresa URL | Použití | Příklad |
---|---|---|---|
wikibase: | http://wikiba.se/ontology# | Ontologie Wikibase | wd:Q2 a wikibase:Item
|
Uzly | |||
wdata: | /Special:EntityData/ | Soubor dat popisující určitou entitu | wdata:Q2 schema:about wd:Q2 .
|
wd: | /entity/ | Entita Wikibase – položka nebo vlastnost. | wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6a
|
wds: | /entity/statement/ | Uzel příkazu, popisuje tvrzení o entitě. | wds:Q2-a4078553-4ec1-a64a-79e7-c5b5e17b2782
a wikibase:Statement
|
wdv: | /value/ | Hodnotový uzel | wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Value
|
wdref: | /reference/ | Referenční uzel | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a .
wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Reference .
|
Předpovědi | |||
wdt: | /prop/direct/ | Pravdivá tvrzení o datech, spojuje entitu přímo s hodnotou. | wd:Q2 wdt:P9 <http://acme.com/>
|
wdtn: | /prop/direct-normalized/ | Pravdivá tvrzení o datech, spojuje entitu přímo s normalizovanou hodnotou. | wd:Q2 wdtn:P9 <http://acme.com/ABCDE>
|
p: | /prop/ | Propojuje entitu s výpisem | wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6awd
|
wdno: | /prop/novalue/ | Třída, která se použije, když má entita pro tuto vlastnost novalue. | wd:Q2 a wdno:P9 .
|
ps: | /prop/statement/ | Propojuje hodnotu s příkazem | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ps:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
|
psv: | /prop/statement/value/ | Spojuje hlubokou hodnotu s prohlášením | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
psn: | /prop/statement/value-normalized/ | Připojí normalizovanou hodnotu k uzlu příkazu | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
pq: | /prop/qualifier/ | Spojuje kvalifikátor s uzlem příkazu | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
|
pqv: | /prop/qualifier/value/ | Připojí hlubokou hodnotu kvalifikátoru k uzlu příkazu | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
pqn: | /prop/qualifier/value-normalized/ | Připojí normalizovanou hodnotu kvalifikátoru k uzlu příkazu | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
pr: | /prop/reference/ | Odkazy odkazují na hodnotu | wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a pr:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
|
prv: | /prop/reference/value/ | Odkazy odkazují na hlubokou hodnotu | wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
prn: | /prop/reference/value-normalized/ | Odkazuje na normalizovanou hodnotu | wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
Používané standardní předpony:
Předpona | Úplná adresa URL |
---|---|
rdf: | http://www.w3.org/1999/02/22-rdf-syntax-ns# |
rdfs: | http://www.w3.org/2000/01/rdf-schema# |
xsd: | http://www.w3.org/2001/XMLSchema# |
owl: | http://www.w3.org/2002/07/owl# |
skos: | http://www.w3.org/2004/02/skos/core# |
schema: | http://schema.org/ |
prov: | http://www.w3.org/ns/prov# |
geo: | http://www.opengis.net/ont/geosparql# |
Úplný seznam předpon
Tento seznam lze použít pro dotazy ve SPARQL:
PREFIX bd: <http://www.bigdata.com/rdf#>
PREFIX cc: <http://creativecommons.org/ns#>
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX geo: <http://www.opengis.net/ont/geosparql#>
PREFIX hint: <http://www.bigdata.com/queryHints#>
PREFIX ontolex: <http://www.w3.org/ns/lemon/ontolex#>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX prov: <http://www.w3.org/ns/prov#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX schema: <http://schema.org/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
PREFIX p: <http://www.wikidata.org/prop/>
PREFIX pq: <http://www.wikidata.org/prop/qualifier/>
PREFIX pqn: <http://www.wikidata.org/prop/qualifier/value-normalized/>
PREFIX pqv: <http://www.wikidata.org/prop/qualifier/value/>
PREFIX pr: <http://www.wikidata.org/prop/reference/>
PREFIX prn: <http://www.wikidata.org/prop/reference/value-normalized/>
PREFIX prv: <http://www.wikidata.org/prop/reference/value/>
PREFIX psv: <http://www.wikidata.org/prop/statement/value/>
PREFIX ps: <http://www.wikidata.org/prop/statement/>
PREFIX psn: <http://www.wikidata.org/prop/statement/value-normalized/>
PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdata: <http://www.wikidata.org/wiki/Special:EntityData/>
PREFIX wdno: <http://www.wikidata.org/prop/novalue/>
PREFIX wdref: <http://www.wikidata.org/reference/>
PREFIX wds: <http://www.wikidata.org/entity/statement/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
PREFIX wdtn: <http://www.wikidata.org/prop/direct-normalized/>
PREFIX wdv: <http://www.wikidata.org/value/>
PREFIX wikibase: <http://wikiba.se/ontology#>
Ontologie
Tím se zkompiluje seznam všech objektů a predikátů, které jsou interní ve formátu. Význam prefixů naleznete v seznamu prefixů.
Objekty
Název | Použití | Kontext |
---|---|---|
wikibase:Item | Položka Wikibase | Zadejte wd:Q123 popisující položku |
wikibase:Property | Vlastnost Wikibase | Zadejte wd:P123 popisující vlastnost |
wikibase:Lexeme | Wikibase lexeme | Zadejte wd:L123 popisující lexém |
wikibase:Form | Tvar lexému Wikibase | Zadejte popisný formulář wd:L123-F1 |
wikibase:Sense | Smysl lexému Wikibase | Zadejte wd:L123-S1 popisující smysl |
wikibase:Statement | Prohlášení o entitě | Zadejte popisný příkaz wds:1234 |
wikibase:Reference | Referenční uzel | Zadejte wdref:1234 popisující referenci |
wikibase:TimeValue | Hodnotový uzel představující časovou hodnotu | Zadejte wdv:1234 popisující časovou hodnotu |
wikibase:QuantityValue | Uzel hodnoty představující hodnotu veličiny | Zadejte wdv:1234 popisující hodnotu množství |
wikibase:GlobecoordinateValue | Hodnotový uzel představující hodnotu souřadnice | Zadejte wdv:1234 popisující hodnotu souřadnic |
wikibase:Dump | Uzel popisující datovou sadu výpisu | Používá se v hlavičce výpisu k popisu metadat pro celý výpis |
wikibase:PreferredRank | Představuje preferované uspořádání pro výrok | Použito jako objekt wikibase:rank |
wikibase:NormalRank | Představuje normální uspořádání pro výrok | Použito jako objekt wikibase:rank |
wikibase:DeprecatedRank | Představuje zastaralé uspořádání pro výrok | Použito jako objekt wikibase:rank |
wikibase:BestRank | Představuje prohlášení, které má pro vlastnost nejlepší hodnocení – tj. vhodné pro zahrnutí jako pravdivé prohlášení | Používá se jako typ wikibase:Statement |
wikibase:WikibaseItem | Typ odkazu na entitu | Použito jako objekt wikibase:propertyType |
wikibase:CommonsMedia | Typ odkazu na Commons media | Použito jako objekt wikibase:propertyType |
wikibase:GlobeCoordinate | Typ zeměpisných souřadnic | Použito jako objekt wikibase:propertyType |
wikibase:Monolingualtext | Hodnota textu v jednom jazyce | Použito jako objekt wikibase:propertyType |
wikibase:Quantity | Typ množství | Použito jako objekt wikibase:propertyType |
wikibase:String | Hodnota řetězce | Použito jako objekt wikibase:propertyType |
wikibase:Time | Hodnota času | Použito jako objekt wikibase:propertyType |
wikibase:Url | Typ odkazu URL | Použito jako objekt wikibase:propertyType |
Predikáty
Názvy kurzívou znamenají, že místo příkladu názvu P123 lze nahradit libovolný název vlastnosti.
Název | Použití | Doména | Rozsah |
---|---|---|---|
wdt:P123 | Propojte entitu s hodnotou pravdivého prohlášení | wikibase:Item|wikibase:Property | Jednoduchá hodnota |
wdtn:P123 | Propojte entitu s normalizovanou hodnotou pravdivého výroku | wikibase:Item|wikibase:Property | Jednoduchá hodnota |
p:P123 | Propojit entitu s výpisem | wikibase:Item|wikibase:Property | wikibase:Statement |
ps:P123 | Propojte příkaz s jednoduchou hodnotou | wikibase:Statement | Jednoduchá hodnota |
pr:P123 | Odkaz na jednoduchou hodnotu | wikibase:Reference | Jednoduchá hodnota |
pq:P123 | Propojit příkaz s hodnotou kvalifikátoru | wikibase:Statement | Jednoduchá hodnota |
psv:P123 | Propojit příkaz s hodnotou uzlu | wikibase:Statement | wikibase:Value |
psn:P123 | Propojení příkazu k uzlu normalizované hodnoty | wikibase:Statement | wikibase:Value |
prv:P123 | Odkaz odkazu na uzel hodnoty | wikibase:Reference | wikibase:Value |
prn:P123 | Odkaz na uzel normalizované hodnoty | wikibase:Reference | wikibase:Value |
pqv:P123 | Propojit příkaz s uzlem hodnoty kvalifikátoru | wikibase:Statement | wikibase:Value |
pqn:P123 | Propojit příkaz s normalizovaným uzlem hodnoty kvalifikátoru | wikibase:Statement | wikibase:Value |
wikibase:rank | Určuje uspořádání příkazu | wikibase:Statement | Jeden z výše uvedených objektů |
wikibase:badge | Odznak připojený k odkazu na podstránku | schema:Article | wikibase:Item - URL odznaku |
wikibase:propertyType | Typ vlastnosti entity vlastnosti | wikibase:Property | Jeden z výše uvedených objektů typu vlastnosti |
wikibase:directClaim | Propojuje entitu vlastnictví s predikátem přímého nároku | wikibase:Property | wdt:P123 |
wikibase:directClaimNormalized | Propojuje entitu vlastnictví s normalizovaným predikátem přímého nároku | wikibase:Property | wdtn:P123 |
wikibase:claim | Propojuje entitu vlastnictví s predikátem tvrzení/výroku | wikibase:Property | p:P123 |
wikibase:statementProperty | Propojuje entitu vlastnosti s predikátem jednoduché hodnoty | wikibase:Property | ps:P123 |
wikibase:statementValue | Propojí entitu vlastnosti s predikátem plné hodnoty výpisu | wikibase:Property | psv:P123 |
wikibase:statementValueNormalized | Propojí entitu vlastnosti s predikátem normalizované hodnoty | wikibase:Property | psn:P123 |
wikibase:qualifier | Propojuje entitu vlastnosti s predikátem jednoduché hodnoty kvalifikátoru | wikibase:Property | pq:P123 |
wikibase:qualifierValue | Propojí entitu vlastnosti s predikátem plné hodnoty kvalifikátoru | wikibase:Property | pqv:P123 |
wikibase:qualifierValueNormalized | Propojuje entitu vlastnosti s predikátem normalizované hodnoty kvalifikátoru | wikibase:Property | pqn:P123 |
wikibase:reference | Propojí entitu vlastnosti s odkazem na jednoduchý predikát hodnoty | wikibase:Property | pr:P123 |
wikibase:referenceValue | Propojí entitu vlastnosti s odkazem na predikát s plnou hodnotou | wikibase:Property | prv:P123 |
wikibase:referenceValueNormalized | Propojuje entitu vlastnosti s referenčním predikátem normalizované hodnoty | wikibase:Property | prn:P123 |
wikibase:hasViolationForConstraint | Propojí prohlášení porušující omezení na prohlášení o omezení | wikibase:Statement | wikibase:Statement |
wikibase:lemma | Propojuje lexém Wikibase s textem lemmatu | wikibase:Lexeme | Jednoduchá hodnota řetězce |
wikibase:lexicalCategory | Propojuje lexém Wikibase s jeho položkou lexikální kategorie | wikibase:Lexeme | wikibase:Item |
wikibase:grammaticalFeature | Propojuje formu lexému Wikibase s jeho gramatickými rysy | wikibase:Form/ontolex:Form | wikibase:Item |
Následující predikáty se používají v hlubokých hodnotách pro hodnoty konkrétních typů.
Všechny tyto predikáty mají doménu wikibase:Value
a rozsah závisí na níže uvedeném typu.
Predikáty pro Globecoordinate
Název | Typ | Význam |
---|---|---|
wikibase:geoLatitude | xsd:double | Zeměpisná složka souřadnice |
wikibase:geoLongitude | xsd:double | Zeměpisná složka souřadnice |
wikibase:geoPrecision | xsd:double | Přesnost souřadnic |
wikibase:geoGlobe | IRI | Adresa URL zeměkoule, např. http://www.wikidata.org/entity/Q2 (Země) |
Predikáty pro množství
Název | Typ | Význam |
---|---|---|
wikibase:quantityAmount | xsd:decimal | Uvedená částka |
wikibase:quantityUpperBound | xsd:decimal | Horní hranice rozsahu hodnot |
wikibase:quantityLowerBound | xsd:decimal | Spodní mez rozsahu hodnot |
wikibase:quantityUnit | IRI | Jednotka měření pro množství bez jednotky je http://www.wikidata.org/entity/Q199 (tj. "1") |
wikibase:quantityNormalized | IRI | Ukazuje na normalizovanou hodnotu, pokud existuje. |
Predikáty pro čas
Název | Typ | Význam |
---|---|---|
wikibase:timeValue | xsd:dateTime|string | Gregoriánský čas nebo řetězec, pokud hodnotu nelze reprezentovat jako Gregoriánský čas |
wikibase:timePrecision | xsd:integer | Konstanta přesnosti času |
wikibase:timeTimezone | xsd:integer | Posun časového pásma od UTC v minutách |
wikibase:timeCalendarModel | IRI | URL použitého kalendáře, např. http://www.wikidata.org/entity/Q1985727 (gregoriánský) |
Rozdíly v datech WDQS
Dotazovací služba Wikidata má data ve výše popsaném formátu, ale existují malé rozdíly, které mohou být důležité při psaní SPARQL dotazů:
- Typy (
a
nebordf:type
) nawikibase:Item
,wikibase:Statement
,wikibase:Reference
,wikibase:Lexeme
,wikibase:Form
,wikibase:Sense
jsou v současné době z důvodu výkonu vynechány.- Chcete-li filtrovat položky, můžete místo
a wikibase:Item
použítwikibase:sitelinks []
(pouze položky mají určitý počet odkazů na podstránky). - Chcete-li filtrovat výpisy, můžete místo
a wikibase:Statement
použítwikibase:rank []
(hodnotu mají pouze výpisy). - Chcete-li filtrovat reference, můžete použít
[] prov:wasDerivedFrom ?reference
místo?reference a wikibase:Reference
, ale mějte na paměti, že to může vrátit referenci více než jednou. (Obvykle stejně získáte reference prostřednictvímprov:wasDerivedFrom
z výpisu.) - Chcete-li filtrovat významy, můžete použít
ontolex:LexicalSense
místowikibase:Sense
. - Chcete-li filtrovat tvary, můžete místo
wikibase:Form
použítontolex:Form
.
- Chcete-li filtrovat položky, můžete místo
- Datové uzly (
wdata:Q2
) se neukládají, všechny informace jako verze, revize a props stránky jsou místo toho uloženy v uzlu entity (wd:Q2
). To se provádí z důvodů výkonu. - U štítků je uložen pouze
rdfs:label
, ale nikolischema:name
neboskos:prefLabel
. Protože všechny mají stejná data, ukládání všech tří je nadbytečné. - Přesměrování jsou zaznamenána, ale v současné době nemají implementovanou žádnou další sémantiku.
- WDQS nyní používá místní IRI (Skolem IRI) místo prázdných uzlů k reprezentaci nějaké hodnoty. Ty lze testovat pomocí
FILTER wikibase:isSomeValue(?node)
rather thanFILTER isBlank(?node)
Viz také Příklady dotazů SPARQL, kde se dozvíte, jak se dotazovat na data pomocí služby WDQS.