Wikibase/Indexation/Format RDF Dump
Indexation Wikibase
Export RDF pour indexation wikibase
|
Cette page décrit le format RDF dump et le format d'exportation RDF généré par Wikidata et utilisé dans un but d'extraction et d'indexation. Veuillez noter que bien que proche du format utilisé par Wikidata Toolkit , ce n'est ni le même code ni le même format. Même si nous nous efforçons de minimiser les divergences, il peut rester des différences et vous ne devez utiliser que la documentation du format effectivement utilisé.
Ce document décrit le vidage RDF tel qu'il peut être téléchargé depuis la source de vidage Wikimedia, et bien qu'on puisse l'utiliser pour créer des requêtes pour le Service de requête de Wikidata, le service peut avoir des petites différences quant à la représentation des données. Consultez le chapitre des différences de données WQDS pour la liste complète.
L'URI canonique de l'ontologie RDF de la Wikibase est http://wikiba.se/ontology. La version actuelle se trouve à http://wikiba.se/ontology-1.0.owl.
Les changements de représentation RDF sont assujettis à la Politique d'interface stable.
Modèle de données
Le format RDF correspond au modèle de données Wikibase et en est un format d'exportation. Cela signifie en particulier que si le modèle de données change, le format d'exportation s'adaptera en conséquence. Ce document reflétera de tels changements. La description suivante présuppose une certaine familiarité avec le modèle de données et la terminologie employée.
Cette correspondance RDF repose sur celle conçue pour la Boîte à outils Wikidata de Denny Vrandecic et Markus Krötzsch disponible ici : https://web.archive.org/web/20190313052004/http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf.
La description ci-dessous se sert de préfixes pour décrire les IRI des ressources RDF mentionnées. Allez à la section Préfixes pour une description complète. Tous les exemples ci-dessous sont exprimés en syntaxe Turtle.
Versions
La version du modèle de données est spécifiée par le prédicat schema:softwareVersion
du nœud schema:Dataset
, qui est soit un nœud de vidage pour un dump, soit un nœud de données d'entité (wdata:
) pour une page d'entité individuelle.
Versions diffusées :
Version | Description |
---|---|
0.0.1 | Version initiale. |
0.0.2 | Changed WKT coordinate order (T130049) |
0.0.3 | Added page props option to wdata: (T129046)
|
0.0.4 | Added unit conversion & normalisation support (T117031) |
0.0.5 | Ajout des quantités sans limite. (T115269) |
0.1.0 | Changed link encoding (T131960) |
1.0.0 | Removed -beta from the ontology prefix (T112127). La représentation RDF est désormais considérée stable.
|
Entête
For the RDF dump, there is the header node wikibase:Dump
containing information about the license, the software version of the generator and the date the data was produced.
En cas d'exportation d'entité individuelle, ces données sont associées au nœud d'entité (voir ci-dessous).
Exemple d'entête :
wikibase:Dump a schema:Dataset ;
cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
schema:softwareVersion "1.0.1" ;
schema:dateModified "2015-03-21T06:03:55Z"^^xsd:dateTime .
cc:license
- précise l'IRI de la licence qui s'applique à tout le document RDF.schema:softwareVersion
- specifies which version of the dump format is being used (currently1.0.0
), will be updated when format changes, once the format is out of the beta period. The version updates will be done along the lines of semantic versioning, with major changes being BC breaking ones, minor being major BC-compatible changes and patch part changes on minor tweaks.schema:dateModified
- indique la date de validité des données du vidage. Certaines données contenues dans un vidage peuvent être plus récentes que cette date, mais on est assuré qu'il n'y a aucune donnée dans ce vidage plus ancienne que cette date. La date devrait être proche de celle de la plus ancienne donnée contenue dans le vidage, mais pour des raisons techniques elle peut être légèrement différente de celle-ci.
Représentation d'une entité
L'entité est décrite par deux nœuds - le nœud de données et le nœud d'entité.
For entity Q1, data node is wdata:Q1
and entity node is wd:Q1
.
Le nœud de données expose les métadonnées de l'enregistrement de l'entité dans Wikibase - c'est à dire les données qui ne font pas partie des informations de l'entité elle-même mais qui décrivent l'état de l'entité dans la Wikibase.
It has type of schema:Dataset
and contains the following metadata:
- Information about the entity revision (
schema:version
) – this is a counter that increases with each modification of the entity data - Last modification time of the entity data (
schema:dateModified
) – as anxsd:dateTime
timestamp - Link to the entity node with
schema:about
predicate
Exemple :
wdata:Q2 schema:version "59"^^xsd:integer ;
schema:dateModified "2015-03-18T22:38:36Z"^^xsd:dateTime ;
a schema:Dataset ;
schema:about wd:Q2 .
Entity node describes the actual entity data and has type wikibase:Item
or wikibase:Property
depending on the kind of entity.
D'autres types d'entités pourront être introduits dans le futur.
La description d'une entité comporte les éléments suivants :
- Étiquettes d'entités - nom principal de l'entité. Les étiquettes sont définies par les prédiats comme
schema:name
,rdfs:label
etskos:prefLabel
avec des objets qui sont littéraux de chaîne étiquetés par langage. - Alias d'entités - noms secondaires de l'entité. Les alias sont définis comme des prédicats
skos:altLabel
avec des objets marqués avec la chaîne de caractères de la langue. - Description de l'entité - description plus longue de l'entité. Défini comme des prédicats
schema:description
avec des objets qui sont des littéraux de chaîne marquées par la langue. - Déclarations de quasi vérité (voir ci-dessous)
- Prédicats le reliant aux déclarations complètes
Exemple d'une définition d'entité :
wd:Q3 a wikibase:Item ;
rdfs:label "The Universe"@en ;
skos:prefLabel "The Universe"@en ;
schema:name "The Universe"@en ;
schema:description "The Universe is big"@en ;
skos:altLabel "everything"@en ;
wdt:P2 wd:Q3 ;
wdt:P7 "value1", "value2" ;
p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37,
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c .
Propriétés de Page
Un nœud d'entité peut aussi avoir des informations supplémentaires concernant l'entité, telles que le nombre de liens ou de déclarations.
The data is sourced from page properties and can be specified in config file. Par exemple :
wdata:Q42 a schema:Dataset ;
schema:about wd:Q42 ;
wikibase:statements "275"^^xsd:integer ;
wikibase:identifiers "206"^^xsd:integer ;
wikibase:sitelinks "116"^^xsd:integer .
wikibase:statements
specifies how many statements this entity has, wikibase:identifiers
specifiers the number of statements with External Id values , and wikibase:sitelinks
specifies the number of sitelinks .
Des déclarations supplémentaires pourront être introduites dans le futur.
Items
Entities that represent items have the common entity data as described above, plus can have sitelinks attached to them, as described below.
Propriétés
Entities that represent properties additionally feature the property type using wikibase:propertyType
predicate.
The object of the predicate is the property type described in Value representation below, with wikibase:
prefix and each word capitalised, with no separators.
I.e., wikibase-item
becomes wikibase:WikibaseItem
.
Each property is also linked to the predicates that are derived from it. Exemple :
wd:P22 a wikibase:Property ;
rdfs:label "Item property"@en ;
wikibase:propertyType wikibase:WikibaseItem ;
wikibase:directClaim wdt:P22 ;
wikibase:claim p:P22 ;
wikibase:statementProperty ps:P22 ;
wikibase:statementValue psv:P22 ;
wikibase:qualifier pq:P22 ;
wikibase:qualifierValue pqv:P22 ;
wikibase:reference pr:P22 ;
wikibase:referenceValue prv:P22 ;
wikibase:novalue wdno:P22 .
Les prédicats des propriétés ont aussi des définitions de type :
prv:P22 a owl:ObjectProperty .
wdt:P22 a owl:DatatypeProperty .
The type depends on the type of the original property - whether its value is literal (DatatypeProperty
) or IRI (ObjectProperty
).
However, p:
, psv:
, pqv:
and prv:
predicates would always be owl:ObjectProperty
.
Note that wdno:P22 mentioned above is not a predicate, unlike others, but a class. See the full description of it in Novalue section.
Lexèmes
Please see full description at Lexeme RDF mapping .
Lexemes are represented according to Lexeme RDF mapping . Exemple :
wd:L64723 a ontolex:LexicalEntry ;
# lemme
wikibase:lemma "hard"@en ;
# langue
dct:language wd:Q1860 ;
# catégorie lexicale
wikibase:lexicalCategory wd:Q34698 ;
# déclarations
wdt:P2 wd:Q3 ;
wdt:P7 "value1" , "value2" ;
p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ,
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c ;
# formes
ontolex:lexicalForm wd:L64723-F1 ;
# sens
ontolex:sense wd:L64723-S1 .
MediaInfo
Please see full description at MediaInfo RDF mapping .
MediaInfo entities are represented according to MediaInfo RDF mapping . Exemple :
@prefix sdc: <https://commons.wikimedia.org/entity/> .
@prefix sdcdata: <https://commons.wikimedia.org/wiki/Special:EntityData/> .
@prefix sdcs: <https://commons.wikimedia.org/entity/statement/> .
@prefix sdcref: <https://commons.wikimedia.org/reference/> .
@prefix sdcv: <https://commons.wikimedia.org/value/> .
sdcdata:M6661797 a schema:Dataset ;
schema:about sdc:M6661797 ;
cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
schema:softwareVersion "1.0.0" ;
schema:version "407884644"^^xsd:integer ;
schema:dateModified "2020-03-29T15:25:01Z"^^xsd:dateTime .
sdc:M6661797 a wikibase:Mediainfo,
schema:MediaObject,
schema:ImageObject ;
schema:encodingFormat "image/jpeg" ;
schema:contentUrl <https://upload.wikimedia.org/wikipedia/commons/6/64/Douglas_adams_portrait.jpg> ;
schema:contentSize "38890"^^xsd:integer ;
schema:height "386"^^xsd:integer ;
schema:width "600"^^xsd:integer ;
schema:caption "Photo de Douglas Adams."@fr ;
rdfs:label "Photo de Douglas Adams."@fr ;
schema:caption "Douglas Adams' portrait"@en ;
rdfs:label "Douglas Adams' portrait"@en ;
schema:caption "Foto di Douglas Adams"@it ;
rdfs:label "Foto di Douglas Adams"@it ;
wdt:P180 wd:Q42 ;
p:P180 sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec .
sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec a wikibase:Statement,
wikibase:BestRank ;
wikibase:rank wikibase:PreferredRank ;
ps:P180 wd:Q42 .
Cet exemple montre les données MediaInfo sur Wikimedia Commons lorsqu'elles sont fédérées avec Wikidata.
Types de déclaration
Le format RDF représente les déclarations sous deux formes - quasi-vérités et déclarations exhaustives.
Quasi-vérités
Les quasi-vérités sont des déclarations qui ont le rang non-obsolète le plus élevé pour une propriété donnée.
En effet, si une déclaration préférée est faite pour la propriété P2, seule la déclaration préférée pour P2 sera considérée comme vraie.
Dans le cas contraire, toutes les déclarations de rang normal pour P2 sont considérées comme vraies.
Les prédicats de quasi vérité ont pour préfixe wdt:
avec le nom de la propriété (par exemple wdt:P2
) et l'objet est la valeur simple (voir ci-dessous) de la déclaration.
Les qualificatifs sont ignorés.
Si la valeur possède une simple normalisation de valeur (actuellement valable uniquement pour l'ID externe), la valeur normalisée est répertoriée sous le préfixe wdtn:
, par exemple wdtn:P2
.
Déclarations exhaustives
Les déclarations exhaustives représentent toutes les données sur la déclaration dans le système.
Full statement is represented as separate node, with prefix wds:
with the id of the statement (e.g. wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7
).
Il n'y a aucun format garanti ou signification quant à l'identifiant de la déclaration.
The statements are linked to the entity with the predicate with prefix p:
and the name of the property (e.g. p:P2
).
Représentation d'une déclaration
Le nœud de déclaration représente une déclaration individuelle à propos d'une entité.
It has type wikibase:Statement
.
La déclaration peut contenir le rang, la valeur simple (voir ci-dessous) de la déclaration, le lien vers la valeur complète, les qualificatifs et les références.
The statement rank is represented by the predicate wikibase:rank
and the object being one of:wikibase:NormalRank
, wikibase:PreferredRank
, wikibase:DeprecatedRank
.
The statement that has the best rank for the property (i.e., preferred if there are any preferred statements in the property, otherwise normal) is also has type of wikibase:BestRank
.
The simple value is represented by the predicate with prefix ps:
and the name of the property (e.g. ps:P2
) and the object being the simple value.
The full value (if required by the type) is represented by the predicate with prefix psv:
(e.g. psv:P2
) and the object being the full value node.
La déclaration a toujours une valeur au plus, mais peut contenir plusieurs qualificatifs et références.
Qualificatifs
The qualifiers are represented by predicates with prefix pq:
and the name of the property (e.g. pq:P2
) and the object being the simple value of the qualifier.
The full value (if required by the type) is represented by the predicate with prefix pqv:
(e.g. pqv:P2
) and the object being the full value node.
Références
References are represented by the predicate prov:wasDerivedFrom
with the object being the reference node (see below).
Exemple de déclaration :
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
ps:P2 wd:Q3 ;
wikibase:rank wikibase:PreferredRank ;
pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime ;
pqv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a,
wdref:d95dde070543a0e0115c8d5061fce6754bb82280 .
Représentation d'une référence
Les références représentent les informations de provenance des déclarations données.
Reference is represented as node, with prefix wdref:
and the local name being the hash derived from the reference contents (e.g. wdref:d95dde070543a0e0115c8d5061fce6754bb82280
).
La valeur précise du hachage n'est pas garantie au-delà du fait que des mêmes références (c.-à-d. avec un contenu identique) généreront un même hachage, et que d'autres références en généreront une autre.
La même référence (c.-à-d. une référence possédant les mêmes propriétés avec les mêmes valeurs) sera en général représentée par un nœud unique, même si des nœuds de référence doublons peuvent exister dans les données.
The type of the node is a wikibase:Reference
.
The reference values are represented the same as statement values, with simple values using predicates with pr:
prefix (e.g. pr:P2
) and full values with prefix prv:
(e.g. prv:P2
) and the object being the full value node.
Contrairement aux déclarations, les références peuvent posséder n'importe quel nombre de valeurs.
Exemple de nœud de référence :
wdref:d95dde070543a0e0115c8d5061fce6754bb82280 a wikibase:Reference ;
pr:P7 "Some data" ;
pr:P8 "1976-01-12T00:00:00Z"^^xsd:dateTime ;
prv:P8 wdv:b74072c03a5ced412a336ff213d69ef1 .
Représentation d'une valeur
Dans le format RDF, les valeurs sont représentées sous deux formes - valeur simple et valeur complète. La valeur simple est toujours un littéral ou un IRI, et sert de valeur directe, ce qui convient aux processus de recherche, d'indexation ou de comparaison. La valeur complète contient des informations supplémentaires sur la valeur, telles que les intervalles, la précision, le calendrier utilisé, etc. Il est à noter que bien que les valeurs simples soient suffisantes pour bon nombre de requêtes, pour d'autres valeurs plus complexes, seules les valeurs complètes répondront au besoin.
If the statement has a value (i.e. is not set to novalue) then the simple value will always be present.
Full values are represented as nodes having prefix wdv:
and the local name being the hash of the value contents (e.g. wdv:382603eaa501e15688076291fc47ae54
).
Il n'y a aucune garantie de valeur d'un hachage hormis le fait que différentes valeurs produiront différents hachages, et qu'une même valeur mentionnée en plusieurs endroits générera le même hachage.
Value node has type wikibase:Value
.
Le contenu du nœud est défini par le type de la valeur (voir ci-dessous).
Exemple de nœud de valeur :
wdv:b74072c03a5ced412a336ff213d69ef1 a wikibase:TimeValue ;
wikibase:timeValue "+1976-01-12T00:00:00Z"^^xsd:dateTime ;
wikibase:timePrecision "11"^^xsd:integer ;
wikibase:timeTimezone "0"^^xsd:integer ;
wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .
La suite décrit la manipulation de chaque sorte de valeur, en fonction du type de la valeur et du type de la propriété. Veuillez noter que tous les aspects du modèle de données ne sont actuellement pas représentés en RDF, certains aspects pour le moment inusités (tels que les unités ou encore les paires avant/après des dates) sont simplement omis car ils n'apportent aucune information utile. Cela pourra évoluer à l'avenir quand ces aspects commenceront à être exploités par Wikidata.
Chaîne
Strings have value type string
and property type string
.
String is represented as a string literal. Strings only have simple value.
Médias de Commons
Media on commons: have value type string
and property type commonsMedia
.
Un média de Commons est représenté par un IRI avec l'URL complète de la ressource Commons, dérivée du nom de fichier Commons de la donnée sous-jacente.
E.g.: <http://commons.wikimedia.org/wiki/Special:FilePath/Universe%20Photo.svg>
.
Il n'a qu'une valeur simple.
URL
URL values have value type string
and property type url
.
URL is represented as a an IRI matching the URL string (e.g. <http://www.wikidata.org/>)
.
Il n'a qu'une valeur simple.
Identifiants externes
External ID values have value type string
and property type external-id
.
Ils sont représentés par une chaîne de caractères littérale.
Il n'a qu'une valeur simple.
Si la propriété possède un formateur d'URI pour RDF configuré (sur Wikidata: formatter URI for RDF resource (P1921)), le RDF aura aussi une valeur normalisée, par ex. :
wd:Q123 wdt:P234 "External-ID" ;
wdtn:P234 <http://external.example.com/reference/External-ID>
Identifiants d'entité Wikibase
Wikibase Entity ID values have value type wikibase-entityid
and property type wikibase-item
.
The entity is represented by its IRI, e.g. wd:Q2
.
Il n'a qu'une valeur simple.
Teste monolingue
Monolingual text values have value type monolingualtext
and property type monolingualtext
.
Le texte est représenté par une chaîne de caractères littérale avec un label de langue. Il n'a qu'une valeur simple.
Coordonnées géographiques
Coordinate text values have value type globecoordinate
and property type globe-coordinate
.
The simple value of the coordinate is the WKT string with the coordinates, with type geo:wktLiteral
, e.g.: "Point(35.3 12.93)"^^geo:wktLiteral
.
The order of the coordinates in WKT is longitude, latitude (since format version 0.0.2).
La valeur complète a les latitude, longitude, et précision en double littéraux, et le globe en IRI.
Exemple :
wdv:a10564107110b2d5739b8fe235cddf73 a wikibase:GlobecoordinateValue ;
wikibase:geoLatitude "12.933333333333"^^xsd:double ;
wikibase:geoLongitude "35.3"^^xsd:double ;
wikibase:geoPrecision "0.000277778"^^xsd:double ;
wikibase:geoGlobe <http://www.wikidata.org/entity/Q2> .
Quantité
Quantity values have value type quantity
and property type quantity
.
La valeur simple de la quantité est le nombre spécifié, en littéral décimal.
The full value includes amount, unit URI (the default for unit-less values being http://www.wikidata.org/entity/Q199), and optionally upper and lower bound. Si aucune limite haute ou basse n'est fournie, l'incertitude de la quantité est indéfinie. Les valeurs exactes sont représentées par des quantités qui ont la même valeur pour le nombre et les limites haute et basse.
Exemple :
wdv:cb213eea7a0b90d1d7f65c6eabfab9da a wikibase:QuantityValue ;
wikibase:quantityAmount "+123"^^xsd:decimal ;
wikibase:quantityUpperBound "+124"^^xsd:decimal ;
wikibase:quantityLowerBound "+122"^^xsd:decimal ;
wikibase:quantityUnit <http://www.wikimedia.org/entity/Q199> .
Temps
Time values have value type time
and property type time
.
The simple value of the time value is either datetime value of type xsd:dateTime
, if the value can be converted to Gregorian date in ISO format, or a string as represented in the database, if not.
The xsd:dateTime
dates follow XSD 1.1 standard, which uses the proleptic Gregorian calendar, and represents the year 1 BCE as +0000.
This is in contrast the JSON representation of Julian and Gregorian dates, which follows the traditional year numbering, representing the year 1 BCE as -0001.
The full value includes the simple value above under wikibase:timeValue
, precision and timezone as integers and calendar model as IRI.
Note that the calendar model is the original values calendar model even if wikibase:timeValue
was converted to Gregorian.
Exemple :
wdv:85374678f22bda99efb44a5617d76e51 a wikibase:Time ;
wikibase:timeValue "+1948-04-12T00:00:00Z"^^xsd:dateTime ;
wikibase:timePrecision "11"^^xsd:integer ;
wikibase:timeTimezone "0"^^xsd:integer ;
wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .
Valeurs normalisées
Certaines valeurs peuvent se représenter sous plusieurs formes, en fonction de l'usage. Par exemple, la longueur peut s'exprimer en différentes unités - pieds, pouces, mètres, miles, etc. Afin de fournir un moyen d'unifier ces formes et ainsi de faciliter l'accès à la donnée par des processus automatisés, les valeurs normalisées ont été introduites, pour représenter des données diverses d'une manière unifiée.
À l'heure actuelle, la seule normalisation de valeur supportée est la conversion des unités de quantités vers leur unité de base - ex. longueur en mètres. À l'avenir, davantage d'unités et de normalisations pourront être ajoutées, ce qui sera documenté ici. The conversion table is available on the Mediawiki gerrit if needed.
Les seules valeurs simples normalisées sont les identifiants externes (voir ci-dessous).
Quantité normalisée
Les valeurs de quantité normalisées sont des nœuds de valeur, parallèles au nœuds de données originaux mais représentés dans les unités de base.
They are connected to their parent nodes by predicates with prefix having "v" replaced with "n" - i.e. psn:
, prn:
and pqn:
, for example:
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
ps:P8 "123"^^xsd:decimal ;
psv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
psn:P8 wdv:85374998f22bda54efb44a5617d76e51 .
Original quantity value is connected to the normalised value by wikibase:quantityNormalized
predicate:
wdv:382603eaa501e15688076291fc47ae54 a wikibase:QuantityValue ;
wikibase:quantityAmount "+123"^^xsd:decimal ;
wikibase:quantityUpperBound "+124"^^xsd:decimal ;
wikibase:quantityLowerBound "+122"^^xsd:decimal ;
wikibase:quantityUnit <http://www.wikidata.org/entity/Q218593> ;
wikibase:quantityNormalized wdv:85374998f22bda54efb44a5617d76e51.
The normalised value has wikibase:quantityNormalized
pointing to itself.
If the value is already normalised - i.e. is expressed in base units - then both "v" and "n" predicates point to the same value, and wikibase:quantityNormalized
for this value points to itself.
Quantities with no units or with units that are not normalisable (have no base unit they can be reduced to) do not have normalised predicates and normalised values and do not include wikibase:quantityNormalized
.
On recommande de ne pas avoir plus d'une unité de base par propriété. Les unités de base dépendent de la configuration de Wikibase et sont habituellement choisies pour représenter des unités standardisées universellement acceptées, telles que les unités du S.I.
Identifiant externe normalisé
Pour les identifiants externes, la normalisation convertit la valeur de la chaîne en URL, si le formateur d'URL à cette fin est défini dans les données de propriété (via la définition canonicalUriProperty
), alors la valeur normalisée sera répertoriée comme valeur wdtn:
pour les valeurs vraies, et comme valeur normalisée pour les déclarations dans les prédicats psn:
, prn:
et pqn:
selon le contexte dans lequel la valeur apparaît.
Valeurs spéciales
Le modèle de données de Wikibase a deux type spéciaux de snaks - PropertySomeValueSnak qui indique une valeur existante mais dont l'identité ou la valeur est inconnue, et PropertyNoValueSnak qui indique qu'une valeur n'existe pas.
Somevalue
Une valeur inconnue est représentée par un nœud RDF blanc pour les deux déclarations, simplifiée et complète :
wd:Q3 a wikibase:Item, wdt:P2 _:genid1 .
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c a wikibase:Statement ;
ps:P2 _:genid2 ;
wikibase:rank wikibase:NormalRank .
Novalue
Novalue is represented not by a regular value but as a class of the entity or statement or reference, with prefix wdno:
and the name of the property.
Exemple :
wd:Q3 a wikibase:Item, wdno:P7 .
wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb777c a wikibase:Statement, wdno:P7 ;
wikibase:rank wikibase:NormalRank .
L'entité a une classe wdno:
si elle possède une déclaration de quasi vérité novalue pour cette propriété.
Novalue dans la partie principale ou dans les qualifieurs d'une déclaration correspond à une classe wdno:
du noeud de la déclaration, et novalue pour une référence correspond à une classe wdno:
sur le noeud de la référence.
Les classes pour wdno:
sont définies comme suit :
wdno:P2 a owl:Class ;
owl:complementOf _:genid1 .
_:genid1 a owl:Restriction ;
owl:onProperty wdt:P2 ;
owl:someValuesFrom owl:Thing .
Liens de sites
Les liens sont représentés par un ensemble de prédicats décrivant le lien URL.
The type of the node is schema:Article
and it linked with the entity via schema:about
predicate.
Badges are described with wikibase:badge
predicates.
schema:name
predicate holds the plain-text name of the article, in the language of the linked wiki.
Exemple :
<https://en.wikipedia.org/wiki/Duck> a schema:Article ;
schema:about wd:Q3 ;
schema:inLanguage "en" ;
schema:isPartOf <https://en.wikipedia.org/> ;
schema:name "Duck"@en ;
wikibase:badge wd:Q5 .
<https://en.wikipedia.org/> wikibase:wikiGroup "wikipedia" .
L'URL du sujet est composée du préfixe de langue du site, et du nom de l'article, encodé en URL selon la RFC 3986, par ex. :
<https://ru.wikipedia.org/wiki/%D0%A3%D1%82%D0%BA%D0%B0>
En particulier, l'encodage utilisé fonctionne comme suit :
- Normalisation du titre en remplaçant chaque espaces par un caractère de soulignement (
_
). - Application de la fonction wfUrlencode(), qui encode avec des % tous les caractères non-alphanumériques sauf "
;:@$!*(),/-_~
".
Redirections
Redirected entities are implemented as owl:sameAs
predicates, for example if Q6 redirects to Q1, the dump would be:
wd:Q6 owl:sameAs wd:Q1 .
Préfixes utilisés
Les préfixes sont utilisés dans les formats RDF pour permettre les préfixes courts (comme Turtle et RDF). Pour les autres formats, l'URL complète est utilisée.
Toutes les URL préfixées qui ne contiennent pas de nom d'hôte sont préfixées par le nom d'hôte du wiki les ayant générées. Toutes les URL préfixées qui contiennent un nom d'hôte sont fixes et ne dépendent pas du wiki les ayant générées.
Préfixe | URL complète | Utilisation | Exemple |
---|---|---|---|
wikibase: | http://wikiba.se/ontology# | Ontologie Wikibase | wd:Q2 a wikibase:Item
|
Nœuds | |||
wdata: | /Special:EntityData/ | Ensemble de données décrivant une entité donnée | wdata:Q2 schema:about wd:Q2 .
|
wd: | /entity/ | Entité Wikibase - item ou propriété. | wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6a
|
wds: | /entity/statement/ | Nœud de déclaration, décrit une allégation à propos d'une entité. | wds:Q2-a4078553-4ec1-a64a-79e7-c5b5e17b2782
a wikibase:Statement
|
wdv: | /value/ | Nœud de valeur | wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Value
|
wdref: | /reference/ | Nœud de réference | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a .
wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Reference .
|
Prédicats | |||
wdt: | /prop/direct/ | Quasi-vérités sur la donnée, associe une entité directement à une valeur. | wd:Q2 wdt:P9 <http://acme.com/>
|
wdtn: | /prop/direct-normalized/ | Quasi-vérités sur la donnée, associe une entité directement à une valeur normalisée. | wd:Q2 wdtn:P9 <http://acme.com/ABCDE>
|
p: | /prop/ | Associe une entité à une déclaration | wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6awd
|
wdno: | /prop/novalue/ | Class to use when the entity has novalue for this property. | wd:Q2 a wdno:P9 .
|
ps: | /prop/statement/ | Associe une valeur à une déclaration | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ps:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
|
psv: | /prop/statement/value/ | Associe une valeur en profondeur à une déclaration | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
psn: | /prop/statement/value-normalized/ | Associe une valeur normalisée à un nœud de déclaration | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
pq: | /prop/qualifier/ | Associe un qualificatif à un nœud de déclaration | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
|
pqv: | /prop/qualifier/value/ | Associe une valeur de qualificatif en profondeur à un nœud de déclaration | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
pqn: | /prop/qualifier/value-normalized/ | Associe une valeur de qualificatif normalisé à un nœud de déclaration | wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
pr: | /prop/reference/ | Associe une référence à une valeur | wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a pr:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
|
prv: | /prop/reference/value/ | Associe une référence à une valeur en profondeur | wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
prn: | /prop/reference/value-normalized/ | Associe une référence à une valeur normalisée | wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
|
Standard prefixes used:
Préfixe | URL complète |
---|---|
rdf: | http://www.w3.org/1999/02/22-rdf-syntax-ns# |
rdfs: | http://www.w3.org/2000/01/rdf-schema# |
xsd: | http://www.w3.org/2001/XMLSchema# |
owl: | http://www.w3.org/2002/07/owl# |
skos: | http://www.w3.org/2004/02/skos/core# |
schema: | http://schema.org/ |
prov: | http://www.w3.org/ns/prov# |
geo: | http://www.opengis.net/ont/geosparql# |
Liste complète des préfixes
Cette liste peut servir aux requêtes SPARQL :
PREFIX bd: <http://www.bigdata.com/rdf#>
PREFIX cc: <http://creativecommons.org/ns#>
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX geo: <http://www.opengis.net/ont/geosparql#>
PREFIX hint: <http://www.bigdata.com/queryHints#>
PREFIX ontolex: <http://www.w3.org/ns/lemon/ontolex#>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX prov: <http://www.w3.org/ns/prov#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX schema: <http://schema.org/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
PREFIX p: <http://www.wikidata.org/prop/>
PREFIX pq: <http://www.wikidata.org/prop/qualifier/>
PREFIX pqn: <http://www.wikidata.org/prop/qualifier/value-normalized/>
PREFIX pqv: <http://www.wikidata.org/prop/qualifier/value/>
PREFIX pr: <http://www.wikidata.org/prop/reference/>
PREFIX prn: <http://www.wikidata.org/prop/reference/value-normalized/>
PREFIX prv: <http://www.wikidata.org/prop/reference/value/>
PREFIX psv: <http://www.wikidata.org/prop/statement/value/>
PREFIX ps: <http://www.wikidata.org/prop/statement/>
PREFIX psn: <http://www.wikidata.org/prop/statement/value-normalized/>
PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdata: <http://www.wikidata.org/wiki/Special:EntityData/>
PREFIX wdno: <http://www.wikidata.org/prop/novalue/>
PREFIX wdref: <http://www.wikidata.org/reference/>
PREFIX wds: <http://www.wikidata.org/entity/statement/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
PREFIX wdtn: <http://www.wikidata.org/prop/direct-normalized/>
PREFIX wdv: <http://www.wikidata.org/value/>
PREFIX wikibase: <http://wikiba.se/ontology#>
Ontologie
Voici la liste compilée de tous les objets et des prédicats internes au format. Pour la signification des préfixes, allez à la liste des préfixes.
Objets
Désignation | Utilisation | Contexte |
---|---|---|
wikibase:Item | Item Wikibase | Type for wd:Q123 describing item |
wikibase:Property | Propriété Wikibase | Type for wd:P123 describing property |
wikibase:Lexeme | Wikibase lexeme | Type for wd:L123 describing lexeme |
wikibase:Form | forme d'un lexème Wikibase | Type for wd:L123-F1 describing form |
wikibase:Sense | sens d'un lexème Wikibase | Type for wd:L123-S1 describing sense |
wikibase:Statement | Déclaration sur une entité | Type for wds:1234 describing statement |
wikibase:Reference | Nœud de référence | Type for wdref:1234 describing reference |
wikibase:TimeValue | Nœud de valeur représentant une valeur temporelle | Type for wdv:1234 describing time value |
wikibase:QuantityValue | Nœud de valeur représentant une valeur de quantité | Type for wdv:1234 describing quantity value |
wikibase:GlobecoordinateValue | Nœud de valeur représentant la valeur de coordonnées | Type for wdv:1234 describing coordinate value |
wikibase:Dump | Nœud décrivant l'ensemble de données de vidage | Utilisé dans l'entête du vidage pour décrire des métadonnées sur le vidage entier |
wikibase:PreferredRank | Représente un rang préféré pour la déclaration | Used as object of wikibase:rank |
wikibase:NormalRank | Représente un rang normal pour la déclaration | Used as object of wikibase:rank |
wikibase:DeprecatedRank | Représente un rang obsolète pour la déclaration | Used as object of wikibase:rank |
wikibase:BestRank | Représente une déclaration qui a le meilleur rang pour la propriété - c.-à-d. candidat à une inclusion en tant que quasi-vérité | Used as type of wikibase:Statement |
wikibase:WikibaseItem | Type de référence d'une entité | Used as object of wikibase:propertyType |
wikibase:CommonsMedia | Type de référence de média Commons | Used as object of wikibase:propertyType |
wikibase:GlobeCoordinate | Type de géo-coordonnées | Used as object of wikibase:propertyType |
wikibase:Monolingualtext | Valeur de texte monolingue | Used as object of wikibase:propertyType |
wikibase:Quantity | Type de quantité | Used as object of wikibase:propertyType |
wikibase:String | Valeur chaîne de caractères | Used as object of wikibase:propertyType |
wikibase:Time | Valeur temporelle | Used as object of wikibase:propertyType |
wikibase:Url | Type de référence d'URL | Used as object of wikibase:propertyType |
Prédicats
Les noms en italique signifient que tout nom de propriété peut remplacer le nom de l'exemple P123.
Désignation | Utilisation | Domaine | Intervalle |
---|---|---|---|
wdt:P123 | Associe une entité à une valeur de quasi-vérité | wikibase:Item|wikibase:Property | Valeur simple |
wdtn:P123 | Associe une entité à une valeur normalisée de quasi-vérité | wikibase:Item|wikibase:Property | Valeur simple |
p:P123 | Associe une entité à une déclaration | wikibase:Item|wikibase:Property | wikibase:Statement |
ps:P123 | Associe une déclaration à une valeur simple | wikibase:Statement | Valeur simple |
pr:P123 | Associe une référence à une valeur simple | wikibase:Reference | Valeur simple |
pq:P123 | Link statement to qualifier value | wikibase:Statement | Valeur simple |
psv:P123 | Associe une déclaration à un nœud de valeur | wikibase:Statement | wikibase:Value |
psn:P123 | Associe une déclaration à un nœud de valeur normalisée | wikibase:Statement | wikibase:Value |
prv:P123 | Associe une référence à un nœud de valeur | wikibase:Reference | wikibase:Value |
prn:P123 | Associe une référence à un nœud de valeur normalisée | wikibase:Reference | wikibase:Value |
pqv:P123 | Associe une déclaration à un nœud de valeur de qualificatif | wikibase:Statement | wikibase:Value |
pqn:P123 | Associe une déclaration à un nœud de valeur normalisée de qualificatif | wikibase:Statement | wikibase:Value |
wikibase:rank | Indique le rang de la déclaration | wikibase:Statement | Un des objets de rang ci-dessus |
wikibase:badge | Badge attaché à un lien de site | schema:Article | wikibase:Item - URL du badge |
wikibase:propertyType | Type de propriété de la propriété de l'entité | wikibase:Property | Un des objets Type de propriété ci-dessus |
wikibase:directClaim | Associe une entité de propriété à un prédicat d'allégation directe | wikibase:Property | wdt:P123 |
wikibase:directClaimNormalized | Associe une entité de propriété à un prédicat d'allégation directe normalisée | wikibase:Property | wdtn:P123 |
wikibase:claim | Associe une entité de propriété à un prédicat d'allégation/de déclaration | wikibase:Property | p:P123 |
wikibase:statementProperty | Associe une entité de propriété à un prédicat de valeur simple de déclaration | wikibase:Property | ps:P123 |
wikibase:statementValue | Associe une entité de propriété à un prédicat de valeur complète de déclaration | wikibase:Property | psv:P123 |
wikibase:statementValueNormalized | Associe une entité de propriété à un prédicat de valeur normalisée de déclaration | wikibase:Property | psn:P123 |
wikibase:qualifier | Associe une entité de propriété à un prédicat de valeur simple de qualificatif | wikibase:Property | pq:P123 |
wikibase:qualifierValue | Associe une entité de propriété à un prédicat de valeur complète de qualificatif | wikibase:Property | pqv:P123 |
wikibase:qualifierValueNormalized | Associe une entité de propriété à un prédicat de valeur normalisée de qualificatif | wikibase:Property | pqn:P123 |
wikibase:reference | Associe une entité de propriété à un prédicat de valeur simple de référence | wikibase:Property | pr:P123 |
wikibase:referenceValue | Associe une entité de propriété à un prédicat de valeur complète de référence | wikibase:Property | prv:P123 |
wikibase:referenceValueNormalized | Associe une entité de propriété à un prédicat de valeur normalisée de référence | wikibase:Property | prn:P123 |
wikibase:hasViolationForConstraint | Associe la déclaration transgressant une contrainte à la déclaration de cette contrainte | wikibase:Statement | wikibase:Statement |
wikibase:lemma | Associe un lexème Wikibase avec le texte du lemme | wikibase:Lexeme | Simple string value |
wikibase:lexicalCategory | Associe un lexème Wikibase avec son item de catégorie lexicale | wikibase:Lexeme | wikibase:Item |
wikibase:grammaticalFeature | Associe une forme de lexème Wikibase avec ses caractéristiques grammaticales | wikibase:Form/ontolex:Form | wikibase:Item |
Les prédicats suivants sont utilisés en valeur en profondeur pour les valeurs de types spéciaux.
All these predicates have the domain of wikibase:Value
and the range depending on type below.
Prédicats pour les Géo-Coordonnées
Désignation | Type | Signification |
---|---|---|
wikibase:geoLatitude | xsd:double | Latitude, composant des coordonnées |
wikibase:geoLongitude | xsd:double | Longitude, composant des coordonnées |
wikibase:geoPrecision | xsd:double | Précision des coordonnées |
wikibase:geoGlobe | IRI | The URL of the globe, e.g. http://www.wikidata.org/entity/Q2 (Earth) |
Prédicats pour une Quantité
Désignation | Type | Signification |
---|---|---|
wikibase:quantityAmount | xsd:decimal | Le nombre spécifié |
wikibase:quantityUpperBound | xsd:decimal | La limite supérieure de l'intervalle de valeurs |
wikibase:quantityLowerBound | xsd:decimal | La limite inférieure de l'intervalle de valeurs |
wikibase:quantityUnit | IRI | The unit of measurement, for unit-less quantities is http://www.wikidata.org/entity/Q199 (i.e. "1") |
wikibase:quantityNormalized | IRI | Désigne la valeur normalisée, si elle existe. |
Prédicats pour le Temps
Désignation | Type | Signification |
---|---|---|
wikibase:timeValue | xsd:dateTime|string | Temps grégorien ou chaîne de caractères si la valeur ne peut pas être représentée en temps grégorien |
wikibase:timePrecision | xsd:integer | Time precision constant |
wikibase:timeTimezone | xsd:integer | Décalage horaire par rapport à l'heure UTC en minutes |
wikibase:timeCalendarModel | IRI | URL of the calendar used, e.g. http://www.wikidata.org/entity/Q1985727 (Gregorian) |
Différences avec les données WDQS
The Wikidata query service has the data in the format described above, but there are small differences that can be important while writing SPARQL queries:
- Types (
a
orrdf:type
) forwikibase:Item
,wikibase:Statement
,wikibase:Reference
,wikibase:Lexeme
,wikibase:Form
,wikibase:Sense
are currently omitted for performance reasons.- To filter for items, you can use
wikibase:sitelinks []
instead ofa wikibase:Item
(only items have a number of sitelinks). - To filter for statements, you can use
wikibase:rank []
instead ofa wikibase:Statement
(only statements have a rank). - To filter for references, you can use
[] prov:wasDerivedFrom ?reference
instead of?reference a wikibase:Reference
, but note that this may return a reference more than once. (Usually, you’ll get references viaprov:wasDerivedFrom
from a statement anyway.) - To filter for senses, you can use
ontolex:LexicalSense
instead ofwikibase:Sense
. - To filter for forms, you can use
ontolex:Form
instead ofwikibase:Form
.
- To filter for items, you can use
- Data nodes (
wdata:Q2
) are not stored, all the information like version, revision and page props is stored in the entity node (wd:Q2
) instead. This is done for performance reasons. - For labels, only
rdfs:label
is stored but notschema:name
orskos:prefLabel
. Since they all have the same data, storing all three is redundant. - Redirects are recorded but currently have no additional semantics implemented.
- WDQS now uses local IRIs (Skolem IRIs) instead of blank nodes to represent somevalue. These can be tested with
FILTER wikibase:isSomeValue(?node)
rather thanFILTER isBlank(?node)
See also SPARQL query examples for how to query the data using WDQS service.