Jump to content

Wikibase/Indexation/Format RDF Dump

From mediawiki.org
This page is a translated version of the page Wikibase/Indexing/RDF Dump Format and the translation is 69% complete.
Outdated translations are marked like this.


Les changements de représentation RDF sont assujettis à la Politique d'interface stable

Cette page décrit le format RDF dump et le format d'exportation RDF généré par Wikidata et utilisé dans un but d'extraction et d'indexation. Veuillez noter que bien que proche du format utilisé par Wikidata Toolkit , ce n'est ni le même code ni le même format. Même si nous nous efforçons de minimiser les divergences, il peut rester des différences et vous ne devez utiliser que la documentation du format effectivement utilisé.

Ce document décrit le vidage RDF tel qu'il peut être téléchargé depuis la source de vidage Wikimedia, et bien qu'on puisse l'utiliser pour créer des requêtes pour le Service de requête de Wikidata, le service peut avoir des petites différences quant à la représentation des données. Consultez le chapitre des différences de données WQDS pour la liste complète.

L'URI canonique de l'ontologie RDF de la Wikibase est http://wikiba.se/ontology. La version actuelle se trouve à http://wikiba.se/ontology-1.0.owl.

Les changements de représentation RDF sont assujettis à la Politique d'interface stable.

Modèle de données

Les données servant à la description d'un seul item

Le format RDF correspond au modèle de données Wikibase et en est un format d'exportation. Cela signifie en particulier que si le modèle de données change, le format d'exportation s'adaptera en conséquence. Ce document reflétera de tels changements. La description suivante présuppose une certaine familiarité avec le modèle de données et la terminologie employée.

Cette correspondance RDF repose sur celle conçue pour la Boîte à outils Wikidata de Denny Vrandecic et Markus Krötzsch disponible ici : https://web.archive.org/web/20190313052004/http://korrekt.org/papers/Wikidata-RDF-export-2014.pdf.

La description ci-dessous se sert de préfixes pour décrire les IRI des ressources RDF mentionnées. Allez à la section Préfixes pour une description complète. Tous les exemples ci-dessous sont exprimés en syntaxe Turtle.

Versions

La version du modèle de données est spécifiée par le prédicat schema:softwareVersion du nœud schema:Dataset, qui est soit un nœud de vidage pour un dump, soit un nœud de données d'entité (wdata:) pour une page d'entité individuelle.

Versions diffusées :

Version Description
0.0.1 Version initiale.
0.0.2 Changed WKT coordinate order (T130049)
0.0.3 Added page props option to wdata: (T129046)
0.0.4 Added unit conversion & normalisation support (T117031)
0.0.5 Ajout des quantités sans limite. (T115269)
0.1.0 Changed link encoding (T131960)
1.0.0 Removed -beta from the ontology prefix (T112127). La représentation RDF est désormais considérée stable.

Entête

For the RDF dump, there is the header node wikibase:Dump containing information about the license, the software version of the generator and the date the data was produced. En cas d'exportation d'entité individuelle, ces données sont associées au nœud d'entité (voir ci-dessous).

Exemple d'entête :

 wikibase:Dump a schema:Dataset ;
     cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
     schema:softwareVersion "1.0.1" ;
     schema:dateModified "2015-03-21T06:03:55Z"^^xsd:dateTime .
  • cc:license - précise l'IRI de la licence qui s'applique à tout le document RDF.
  • schema:softwareVersion - specifies which version of the dump format is being used (currently 1.0.0), will be updated when format changes, once the format is out of the beta period. The version updates will be done along the lines of semantic versioning, with major changes being BC breaking ones, minor being major BC-compatible changes and patch part changes on minor tweaks.
  • schema:dateModified - indique la date de validité des données du vidage. Certaines données contenues dans un vidage peuvent être plus récentes que cette date, mais on est assuré qu'il n'y a aucune donnée dans ce vidage plus ancienne que cette date. La date devrait être proche de celle de la plus ancienne donnée contenue dans le vidage, mais pour des raisons techniques elle peut être légèrement différente de celle-ci.

Représentation d'une entité

L'entité est décrite par deux nœuds - le nœud de données et le nœud d'entité. For entity Q1, data node is wdata:Q1 and entity node is wd:Q1.

Le nœud de données expose les métadonnées de l'enregistrement de l'entité dans Wikibase - c'est à dire les données qui ne font pas partie des informations de l'entité elle-même mais qui décrivent l'état de l'entité dans la Wikibase. It has type of schema:Dataset and contains the following metadata:

  • Information about the entity revision (schema:version) – this is a counter that increases with each modification of the entity data
  • Last modification time of the entity data (schema:dateModified) – as an xsd:dateTime timestamp
  • Link to the entity node with schema:about predicate

Exemple :

 wdata:Q2 schema:version "59"^^xsd:integer ;
     schema:dateModified "2015-03-18T22:38:36Z"^^xsd:dateTime ;
     a schema:Dataset ;
     schema:about wd:Q2 .

Entity node describes the actual entity data and has type wikibase:Item or wikibase:Property depending on the kind of entity. D'autres types d'entités pourront être introduits dans le futur.

La description d'une entité comporte les éléments suivants :

  • Étiquettes d'entités - nom principal de l'entité. Les étiquettes sont définies par les prédiats comme schema:name, rdfs:label et skos:prefLabel avec des objets qui sont littéraux de chaîne étiquetés par langage.
  • Alias d'entités - noms secondaires de l'entité. Les alias sont définis comme des prédicats skos:altLabel avec des objets marqués avec la chaîne de caractères de la langue.
  • Description de l'entité - description plus longue de l'entité. Défini comme des prédicats schema:description avec des objets qui sont des littéraux de chaîne marquées par la langue.
  • Déclarations de quasi vérité (voir ci-dessous)
  • Prédicats le reliant aux déclarations complètes

Exemple d'une définition d'entité :

 wd:Q3 a wikibase:Item ;
     rdfs:label "The Universe"@en ;
     skos:prefLabel "The Universe"@en ;
     schema:name "The Universe"@en ;
     schema:description "The Universe is big"@en ;
     skos:altLabel "everything"@en ;
     wdt:P2 wd:Q3 ;
     wdt:P7 "value1", "value2" ;
     p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
     p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37,
          wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c .

Propriétés de Page

Un nœud d'entité peut aussi avoir des informations supplémentaires concernant l'entité, telles que le nombre de liens ou de déclarations.

The data is sourced from page properties and can be specified in config file. Par exemple :

 wdata:Q42 a schema:Dataset ;
 	schema:about wd:Q42 ;
 	wikibase:statements "275"^^xsd:integer ;
    wikibase:identifiers "206"^^xsd:integer ;
 	wikibase:sitelinks "116"^^xsd:integer .

wikibase:statements specifies how many statements this entity has, wikibase:identifiers specifiers the number of statements with External Id values , and wikibase:sitelinks specifies the number of sitelinks . Des déclarations supplémentaires pourront être introduites dans le futur.

Items

Entities that represent items have the common entity data as described above, plus can have sitelinks attached to them, as described below.

Propriétés

Entities that represent properties additionally feature the property type using wikibase:propertyType predicate. The object of the predicate is the property type described in Value representation below, with wikibase: prefix and each word capitalised, with no separators. I.e., wikibase-item becomes wikibase:WikibaseItem.

Each property is also linked to the predicates that are derived from it. Exemple :

 wd:P22 a wikibase:Property ;
     rdfs:label "Item property"@en ;
     wikibase:propertyType wikibase:WikibaseItem ;
     wikibase:directClaim wdt:P22 ;
     wikibase:claim p:P22 ;
     wikibase:statementProperty ps:P22 ;
     wikibase:statementValue psv:P22 ;
     wikibase:qualifier pq:P22 ;
     wikibase:qualifierValue pqv:P22 ;
     wikibase:reference pr:P22 ;
     wikibase:referenceValue prv:P22 ;
     wikibase:novalue wdno:P22 .

Les prédicats des propriétés ont aussi des définitions de type :

 prv:P22 a owl:ObjectProperty .
 wdt:P22 a owl:DatatypeProperty .

The type depends on the type of the original property - whether its value is literal (DatatypeProperty) or IRI (ObjectProperty). However, p:, psv: , pqv: and prv: predicates would always be owl:ObjectProperty.

Note that wdno:P22 mentioned above is not a predicate, unlike others, but a class. See the full description of it in Novalue section.

Lexèmes

Please see full description at Lexeme RDF mapping .

Lexemes are represented according to Lexeme RDF mapping . Exemple :

wd:L64723 a ontolex:LexicalEntry ;
     # lemme
     wikibase:lemma "hard"@en ;

     # langue
     dct:language wd:Q1860 ;

     # catégorie lexicale
     wikibase:lexicalCategory wd:Q34698 ;

     # déclarations
     wdt:P2 wd:Q3 ;
     wdt:P7 "value1" , "value2" ;
     p:P2 wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7 ;
     p:P7 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ,
          wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c ;

     # formes
     ontolex:lexicalForm wd:L64723-F1 ;

     # sens
     ontolex:sense wd:L64723-S1 .

MediaInfo

Please see full description at MediaInfo RDF mapping .

MediaInfo entities are represented according to MediaInfo RDF mapping . Exemple :

@prefix sdc: <https://commons.wikimedia.org/entity/> .
@prefix sdcdata: <https://commons.wikimedia.org/wiki/Special:EntityData/> .
@prefix sdcs: <https://commons.wikimedia.org/entity/statement/> .
@prefix sdcref: <https://commons.wikimedia.org/reference/> .
@prefix sdcv: <https://commons.wikimedia.org/value/> .

sdcdata:M6661797 a schema:Dataset ;
	schema:about sdc:M6661797 ;
	cc:license <http://creativecommons.org/publicdomain/zero/1.0/> ;
	schema:softwareVersion "1.0.0" ;
	schema:version "407884644"^^xsd:integer ;
	schema:dateModified "2020-03-29T15:25:01Z"^^xsd:dateTime .

sdc:M6661797 a wikibase:Mediainfo,
		schema:MediaObject,
		schema:ImageObject ;
	schema:encodingFormat "image/jpeg" ;
	schema:contentUrl <https://upload.wikimedia.org/wikipedia/commons/6/64/Douglas_adams_portrait.jpg> ;
	schema:contentSize "38890"^^xsd:integer ;
	schema:height "386"^^xsd:integer ;
	schema:width "600"^^xsd:integer ;
	schema:caption "Photo de Douglas Adams."@fr ;
	rdfs:label "Photo de Douglas Adams."@fr ;
	schema:caption "Douglas Adams' portrait"@en ;
	rdfs:label "Douglas Adams' portrait"@en ;
	schema:caption "Foto di Douglas Adams"@it ;
	rdfs:label "Foto di Douglas Adams"@it ;
	wdt:P180 wd:Q42 ;
	p:P180 sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec .

sdcs:M6661797-25026d3f-444c-1915-1d5b-c29dbad8cbec a wikibase:Statement,
		wikibase:BestRank ;
	wikibase:rank wikibase:PreferredRank ;
	ps:P180 wd:Q42 .

Cet exemple montre les données MediaInfo sur Wikimedia Commons lorsqu'elles sont fédérées avec Wikidata.

Types de déclaration

Le format RDF représente les déclarations sous deux formes - quasi-vérités et déclarations exhaustives.

Quasi-vérités

Les quasi-vérités sont des déclarations qui ont le rang non-obsolète le plus élevé pour une propriété donnée.

En effet, si une déclaration préférée est faite pour la propriété P2, seule la déclaration préférée pour P2 sera considérée comme vraie.

Dans le cas contraire, toutes les déclarations de rang normal pour P2 sont considérées comme vraies.

Les prédicats de quasi vérité ont pour préfixe wdt: avec le nom de la propriété (par exemple wdt:P2) et l'objet est la valeur simple (voir ci-dessous) de la déclaration.

Les qualificatifs sont ignorés.

Si la valeur possède une simple normalisation de valeur (actuellement valable uniquement pour l'ID externe), la valeur normalisée est répertoriée sous le préfixe wdtn:, par exemple wdtn:P2.

Déclarations exhaustives

Les déclarations exhaustives représentent toutes les données sur la déclaration dans le système. Full statement is represented as separate node, with prefix wds: with the id of the statement (e.g. wds:Q3-4cc1f2d1-490e-c9c7-4560-46c3cce05bb7).

Il n'y a aucun format garanti ou signification quant à l'identifiant de la déclaration.

The statements are linked to the entity with the predicate with prefix p: and the name of the property (e.g. p:P2).

Représentation d'une déclaration

Avertissement Avertissement : Il est possible qu'une déclaration fasse référence à une propriété ou un item qui n'existe plus. Par conséquent vous ne devriez pas supposer que les prédicats et les objets sont toujours définis.

Le nœud de déclaration représente une déclaration individuelle à propos d'une entité. It has type wikibase:Statement. La déclaration peut contenir le rang, la valeur simple (voir ci-dessous) de la déclaration, le lien vers la valeur complète, les qualificatifs et les références.

The statement rank is represented by the predicate wikibase:rank and the object being one of:wikibase:NormalRank , wikibase:PreferredRank, wikibase:DeprecatedRank.

The statement that has the best rank for the property (i.e., preferred if there are any preferred statements in the property, otherwise normal) is also has type of wikibase:BestRank.

The simple value is represented by the predicate with prefix ps: and the name of the property (e.g. ps:P2) and the object being the simple value.

The full value (if required by the type) is represented by the predicate with prefix psv: (e.g. psv:P2) and the object being the full value node.

La déclaration a toujours une valeur au plus, mais peut contenir plusieurs qualificatifs et références.

Qualificatifs

The qualifiers are represented by predicates with prefix pq: and the name of the property (e.g. pq:P2) and the object being the simple value of the qualifier.

The full value (if required by the type) is represented by the predicate with prefix pqv: (e.g. pqv:P2) and the object being the full value node.

Références

References are represented by the predicate prov:wasDerivedFrom with the object being the reference node (see below).

Exemple de déclaration :

 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
     ps:P2 wd:Q3 ;
     wikibase:rank wikibase:PreferredRank ;
     pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime ;
     pqv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
     prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a,   
         wdref:d95dde070543a0e0115c8d5061fce6754bb82280 .

Représentation d'une référence

Les références représentent les informations de provenance des déclarations données.

Reference is represented as node, with prefix wdref: and the local name being the hash derived from the reference contents (e.g. wdref:d95dde070543a0e0115c8d5061fce6754bb82280). La valeur précise du hachage n'est pas garantie au-delà du fait que des mêmes références (c.-à-d. avec un contenu identique) généreront un même hachage, et que d'autres références en généreront une autre. La même référence (c.-à-d. une référence possédant les mêmes propriétés avec les mêmes valeurs) sera en général représentée par un nœud unique, même si des nœuds de référence doublons peuvent exister dans les données.

The type of the node is a wikibase:Reference.

The reference values are represented the same as statement values, with simple values using predicates with pr: prefix (e.g. pr:P2) and full values with prefix prv: (e.g. prv:P2) and the object being the full value node. Contrairement aux déclarations, les références peuvent posséder n'importe quel nombre de valeurs.

Exemple de nœud de référence :

 wdref:d95dde070543a0e0115c8d5061fce6754bb82280 a wikibase:Reference ;
     pr:P7 "Some data" ;
     pr:P8 "1976-01-12T00:00:00Z"^^xsd:dateTime ;
     prv:P8 wdv:b74072c03a5ced412a336ff213d69ef1 .

Représentation d'une valeur

Dans le format RDF, les valeurs sont représentées sous deux formes - valeur simple et valeur complète. La valeur simple est toujours un littéral ou un IRI, et sert de valeur directe, ce qui convient aux processus de recherche, d'indexation ou de comparaison. La valeur complète contient des informations supplémentaires sur la valeur, telles que les intervalles, la précision, le calendrier utilisé, etc. Il est à noter que bien que les valeurs simples soient suffisantes pour bon nombre de requêtes, pour d'autres valeurs plus complexes, seules les valeurs complètes répondront au besoin.

If the statement has a value (i.e. is not set to novalue) then the simple value will always be present.

Full values are represented as nodes having prefix wdv: and the local name being the hash of the value contents (e.g. wdv:382603eaa501e15688076291fc47ae54). Il n'y a aucune garantie de valeur d'un hachage hormis le fait que différentes valeurs produiront différents hachages, et qu'une même valeur mentionnée en plusieurs endroits générera le même hachage. Value node has type wikibase:Value. Le contenu du nœud est défini par le type de la valeur (voir ci-dessous).

Exemple de nœud de valeur :

 wdv:b74072c03a5ced412a336ff213d69ef1 a wikibase:TimeValue ;
     wikibase:timeValue "+1976-01-12T00:00:00Z"^^xsd:dateTime ;
     wikibase:timePrecision "11"^^xsd:integer ;
     wikibase:timeTimezone "0"^^xsd:integer ;
     wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .

La suite décrit la manipulation de chaque sorte de valeur, en fonction du type de la valeur et du type de la propriété. Veuillez noter que tous les aspects du modèle de données ne sont actuellement pas représentés en RDF, certains aspects pour le moment inusités (tels que les unités ou encore les paires avant/après des dates) sont simplement omis car ils n'apportent aucune information utile. Cela pourra évoluer à l'avenir quand ces aspects commenceront à être exploités par Wikidata.

Chaîne

Strings have value type string and property type string.

String is represented as a string literal. Strings only have simple value.

Médias de Commons

Media on commons: have value type string and property type commonsMedia.

Un média de Commons est représenté par un IRI avec l'URL complète de la ressource Commons, dérivée du nom de fichier Commons de la donnée sous-jacente. E.g.: <http://commons.wikimedia.org/wiki/Special:FilePath/Universe%20Photo.svg>. Il n'a qu'une valeur simple.

URL

URL values have value type string and property type url.

URL is represented as a an IRI matching the URL string (e.g. <http://www.wikidata.org/>). Il n'a qu'une valeur simple.

Identifiants externes

External ID values have value type string and property type external-id. Ils sont représentés par une chaîne de caractères littérale. Il n'a qu'une valeur simple.

Si la propriété possède un formateur d'URI pour RDF configuré (sur Wikidata: formatter URI for RDF resource (P1921)), le RDF aura aussi une valeur normalisée, par ex. :

 wd:Q123 wdt:P234 "External-ID" ; 
         wdtn:P234 <http://external.example.com/reference/External-ID>

Identifiants d'entité Wikibase

Wikibase Entity ID values have value type wikibase-entityid and property type wikibase-item.

The entity is represented by its IRI, e.g. wd:Q2. Il n'a qu'une valeur simple.

Teste monolingue

Monolingual text values have value type monolingualtext and property type monolingualtext.

Le texte est représenté par une chaîne de caractères littérale avec un label de langue. Il n'a qu'une valeur simple.

Coordonnées géographiques

Coordinate text values have value type globecoordinate and property type globe-coordinate.

The simple value of the coordinate is the WKT string with the coordinates, with type geo:wktLiteral, e.g.: "Point(35.3 12.93)"^^geo:wktLiteral. The order of the coordinates in WKT is longitude, latitude (since format version 0.0.2).

La valeur complète a les latitude, longitude, et précision en double littéraux, et le globe en IRI.

Exemple :

 wdv:a10564107110b2d5739b8fe235cddf73 a wikibase:GlobecoordinateValue ;
     wikibase:geoLatitude "12.933333333333"^^xsd:double ;
     wikibase:geoLongitude "35.3"^^xsd:double ;
     wikibase:geoPrecision "0.000277778"^^xsd:double ;
     wikibase:geoGlobe <http://www.wikidata.org/entity/Q2> .

Quantité

Quantity values have value type quantity and property type quantity.

La valeur simple de la quantité est le nombre spécifié, en littéral décimal.

The full value includes amount, unit URI (the default for unit-less values being http://www.wikidata.org/entity/Q199), and optionally upper and lower bound. Si aucune limite haute ou basse n'est fournie, l'incertitude de la quantité est indéfinie. Les valeurs exactes sont représentées par des quantités qui ont la même valeur pour le nombre et les limites haute et basse.

Exemple :

wdv:cb213eea7a0b90d1d7f65c6eabfab9da a wikibase:QuantityValue ;
  wikibase:quantityAmount "+123"^^xsd:decimal ;
  wikibase:quantityUpperBound "+124"^^xsd:decimal ;
  wikibase:quantityLowerBound "+122"^^xsd:decimal ;
  wikibase:quantityUnit <http://www.wikimedia.org/entity/Q199> .

Temps

Time values have value type time and property type time.

The simple value of the time value is either datetime value of type xsd:dateTime, if the value can be converted to Gregorian date in ISO format, or a string as represented in the database, if not. The xsd:dateTime dates follow XSD 1.1 standard, which uses the proleptic Gregorian calendar, and represents the year 1 BCE as +0000. This is in contrast the JSON representation of Julian and Gregorian dates, which follows the traditional year numbering, representing the year 1 BCE as -0001.

The full value includes the simple value above under wikibase:timeValue, precision and timezone as integers and calendar model as IRI. Note that the calendar model is the original values calendar model even if wikibase:timeValue was converted to Gregorian.

Exemple :

 wdv:85374678f22bda99efb44a5617d76e51 a wikibase:Time ;
     wikibase:timeValue "+1948-04-12T00:00:00Z"^^xsd:dateTime ;
     wikibase:timePrecision "11"^^xsd:integer ;
     wikibase:timeTimezone "0"^^xsd:integer ;
     wikibase:timeCalendarModel <http://www.wikidata.org/entity/Q1985727> .

Valeurs normalisées

Certaines valeurs peuvent se représenter sous plusieurs formes, en fonction de l'usage. Par exemple, la longueur peut s'exprimer en différentes unités - pieds, pouces, mètres, miles, etc. Afin de fournir un moyen d'unifier ces formes et ainsi de faciliter l'accès à la donnée par des processus automatisés, les valeurs normalisées ont été introduites, pour représenter des données diverses d'une manière unifiée.

À l'heure actuelle, la seule normalisation de valeur supportée est la conversion des unités de quantités vers leur unité de base - ex. longueur en mètres. À l'avenir, davantage d'unités et de normalisations pourront être ajoutées, ce qui sera documenté ici. The conversion table is available on the Mediawiki gerrit if needed.

Les seules valeurs simples normalisées sont les identifiants externes (voir ci-dessous).

Quantité normalisée

Les valeurs de quantité normalisées sont des nœuds de valeur, parallèles au nœuds de données originaux mais représentés dans les unités de base. They are connected to their parent nodes by predicates with prefix having "v" replaced with "n" - i.e. psn:, prn: and pqn:, for example:

 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 a wikibase:Statement, wikibase:BestRank ;
     ps:P8 "123"^^xsd:decimal ;
     psv:P8 wdv:382603eaa501e15688076291fc47ae54 ;
     psn:P8 wdv:85374998f22bda54efb44a5617d76e51 .

Original quantity value is connected to the normalised value by wikibase:quantityNormalized predicate:

 wdv:382603eaa501e15688076291fc47ae54 a wikibase:QuantityValue ;
     wikibase:quantityAmount "+123"^^xsd:decimal ;
     wikibase:quantityUpperBound "+124"^^xsd:decimal ;
     wikibase:quantityLowerBound "+122"^^xsd:decimal ;
     wikibase:quantityUnit <http://www.wikidata.org/entity/Q218593> ;
     wikibase:quantityNormalized wdv:85374998f22bda54efb44a5617d76e51.

The normalised value has wikibase:quantityNormalized pointing to itself.

If the value is already normalised - i.e. is expressed in base units - then both "v" and "n" predicates point to the same value, and wikibase:quantityNormalized for this value points to itself.

Quantities with no units or with units that are not normalisable (have no base unit they can be reduced to) do not have normalised predicates and normalised values and do not include wikibase:quantityNormalized.

On recommande de ne pas avoir plus d'une unité de base par propriété. Les unités de base dépendent de la configuration de Wikibase et sont habituellement choisies pour représenter des unités standardisées universellement acceptées, telles que les unités du S.I.

Identifiant externe normalisé

Pour les identifiants externes, la normalisation convertit la valeur de la chaîne en URL, si le formateur d'URL à cette fin est défini dans les données de propriété (via la définition canonicalUriProperty), alors la valeur normalisée sera répertoriée comme valeur wdtn: pour les valeurs vraies, et comme valeur normalisée pour les déclarations dans les prédicats psn:, prn: et pqn: selon le contexte dans lequel la valeur apparaît.

Valeurs spéciales

Le modèle de données de Wikibase a deux type spéciaux de snaks - PropertySomeValueSnak qui indique une valeur existante mais dont l'identité ou la valeur est inconnue, et PropertyNoValueSnak qui indique qu'une valeur n'existe pas.

Somevalue

Une valeur inconnue est représentée par un nœud RDF blanc pour les deux déclarations, simplifiée et complète :

 wd:Q3 a wikibase:Item, wdt:P2 _:genid1 .
 wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb067c a wikibase:Statement ;
     ps:P2 _:genid2 ;
     wikibase:rank wikibase:NormalRank .

Novalue

Novalue is represented not by a regular value but as a class of the entity or statement or reference, with prefix wdno: and the name of the property. Exemple :

 wd:Q3 a wikibase:Item, wdno:P7 .
 
 wds:Q3-45abf5ca-4ebf-eb52-ca26-811152eb777c a wikibase:Statement,  wdno:P7 ;
     wikibase:rank wikibase:NormalRank .

L'entité a une classe wdno: si elle possède une déclaration de quasi vérité novalue pour cette propriété.

Novalue dans la partie principale ou dans les qualifieurs d'une déclaration correspond à une classe wdno: du noeud de la déclaration, et novalue pour une référence correspond à une classe wdno: sur le noeud de la référence.

Les classes pour wdno: sont définies comme suit :

 wdno:P2 a owl:Class ;
    owl:complementOf _:genid1 .
 
 _:genid1 a owl:Restriction ;
    owl:onProperty wdt:P2 ;
    owl:someValuesFrom owl:Thing .

Liens de sites

Les liens sont représentés par un ensemble de prédicats décrivant le lien URL. The type of the node is schema:Article and it linked with the entity via schema:about predicate.

Badges are described with wikibase:badge predicates. schema:name predicate holds the plain-text name of the article, in the language of the linked wiki.

Exemple :

 <https://en.wikipedia.org/wiki/Duck> a schema:Article ;
     schema:about wd:Q3 ;
     schema:inLanguage "en" ;
     schema:isPartOf <https://en.wikipedia.org/> ;
     schema:name "Duck"@en ;
     wikibase:badge wd:Q5 .

 <https://en.wikipedia.org/> wikibase:wikiGroup "wikipedia" .

L'URL du sujet est composée du préfixe de langue du site, et du nom de l'article, encodé en URL selon la RFC 3986, par ex. :

<https://ru.wikipedia.org/wiki/%D0%A3%D1%82%D0%BA%D0%B0>

En particulier, l'encodage utilisé fonctionne comme suit :

  1. Normalisation du titre en remplaçant chaque espaces par un caractère de soulignement (_).
  2. Application de la fonction wfUrlencode(), qui encode avec des % tous les caractères non-alphanumériques sauf ";:@$!*(),/-_~".

Redirections

Redirected entities are implemented as owl:sameAs predicates, for example if Q6 redirects to Q1, the dump would be:

 wd:Q6 owl:sameAs wd:Q1 .

Préfixes utilisés

Les préfixes sont utilisés dans les formats RDF pour permettre les préfixes courts (comme Turtle et RDF). Pour les autres formats, l'URL complète est utilisée.

Toutes les URL préfixées qui ne contiennent pas de nom d'hôte sont préfixées par le nom d'hôte du wiki les ayant générées. Toutes les URL préfixées qui contiennent un nom d'hôte sont fixes et ne dépendent pas du wiki les ayant générées.

Préfixe URL complète Utilisation Exemple
wikibase: http://wikiba.se/ontology# Ontologie Wikibase
 wd:Q2 a wikibase:Item
Nœuds
wdata: /Special:EntityData/ Ensemble de données décrivant une entité donnée
wdata:Q2 schema:about wd:Q2 .
wd: /entity/ Entité Wikibase - item ou propriété.
wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6a
wds: /entity/statement/ Nœud de déclaration, décrit une allégation à propos d'une entité.
wds:Q2-a4078553-4ec1-a64a-79e7-c5b5e17b2782
  a wikibase:Statement
wdv: /value/ Nœud de valeur
wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Value
wdref: /reference/ Nœud de réference
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 prov:wasDerivedFrom wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a .
wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a a wikibase:Reference .
Prédicats
wdt: /prop/direct/ Quasi-vérités sur la donnée, associe une entité directement à une valeur.
wd:Q2  wdt:P9 <http://acme.com/>
wdtn: /prop/direct-normalized/ Quasi-vérités sur la donnée, associe une entité directement à une valeur normalisée.
wd:Q2  wdtn:P9 <http://acme.com/ABCDE>
p: /prop/ Associe une entité à une déclaration
wd:Q2 p:P9 wds:Q2-82a6e009-4f93-28dc-3555-38bbfc3afe6awd
wdno: /prop/novalue/ Class to use when the entity has novalue for this property.
wd:Q2 a wdno:P9 .
ps: /prop/statement/ Associe une valeur à une déclaration
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 ps:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
psv: /prop/statement/value/ Associe une valeur en profondeur à une déclaration
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
psn: /prop/statement/value-normalized/ Associe une valeur normalisée à un nœud de déclaration
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 psn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
pq: /prop/qualifier/ Associe un qualificatif à un nœud de déclaration
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pq:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
pqv: /prop/qualifier/value/ Associe une valeur de qualificatif en profondeur à un nœud de déclaration
wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
pqn: /prop/qualifier/value-normalized/ Associe une valeur de qualificatif normalisé à un nœud de déclaration
 wds:Q3-24bf3704-4c5d-083a-9b59-1881f82b6b37 pqn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
pr: /prop/reference/ Associe une référence à une valeur
 wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a pr:P8 "-13000000000-01-01T00:00:00Z"^^xsd:dateTime
prv: /prop/reference/value/ Associe une référence à une valeur en profondeur
 wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prv:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a
prn: /prop/reference/value-normalized/ Associe une référence à une valeur normalisée
 wdref:87d0dc1c7847f19ac0f19be978015dfb202cf59a prn:P8 wdv:87d0dc1c7847f19ac0f19be978015dfb202cf59a

Standard prefixes used:

Préfixe URL complète
rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
rdfs: http://www.w3.org/2000/01/rdf-schema#
xsd: http://www.w3.org/2001/XMLSchema#
owl: http://www.w3.org/2002/07/owl#
skos: http://www.w3.org/2004/02/skos/core#
schema: http://schema.org/
prov: http://www.w3.org/ns/prov#
geo: http://www.opengis.net/ont/geosparql#

Liste complète des préfixes

Cette liste peut servir aux requêtes SPARQL :

PREFIX bd: <http://www.bigdata.com/rdf#>
PREFIX cc: <http://creativecommons.org/ns#>
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX geo: <http://www.opengis.net/ont/geosparql#>
PREFIX hint: <http://www.bigdata.com/queryHints#> 
PREFIX ontolex: <http://www.w3.org/ns/lemon/ontolex#>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX prov: <http://www.w3.org/ns/prov#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX schema: <http://schema.org/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>

PREFIX p: <http://www.wikidata.org/prop/>
PREFIX pq: <http://www.wikidata.org/prop/qualifier/>
PREFIX pqn: <http://www.wikidata.org/prop/qualifier/value-normalized/>
PREFIX pqv: <http://www.wikidata.org/prop/qualifier/value/>
PREFIX pr: <http://www.wikidata.org/prop/reference/>
PREFIX prn: <http://www.wikidata.org/prop/reference/value-normalized/>
PREFIX prv: <http://www.wikidata.org/prop/reference/value/>
PREFIX psv: <http://www.wikidata.org/prop/statement/value/>
PREFIX ps: <http://www.wikidata.org/prop/statement/>
PREFIX psn: <http://www.wikidata.org/prop/statement/value-normalized/>
PREFIX wd: <http://www.wikidata.org/entity/>
PREFIX wdata: <http://www.wikidata.org/wiki/Special:EntityData/>
PREFIX wdno: <http://www.wikidata.org/prop/novalue/>
PREFIX wdref: <http://www.wikidata.org/reference/>
PREFIX wds: <http://www.wikidata.org/entity/statement/>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
PREFIX wdtn: <http://www.wikidata.org/prop/direct-normalized/>
PREFIX wdv: <http://www.wikidata.org/value/>
PREFIX wikibase: <http://wikiba.se/ontology#>

Ontologie

Voici la liste compilée de tous les objets et des prédicats internes au format. Pour la signification des préfixes, allez à la liste des préfixes.

Objets

Désignation Utilisation Contexte
wikibase:Item Item Wikibase Type for wd:Q123 describing item
wikibase:Property Propriété Wikibase Type for wd:P123 describing property
wikibase:Lexeme Wikibase lexeme Type for wd:L123 describing lexeme
wikibase:Form forme d'un lexème Wikibase Type for wd:L123-F1 describing form
wikibase:Sense sens d'un lexème Wikibase Type for wd:L123-S1 describing sense
wikibase:Statement Déclaration sur une entité Type for wds:1234 describing statement
wikibase:Reference Nœud de référence Type for wdref:1234 describing reference
wikibase:TimeValue Nœud de valeur représentant une valeur temporelle Type for wdv:1234 describing time value
wikibase:QuantityValue Nœud de valeur représentant une valeur de quantité Type for wdv:1234 describing quantity value
wikibase:GlobecoordinateValue Nœud de valeur représentant la valeur de coordonnées Type for wdv:1234 describing coordinate value
wikibase:Dump Nœud décrivant l'ensemble de données de vidage Utilisé dans l'entête du vidage pour décrire des métadonnées sur le vidage entier
wikibase:PreferredRank Représente un rang préféré pour la déclaration Used as object of wikibase:rank
wikibase:NormalRank Représente un rang normal pour la déclaration Used as object of wikibase:rank
wikibase:DeprecatedRank Représente un rang obsolète pour la déclaration Used as object of wikibase:rank
wikibase:BestRank Représente une déclaration qui a le meilleur rang pour la propriété - c.-à-d. candidat à une inclusion en tant que quasi-vérité Used as type of wikibase:Statement
wikibase:WikibaseItem Type de référence d'une entité Used as object of wikibase:propertyType
wikibase:CommonsMedia Type de référence de média Commons Used as object of wikibase:propertyType
wikibase:GlobeCoordinate Type de géo-coordonnées Used as object of wikibase:propertyType
wikibase:Monolingualtext Valeur de texte monolingue Used as object of wikibase:propertyType
wikibase:Quantity Type de quantité Used as object of wikibase:propertyType
wikibase:String Valeur chaîne de caractères Used as object of wikibase:propertyType
wikibase:Time Valeur temporelle Used as object of wikibase:propertyType
wikibase:Url Type de référence d'URL Used as object of wikibase:propertyType

Prédicats

Les noms en italique signifient que tout nom de propriété peut remplacer le nom de l'exemple P123.

Désignation Utilisation Domaine Intervalle
wdt:P123 Associe une entité à une valeur de quasi-vérité wikibase:Item|wikibase:Property Valeur simple
wdtn:P123 Associe une entité à une valeur normalisée de quasi-vérité wikibase:Item|wikibase:Property Valeur simple
p:P123 Associe une entité à une déclaration wikibase:Item|wikibase:Property wikibase:Statement
ps:P123 Associe une déclaration à une valeur simple wikibase:Statement Valeur simple
pr:P123 Associe une référence à une valeur simple wikibase:Reference Valeur simple
pq:P123 Link statement to qualifier value wikibase:Statement Valeur simple
psv:P123 Associe une déclaration à un nœud de valeur wikibase:Statement wikibase:Value
psn:P123 Associe une déclaration à un nœud de valeur normalisée wikibase:Statement wikibase:Value
prv:P123 Associe une référence à un nœud de valeur wikibase:Reference wikibase:Value
prn:P123 Associe une référence à un nœud de valeur normalisée wikibase:Reference wikibase:Value
pqv:P123 Associe une déclaration à un nœud de valeur de qualificatif wikibase:Statement wikibase:Value
pqn:P123 Associe une déclaration à un nœud de valeur normalisée de qualificatif wikibase:Statement wikibase:Value
wikibase:rank Indique le rang de la déclaration wikibase:Statement Un des objets de rang ci-dessus
wikibase:badge Badge attaché à un lien de site schema:Article wikibase:Item - URL du badge
wikibase:propertyType Type de propriété de la propriété de l'entité wikibase:Property Un des objets Type de propriété ci-dessus
wikibase:directClaim Associe une entité de propriété à un prédicat d'allégation directe wikibase:Property wdt:P123
wikibase:directClaimNormalized Associe une entité de propriété à un prédicat d'allégation directe normalisée wikibase:Property wdtn:P123
wikibase:claim Associe une entité de propriété à un prédicat d'allégation/de déclaration wikibase:Property p:P123
wikibase:statementProperty Associe une entité de propriété à un prédicat de valeur simple de déclaration wikibase:Property ps:P123
wikibase:statementValue Associe une entité de propriété à un prédicat de valeur complète de déclaration wikibase:Property psv:P123
wikibase:statementValueNormalized Associe une entité de propriété à un prédicat de valeur normalisée de déclaration wikibase:Property psn:P123
wikibase:qualifier Associe une entité de propriété à un prédicat de valeur simple de qualificatif wikibase:Property pq:P123
wikibase:qualifierValue Associe une entité de propriété à un prédicat de valeur complète de qualificatif wikibase:Property pqv:P123
wikibase:qualifierValueNormalized Associe une entité de propriété à un prédicat de valeur normalisée de qualificatif wikibase:Property pqn:P123
wikibase:reference Associe une entité de propriété à un prédicat de valeur simple de référence wikibase:Property pr:P123
wikibase:referenceValue Associe une entité de propriété à un prédicat de valeur complète de référence wikibase:Property prv:P123
wikibase:referenceValueNormalized Associe une entité de propriété à un prédicat de valeur normalisée de référence wikibase:Property prn:P123
wikibase:hasViolationForConstraint Associe la déclaration transgressant une contrainte à la déclaration de cette contrainte wikibase:Statement wikibase:Statement
wikibase:lemma Associe un lexème Wikibase avec le texte du lemme wikibase:Lexeme Simple string value
wikibase:lexicalCategory Associe un lexème Wikibase avec son item de catégorie lexicale wikibase:Lexeme wikibase:Item
wikibase:grammaticalFeature Associe une forme de lexème Wikibase avec ses caractéristiques grammaticales wikibase:Form/ontolex:Form wikibase:Item

Les prédicats suivants sont utilisés en valeur en profondeur pour les valeurs de types spéciaux. All these predicates have the domain of wikibase:Value and the range depending on type below.

Prédicats pour les Géo-Coordonnées

Désignation Type Signification
wikibase:geoLatitude xsd:double Latitude, composant des coordonnées
wikibase:geoLongitude xsd:double Longitude, composant des coordonnées
wikibase:geoPrecision xsd:double Précision des coordonnées
wikibase:geoGlobe IRI The URL of the globe, e.g. http://www.wikidata.org/entity/Q2 (Earth)

Prédicats pour une Quantité

Désignation Type Signification
wikibase:quantityAmount xsd:decimal Le nombre spécifié
wikibase:quantityUpperBound xsd:decimal La limite supérieure de l'intervalle de valeurs
wikibase:quantityLowerBound xsd:decimal La limite inférieure de l'intervalle de valeurs
wikibase:quantityUnit IRI The unit of measurement, for unit-less quantities is http://www.wikidata.org/entity/Q199 (i.e. "1")
wikibase:quantityNormalized IRI Désigne la valeur normalisée, si elle existe.

Prédicats pour le Temps

Désignation Type Signification
wikibase:timeValue xsd:dateTime|string Temps grégorien ou chaîne de caractères si la valeur ne peut pas être représentée en temps grégorien
wikibase:timePrecision xsd:integer Time precision constant
wikibase:timeTimezone xsd:integer Décalage horaire par rapport à l'heure UTC en minutes
wikibase:timeCalendarModel IRI URL of the calendar used, e.g. http://www.wikidata.org/entity/Q1985727 (Gregorian)

Différences avec les données WDQS

The Wikidata query service has the data in the format described above, but there are small differences that can be important while writing SPARQL queries:

  1. Types (a or rdf:type) for wikibase:Item, wikibase:Statement, wikibase:Reference , wikibase:Lexeme, wikibase:Form, wikibase:Sense are currently omitted for performance reasons.
    • To filter for items, you can use wikibase:sitelinks [] instead of a wikibase:Item (only items have a number of sitelinks).
    • To filter for statements, you can use wikibase:rank [] instead of a wikibase:Statement (only statements have a rank).
    • To filter for references, you can use [] prov:wasDerivedFrom ?reference instead of ?reference a wikibase:Reference, but note that this may return a reference more than once. (Usually, you’ll get references via prov:wasDerivedFrom from a statement anyway.)
    • To filter for senses, you can use ontolex:LexicalSense instead of wikibase:Sense.
    • To filter for forms, you can use ontolex:Form instead of wikibase:Form.
  2. Data nodes (wdata:Q2) are not stored, all the information like version, revision and page props is stored in the entity node (wd:Q2) instead. This is done for performance reasons.
  3. For labels, only rdfs:label is stored but not schema:name or skos:prefLabel. Since they all have the same data, storing all three is redundant.
  4. Redirects are recorded but currently have no additional semantics implemented.
  5. WDQS now uses local IRIs (Skolem IRIs) instead of blank nodes to represent somevalue. These can be tested with FILTER wikibase:isSomeValue(?node) rather than FILTER isBlank(?node)

See also SPARQL query examples for how to query the data using WDQS service.