Wikibase/Créer ou supprimer des données
Présentation
Ce guide donne un aperçu des outils et des techniques disponibles pour ajouter et supprimer des données dans Wikibase.
Créer des données
Quel outil utiliser ?
Importer une plus grande quantité de données
Réconcilier Wikibase avec des données importées d'un autre format et venant d'un autre dépôt
Entrer différents types de données manuellement en s'assurant que tous les champs nécessaires sont présents
Importer des données automatiquement avec Python
Structurer les données à importer à partir d'un fichier texte à plat
OpenRefine
OpenRefine est un outil de traitement de données pouvant être connecté à une instance de Wikibase tout comme à une large variété d'autres dépôts de données. Les utilisateurs de OpenRefine peuvent transformer et cartographier leurs données pour les rendre compatibles avec l'importation dans Wikibase et la réconciliation.
Pout toute information sur l'utilisation de OpenRefine avec Wikibase, voir la documentation présentation.
WikibaseIntegrator
Pour les utilisateurs familiers du langage de programmation Python, WikibaseIntegrator peut s'avérer être un outil très puissant pour ajouter des données dans Wikibase.
La documentation du dépôt de code contient des exemples utiles que vous pouvez réutiliser pour créer un robot ou un programme à exécution longue, pour importer vos données. Une fois avoir été authentifié et personnalisé, votre robot peut importer des données avec un minimum d'intervention de votre part.
Nous vous recommandons de lire soigneusement la documentation.
https://github.com/LeMyst/WikibaseIntegrator
QuickStatements
QuickStatements est un outil développé par l'un des développeurs les plus prolifiques de la communauté, Magnus Manske. QuickStatements est l'outil original pour ajouter des données dans Wikibase.
QuickStatements reconnait deux formats de commande pour les batches : QuickStatements v1 et QuickStatements v2 (CSV).
Comme exemple nous présentons les commandes sous les deux formats, v1 et CSV ; elles réalisent la même action : créer un nouveau élément. Pour des raisons de simplicité, nous utiliserons les éléments et les propriétés de Wikidata, mais bien sûr, les commandes auront un autre aspect si elles sont appliquées à votre propre Wikibase.
Nous utiliserons QuickStatements avec :
- une commande pour créer un nouvel élément avec un nouveau QID (identifiant numérique unique de l'élément)
- un libellé L en anglais en (code de langue : English) : « Doctor Worm »
- une description D en anglais en (code de langue : English): « 1998 song performed by They Might Be Giants »
- la propriété intéressé par (P2650)
- l'élément kit de percussion (Q128309)
v1
La syntaxe QuickStatements v1 est basée sur les commandes, avec une commande par ligne séparée par une tabulation.
Voici à quoi ressemble notre exemple dans la syntaxe v1 :
CREATE LAST Len Doctor Worm LAST Den 1998 song performed by They Might Be Giants LAST P2650 Q128309
CSV
QuickStatements comprend aussi les commandes au format CSV. La première ligne est un entête qui définit le contenu de chaque colonne; les lignes suivantes donnent les informations à fournir à Wikibase en fonction du contenu de chaque entête de colonne.
Voici à quoi ressemble notre exemple dans la syntaxe CSV :
qid,Len,Den,P2650 ,Doctor Worm,1998 song performed by They Might Be Giants,Q128309
Entrées
Allez sur votre interface QuickStatements.
Pour les utilisateurs de Wikibase Suite sur Docker, QuickStatements est fourni préinstallé et reste disponible sur http://localhost:8840/ .
Pour les utilisateurs de Wikibase Cloud, QuickStatements est disponible dans la barre latérale gauche : <yourhostname>.wikibase.cloud/tools/quickstatements
Cliquez sur New batch. Collez votre commande dans la fenêtre et pressez Import correspondant au format que vous avez choisi.
Sur l'écran suivant vous verrez un résumé de ce que QuickStatements va faire avec vos commandes. Si tout vous semble correct, cliquez sur Run.
Résultats
Nous avons maintenant créé un élément (« Doctor Worm », QID nouvellement créé) et une déclaration (« Doctor Worm is interested in drum kits »). Vous verrez souvent une page d'élément similaire à celle de la capture d'écran.
Pour une information détaillée très poussée sur QuickStatements, voir sa page d'aide.
Cradle
Un autre outil de Magnus Manske, Cradle, vous permet la création manuelle et fiable des nouveaux éléments Wikibase en utilisant les formulaires web ou des ShapeExpressions. Cradle est utile pour les administrateurs Wikibase qui souhaitent autoriser la création manuelle des lots d'élements, chacun d'eux devant se conformer à un schéma particulier.
Voici comment commencer avec Cradle :
- Si vous utilisez la suite Wikibase, installez le logiciel Cradle. Wikibase Cloud offre Cradle déjà installé.
- Ecrivez la définition des formulaires d'entrée que vous souhaitez utiliser pour saisir vos données. Vous pouvez faire l'une, l'autre, ou les deux choses suivantes :
- Créez la définition des formulaires sur une page spéciale de votre Wikibase(Project:Cradle).
- Installez l'extension EntitySchema (dans la suite, l'extension est installée dans le cloud mais actuellement cela ne fonctionne pas). Définissez ensuite quelques ShapeExpressions dans l'espace de noms EntitySchema de votre Wikibase.
Formulaires
En utilisant la spécification de format de Cradle, vous pouvez créer un formulaire dans Cradle, qui demande à l'utilisateur les champs que vous indiquez. Vous définissez ces formulaires sur une page spéciale de votre Wikibase : <url_de_votre_wikibase>$1.
Voici un exemple de création de formulaire pour Cradle.
Sur la page Cradle de Wikidata un formulaire actor est défini. La définition est similaire à :
== actor == ;P21:hardselect:Q6581097,Q6581072|mandatory ;P31:hardselect:Q5|mandatory ;P106:hardselect:Q33999,Q2526255,Q28389,Q2059704|mandatory
Ceci crée le formulaire « actor » qui demande à l'utilisateur de remplir les champs nécessaires à la création d'un nouvel élément.
En plus des champs « libellés », « Egalement connu en tant que » et « Descriptions » apparaissant dans chaque formulaire, ce formulaire demande à l'utilisateur de remplir les trois champs suivants définis dans l'exemple ci-dessus :
- sex or gender (P21) — hardselect crée un sélecteur offrant deux possibilités : masculin (Q6581097) ou féminin (Q6581072). Ce champ est obligatoire (mandatory), c'est à dire que l'utilisateur doit choisir avant de soumettre le formulaire.
- instance of (P31) — Ce hardselect crée un sélecteur avec une option humain (Q5) qui assure que chaque élément créé est une instance d'un être humain, ce qui est bien sûr le cas de toutes les entrées possibles de ce formulaire.
- occupation (P106) — Ce sélecteur offre quatre options, dont une doit être choisie par l'utilisateur : acteur (Q33999), réalisateur de cinéma (Q2526255), scénariste (Q28389) ou réalisateur de télévision (Q2059704).
Dans Cradle, le formulaire ressemble à l'écran qui est présenté à droite.
Voir cette page Wikidata pour d'autres exemples d'implémentation.
ShapeExpressions
Si l'extension MediaWiki EntitySchema est installée, vous pouvez aussi créer des formulaires comme dans les exemples ci-dessus mais d'une manière différente : en définissant des schémas dans l'espace de noms EntitySchema votre Wikibase. (Cette fonctionnalité ne fonctionne pas actuellement sur Wikibase Cloud).
La syntaxe de ces schémas est connue sous le nom de ShapeExpressions, un langage de modélisation des données. Une fois qu'un EntitySchema valide a été créé, vous pouvez entrer son numéro dans Cradle (“E12345”) pour créer les formulaires avec les champs définis dans cet EntitySchema. Les utilisateurs remplissent ensuite ces formulaires pour créer les éléments tout comme dans l'exemple ci-dessus.
Voici un exemple de création d'un EntitySchema utilisé par Cradle.
Wikidata possède un EntitySchema pour les « archives d'extraits de journaux » :
Cette définition de ShapeExpression produit un formulaire dans Cradle qui apparaît comme présenté à droite.
Pour des informations beaucoup plus complètes, voir :
- https://github.com/magnusmanske/cradle
- https://www.wikidata.org/wiki/Wikidata:Cradle
- https://www.w3.org/2013/ShEx/Primer
- https://shexspec.github.io/talks/2017/10-28-wikidatacon/#(1)
Deleting data
Si vous avez importé des données par erreur, ou si vous devez supprimer des données pour tout autre raison et que vous êtes membre du groupe des Administrateurs, vous pouvez supprimer les données d'une page particulière. Suivez simplement les étapes suivantes :
- Allez sur la page de l'élément que vous voulez supprimer.
- Dans le coin supérieur droit de la page, cliquez sur More et choisissez Delete dans le menu déroulant.
- Sur la page de suppression, sélectionnez le motif et indiquez le contexte si nécessaire, puis cliquez sur Delete page.
Si vous être membre du groupe utilisateur des bureaucrates, vous pouvez utiliser la page Special:DeleteBatch activée par l'extension DeleteBatch :
- Cliquez sur Pages Spéciales dans la barre latérale gauche.
- Cherchez et sélectionnez Delete batch of pages .
- Choisissez un nom d'utilisateur (probablement le votre) à afficher dans les journaux.
- Choisissez un motif de suppression.
- Donnez une liste de pages à supprimer, soit dans le champ textuel, ou chargées à partir d'un fichier texte.
- Cliquez sur Delete.
Si vous souhaitez supprimer des versions de pages, lisez la section correspondante du manuel MediaWiki.