Améliorations des résultats de la recherche inter-wikis
Un nouvel objectif
Le département de Recherche envisage la possibilité de fournir des résultats de recherche d’autres projets Wikimedia ayant la même langue (habituellement désignée par « recherches cross-wiki ou inter-wikis »).
Par exemple, si vous étiez sur le Wikivoyage en français et aviez recherché « milk », vous auriez vu les articles de la Wikipédia en français correspondant à la recherche ainsi que les résultats d’autres projets Wikimedia en français (par exemple, du Wiktionnaire et de fr.wikiquote).
Cette page est une tentative de résumé de certaines de nos idées et nous invitons tous les contributeurs à discuter ouvertement de ce changement potentiel sur la page de discussions.
Le principe
La manière dont la recherche fonctionne actuellement pour tous les projets Wikimedia est la suivantr : chaque langue de projet a son propre index de recherche. Cela signifie qu’il n’y a actuellement aucun moyen d’effectuer une recherche de résultats, sur tous les projets wikis en même temps. Cependant, en arrière plan, la langue reste la même pour une recherche (indépendamment des projets) et les visiteurs peuvent être intéressés par des informations sur des projets frères dans leur langue.
Afficher des résultats de recherche inter-projets (de même langue) fournit plus d’informations aux visiteurs, une meilleure visibilité pour les autres projets, et améliore l’efficacité des recherches par les visiteurs de Wikimedia sur les wikis, ce qui inclut une baisse potentielle du nombre de recherches sans résultat.
Afficher des résultats de recherches supplémentaires d’autres projets ne va pas seulement augmenter la visibilité de ces autres projets frères, mais cela peut aussi augmenter les découvertes d’autres articles intéressants et même potentiellement encourager les contributions supplémentaires.
Pourquoi cela n’a-t-il pas été fait plus tôt ?
Pourquoi ne pas avoir un catalogue géant de recherche dans tous les projets de toutes les langues ?
- La complexité technique est une raison : la taille du catalogue serait de plusieurs centaines de gigaoctets. Par exemple, l’index de la base de données de la Wikipédia en anglais de toutes les pages est d’environ 200 gigaoctets. Le temps de réponse des résultats de recherche serait allongé avec un seul énorme index.
- Une autre raison pour conserver l’approche de recherche dans une langue unique est qu’il ne serait probablement pas très utile de rechercher un sujet dans toutes les langues. Rechercher « Paris, France » et voir le même article en français, allemand et anglais n’aiderait pas vraiment à découvrir de nouvelles informations.
Les wiki-projets en langue anglaise sont assez nombreux :
- L’index de la Wikipédia en anglais pour toutes les pages en anglais a une taille approximative de 200 Go.
- Celui de Wikinews en anglais a une taille approximative de 15 Go.
- Celui de Wikisource en anglais a une taille approximative de 6 Go.
Afficher des résultats de recherche supplémentaires pourrait impacter les différents flux de travail wiki existants.
- Cela pourrait impacter les robots, les contributeurs, les chercheurs, les lecteurs...
Le Projet
Pendant le premier trimestre (juillet – septembre 2016) l’équipe technique a continué à travailler sur les quatre étapes principales suivantes :
Premièrement
- Combiner les index de même langue. (tâche T139498) Fait partiellement
- Réclamer de l’aide auprès de la communauté – ce qui inclut les débats sur cette page. (tâche T137312) Fait
- Les équipes Recherche et Design de la WMF vont créer des maquettes de l’affichage de ces nouveaux résultats de recherche. Fait
Deuxièmement
Avant la fin du trimestre suivant (octobre – décembre 2016) l’équipe a comparé l’efficacité de la recherche. Cela sera fait :
- après que l’index inter-wiki est prêt pour plusieurs langues pré-définies, (tâche T121541) Fait
- après la réalisation de tests A/B pour collecter des données en temps de réel et leur analyse. (tâche T121546) Non fait
- et faire en sorte que les simulations de l'interface utilisateur soient finalisées pour le test frontal ici: Cross-wiki Search Result Improvements/Testing Fait
- tout en créant également une instance Labs pour les premiers tests. (tâche T151344) Fait
Troisièmement
Au cours de ce trimestre (janvier - mars 2017), nous allons:
- commencer les tests A / B pour la partie frontale de cette nouvelle fonctionnalité pour l'analyse et les commentaires de la communauté. (tâche T145917) En cours
- continuer à affiner et améliorer l'arrière pour cette fonctionnalité En cours
- Le premier test A / B / C a été exécuté et s'est révélé non concluant (tâche T149806) Fait
- Le deuxième test A / B sera exécuté, après avoir corrigé un bug d'interface utilisateur mineur et ajouté quatre autres Wikipédias à tester, pour un total de huit. (tâche T160004) Fait partiellement
Quatrièmement
Avril - Juin 2017:
- conclure l'analyse du deuxième test A/B pour les extraits de projets frères dans la page de résultats de recherche (tâche T160008) Fait partiellement
- note de la version, traduite aux pompes des villages annonçant de déploiement de la production (tâche T162276) En cours
- publier un article de blog sur la recherche
- sortie en production sur tous les Wikipedias
Exemples de recherche actuels
Il existe déjà quelques solutions portées par la communauté pour fournir des résultats supplémentaires d’autres projets Wikimedia et d’autres articles dans la même langue. Voici une petite série d’exemples :
Pages actuelles de wikis de résultats de recherche dans plusieurs langues :
- Hatian Creole:
- https://ht.wikipedia.org/wiki/Espesyal:Chache/Milk
- Les entrées à la page en bas sont ajoutées via mw: Extension: ArticlePlaceholder
- Français:
- https://fr.wikipedia.org/wiki/Spécial:Recherche/Milk
- Les entrées au bas de la page sont ajoutées via d: Utilisateur: Yair rand / WikidataInfo.js
- Italien:
- https://it.wikipedia.org/w/index.php?title=Speciale:Ricerca/Milk&fulltext=1
- Les entrées au bas de la page sont ajoutées via d: Utilisateur: Yair rand / WikidataInfo.js
- Navbox à la page est ajouté via w: it: MediaWiki: Search-interwiki-custom
Gadget de recherche externe :
- mw:MediaWiki:Gadget-externalsearch.js
- Ce gadget recherche une liste personnalisée de sites techniques, donnant une liste de résultats
en plusieurs onglets. Des explications avancées sont sur la page mw:Wikimedia technical search.- Regardez la capture d’écran de cette action personnalisée (malheureusement, rechercher "google.com/cse" peut déclencehr un message de filtre de pourriel avec certains navigateurs).
- Ce gadget recherche une liste personnalisée de sites techniques, donnant une liste de résultats
Comment pourraient être affichés ces résultats de recherches supplémentaires ?
L’apparence des résultats de recherche est ouverte aux débats et nous avons quelques brouillons sommaires pour vous à regarder ci-dessous, avec plus d’apparences possibles visibles sur la page Design. Ici, nous avons quelques exemples de ce qu’une nouvelle page de résultats de recherche pourrait donner, basés sur les solutions actuelles des autres wikis.
-
Exemple d’une page wiki avec l’ajout d’une boite sur le côté droit qui montre des liens vers des projets frères qui peuvent être intéressants et qui sont liés à la recherche d’origine.
-
Exemple d’une page wiki avec l’ajout d’une liste de liens vers des articles des projets frères pouvant être intéressant et liés à la recherche d’origine (aussi, un historique de la page).
-
Exemple d’une page de résultats de recherche avec l’ajout d’un onglet pour les projets wikis.
-
Exemple d’une interface tabulée — plus sur la sous-page /Design.
Aidez-nous à choisir la solution
Donnez dès à présent votre avis !
- Deux trimestres sont nécessaires, au minimum pour concevoir et dessiner la réalisation technique.
- L’équipe aimerait avoir quelque chose à tester et à montrer à la communauté à la fin 2016.
- A propos des mocks de Cross-wiki Search Result Improvements/Testing , nous avons décidé qu'ils seront testés au premier trimestre 2017.
Les questions
L’équipe a de nombreuses questions c’est pourquoi nous demandons l’avis de la communauté :
- Comment voulons-nous que ces résultats de recherche supplémentaires, nouveaux et pertinents, soient affichés ?
- Les résultats du wiki sur lequel est effectuée la recherche doivent-ils être affichés en premier, et ensuite avoir une option pour « afficher plus » en provenance des autres wikis ?
- Les résultats de recherches supplémentaires doivent-ils s’intercaler parmi les résultats classiques du wiki local ?
- Les résultats supplémentaires doivent-ils être affichés sur un côté (ou peut-être en bas) de la page de résultats ?
- Devons-nous avoir l’option pour « désactiver » ces autres résultats de recherche pertinents (par utilisateur et/ou pour tout un projet) ?
- Cela pourrait être un mot clé dans la recherche ou un bouton cliquable par le visiteur.
- Cela pourrait aussi être similaire au mot clé
local:
qui cherche des images uniquement sur le wiki local et pas sur Commons par exemple.
- Les résultats de recherche supplémentaires devraient-ils être affichés dans une liste ou en grille ?
- Doit-on inclure des métadonnées pertinentes avec les résultats supplémentaires telles qu’une image ou une description courte ?
- Les résultats doivent-ils afficher la taille de l’article (par exemple
848 octets (104 mots)
) et la date à laquelle il a été créé/modifié ? - Doit-on indiquer au visiteur que cliquer sur un résultat va l’amener sur un autre projet wiki ?
- Combien de résultats provenant d’autres wiki doit-on afficher ? 1, 2, 3, plus ?
- Doit-on restreindre la méthode actuelle d’affichage des résultats provenant du wiki sur lequel vous avez effectué la recherche ?
- Nous affichons actuellement jusqu’à 10 000 résultats paginés mais les tests montrent que généralement seuls les trois premiers résultats sont utilisés.
- Souhaitons-nous que ces nouveaux résultats de recherche fonctionnent sur tous les projets Wikimedia ?
- Par exemple, si je suis sur Wikiquote, est-ce que je veux voir des résultats correspondant à ma recherche provenant de Wikivoyage, Wikipédia ou Wikinews ?
- Ou, si je suis sur Wikipédia, simplement me montrer les résultats d’autres projets ?
- Ces autres résultats pertinents seraient-ils utiles et encourageraient-ils l’exploration de sujets variés ?
- Est-ce désagréable de voir ces résultats de recherche d’autres wikis ?
- Inversement, cela encourage-t-il un utilisateur à faire des découvertes ?
- Quel poids devons-nous donner aux résultats des autres projets wikis dans la recherche ?
- L’affichage des résultats de recherches supplémentaires des autres wikis va-t-il encourager la participation des contributeurs ?
- Par exemple, si vous recherchez
Piazza del Duomo
et que vous ne voyez pas d’article Wikivoyage correspondant (alors que vous effectuez votre recherche sur Wikiquote), cela vous encouragerait-il à commencer la création de cet article Wikivoyage ?
- Par exemple, si vous recherchez
- Doit-on limiter le nombre de langues dans lesquelles effectuer la recherche ?
- Par exemple, utiliser uniquement les cinquante langues les plus documentées pour instaurer cela ?
- Ou, utiliser uniquement les langues dans lesquelles nous détectons des requêtes dans une langue autre que celle du wiki ?
Voir aussi : explorer similaire, widget Wiktionary, icônes de vignettes dans les résultats de recherche
- Cross-wiki Search Result Improvements/Design - Notes de conception et illustrations de l’apparence que pourraient avoir les résultats des recherches.
- Explore Similar links on the search results page
- A/B testing information
- Self-guided testing step-by-step instructions
- Wiktionary widget on the search results page
- A/B testing information
- Self-guided testing step-by-step instructions
- Adding thumbnail icons to search results
- A/B testing information
Tâches Phabricator :
- https://phabricator.wikimedia.org/T137312
- https://phabricator.wikimedia.org/T136639
- https://phabricator.wikimedia.org/T139310
Notes de travail :
- https://etherpad.wikimedia.org/p/interwiki-implications
- https://etherpad.wikimedia.org/p/inter-wiki
- https://etherpad.wikimedia.org/p/multi_project_indices
Après avoir pris en compte les commentaires de la communauté et les recommandations de l'équipe de conception, nous commencerons bientôt les tests A / B. Voir cette page pour plus d'informations.
the Discovery department assure la maintenance de Cross-wiki Search Result Improvements.
Obtenir de l'aide :
|
Cette page a été créée pour encourager les utilisateurs à faire eux-mêmes leurs propres tests, au moyen d'une page de test auto-documentée avec des exemples pour les personnes qui ne sont pas très techniques, ainsi que pour celles qui ont un compte Wikipedia et qui sont un peu plus expérimentées.