Jump to content

Melhorias aos Resultados das Pesquisas Globais

From mediawiki.org
This page is a translated version of the page Cross-wiki Search Result Improvements and the translation is 79% complete.
Outdated translations are marked like this.

Uma nova meta

O departamento Discovery está examinando a possibilidade de fornecer resultados de pesquisa de outros projetos da Wikimedia com o mesmo idioma (comumente chamados de pesquisas globais).

Por exemplo, se você estivesse no Wikivoyage francês e pesquisasse por “leite”, seriam apresentados artigos correspondentes da Wikipédia francesa e de outros projetos da Wikimedia em francês (ex.: Wikcionário e Wikiquote).

Nesta página, tentaremos resumir algumas das nossas ideias. Convidamos todos os colaboradores a discutir abertamente na página de discussão sobre essa potencial mudança.

A ideia relaciona-se um pouco com o novo recurso que o departamento Discovery (sob o projeto Pesquisa) implantou em 2016. Esse recurso exibe resultados de outras edições da Wikipédia se for determinado que o(a) usuário(a) possa ter usado um termo em outro idioma e se a pesquisa retornar menos que 2 resultados. O tópico desta página – uma nova exibição dos resultados de pesquisa através de wikiprojetos do mesmo idioma – estará em adição ao novo recurso de detecção de idioma, não em substituição.

A justificativa

A maneira da qual a pesquisa funciona nos projetos da Wikimedia é esta: cada projeto tem um índice de pesquisa. Isso significa que atualmente não há como pesquisar através de todos os projetos por resultados relevantes ao mesmo tempo. No entanto, o idioma sempre será o mesmo numa pesquisa, e alguns visitantes podem estar interessados em informações que poderiam estar nos projetos irmãos de mesmo idioma.

O fornecimento de resultados de pesquisas globais (e no mesmo idioma) dará mais informações aos visitantes, maior visibilidade aos outros projetos e aumentará o número de resultados para visitantes, que inclui o potencial para pesquisas que sempre retornem resultados.

Exibir resultados de pesquisa a mais entre os projetos não apenas aumentará a visibilidade aos projetos irmãos como também aumentará o descobrimento de mais artigos de interesse, e possivelmente até trazer novos colaboradores.

Por que ainda não fizemos isso?

Página de resultados de uma pesquisa na Wikipédia inglesa.

Por que não ter um só índice para pesquisar em todos os projetos e em todos os idiomas?

  • Podemos responder como “tecnicamente complexo”: o tamanho do índice de resultados seria quase em terabytes. Por exemplo, o índice de artigos no banco de dados da Wikipédia inglesa tem cerca de 200 gigabytes. A rapidez no fornecimento de resultados seria impactada se usássemos um índice para todo o banco de dados.
  • Outra razão para essa separação entre idiomas justifica-se por não ser muito útil pesquisar um tópico em todos os idiomas. Pesquisar por “Paris” e ver o mesmo artigo em português, inglês e francês não ajudaria muito na descoberta de informações.

Os projetos ingleses são bem grandes:

  • O índice da Wikipédia inglesa para todos os artigos tem cerca de 200 GB
  • O Wikinotícias inglês tem cerca de 15 GB
  • O Wikisource inglês tem cerca de 6 GB

Isso poderá impactar vários fluxos de trabalho existentes, por exibir resultados de pesquisa adicionais.

  • Isso possivelmente afetaria robôs, colaboradores, pesquisadores, leitores, etc.

O plano

No primeiro trimestre (julho – setembro de 2016), a equipe de Engenharia continuou a trabalhar nesses quatro passos:

Primeiro

  • Combinar os índices de mesmo idioma (tarefa T139498) Incompleto Parcialmente concluído
  • Pedir ajuda da comunidade – incluindo o tema dessa página. (tarefa T137312) Yes Concluído
  • As equipes de Pesquisa e de Design da WMF criarão simulações de como os novos resultados serão exibidos. Yes Concluído

Segundo

No final do próximo trimestre (outubro – dezembro de 2016), a equipe comparará a satisfação com a pesquisa. Isso será feito:

Terceiro

Neste trimestre (janeiro – março de 2017), iremos:

  • começar os testes A/B para a front-end do novo recurso para análise e comentários da comunidade. (tarefa T145917) Em andamento Em andamento
  • continuar a desenvolver e melhorar o backend desse recurso Em andamento Em andamento
  • O primeiro teste A/B/C foi feito, mas não mostrou-se muito conclusivo (tarefa T149806) Yes Concluído
  • Um segundo teste A/B será executado, após a correção de um pequeno bug na interface e a adição de quatro outras Wikipédias ao teste, de um total de oito. (tarefa T160004) Incompleto Parcialmente concluído

Quarto

Abril – junho de 2017:

  • análise conclusiva do segundo teste A/B para os novos resultados da página de pesquisa (tarefa T160008) Incompleto Parcialmente concluído
  • lançar uma nota às esplanadas anunciando a implantação (tarefa T162276) Em andamento Em andamento
  • lançar uma postagem no blog sobre a pesquisa
  • implantar em todas as Wikipédias

Exemplos atuais da pesquisa

Já há algumas soluções feitas pela comunidade que divulgam outros projetos da Wikimedia e artigos no mesmo idioma. Abaixo, uma pequena lista de exemplos:

Páginas de resultados de pesquisa para alguns idiomas:

Gadget External Search:

Como esses resultados adicionais seriam exibidos?

O surgimento destes resultados está aberto para discussão, e temos esboços suficientes abaixo com mais possibilidades de design. Abaixo há alguns exemplos de como os novos resultados poderiam parecer, baseando-se em soluções existentes em algumas wikis:

Ajude-nos a escolher a solução

Por favor, diga o que você acha!

  • Dois trimestres serão necessários, pelo menos, para fazer a arquitetura e o design da implementação técnica.
  • A equipe gostaria de fazer alguns testes e mostrá-los para a comunidade no final de 2016.

As perguntas

A equipe tem várias perguntas, e isto é o que gostaríamos de saber da comunidade:

  1. Como esses novos resultados de pesquisa devem ser exibidos?
    1. Exibir os resultados locais primeiro e então exibir uma opção para mostrar mais de outras wikis?
    2. Juntar os resultados adicionais com os locais?
    3. Exibir os resultados adicionais ao lado (ou ao final) da página?
    4. Ter uma opção para desativar esses outros resultados relevantes?
      • Isso poderia ser uma keyword ou um botão para um visitante clicar.
      • Ou algo semelhante à keyword local:, que pesquisa por imagens locais, não no Commons.
    5. Exibir os resultados adicionais como lista ou grade?
    6. Incluir metadados relevantes (imagens e/ou descrições curtas) com os resultados?
    7. Exibir o tamanho do arquivo (p. ex. 848 bytes (104 palavras)) e a data de criação/modificação?
    8. Indicar que clicar num resultado levaria o usuário a outra wiki?
    9. Quantos resultados interwiki devem ser mostrados – 1, 2, 3 ou mais?
    10. Limitar o método existente de exibir resultados da wiki local?
      • Atualmente, até 10 000 resultados são exibidos de forma paginada, mas testes indicam que geralmente apenas os 3 primeiros são úteis.
    1. Should the results from whatever wiki you're on to be shown first and then have an option to show more from other wikis?
    1. Should the additional results be inter-mixed with the local wiki results?
    1. Should the additional results be displayed off to the side (or maybe the bottom) of the results page?
    1. Should we have the option to turn off these other relevant search results (a user and/or project opt-out)?
      • This could be a keyword search term or maybe a button for a visitor to click
      • This could also be similar to the local: keyword that will only search for images on the local wiki and not Commons files, for instance.
    1. Would the additional results be best displayed as a list or a grid design?
    1. Should we include relevant metadata (images and/or a short description) with the search results?
    1. Do the results need to have the size of the article (i.e.: 848 bytes (104 words)) and the date it was created/modified?
    1. Should we indicate that clicking on a result will take you to another wiki project?
    1. How many results from other wikis should we show - 1, 2, 3, or more?
    1. Should we limit the existing method of displaying results from the wiki that you searched on?
      • We currently show up to 10,000 results in a paginated manner, but testing shows that generally only the first 3 results are ever acted upon.
  1. Esses novos resultados de pesquisa devem funcionar em todos os projetos da Wikimedia?
    1. Por exemplo, se você estiver no Wikiquote, gostaria de ver resultados relevantes do Wikivoyage, da Wikipédia e do Wikinotícias?
    2. Ou, se na Wikipédia, apenas gostaria de ver resultados de outras wikis?
  2. Esses outros resultados relevantes seriam úteis e estimulariam uma exploração profunda ao tópico?
    1. É “chato” ver resultados de outras wikis?
    2. Reciprocamente, estimularia o usuário ter mais conhecimento?
    3. Quanto “peso” damos para os resultados interwiki?
  3. Contribuições serão estimuladas pela exibição de resultados adicionais de outras wikis?
    1. P. ex.: se pesquisar por Piazza del Duomo e não ver um artigo no Wikivoyage sobre a praça (digamos que você esteja no Wikiquote), isso estimularia você a começar um artigo sobre ela?
  4. Devemos limitar o número de idiomas pesquisados?
    1. P. ex.: apenas usar os 50 idiomas principais para implementar o recurso?
    2. Ou, apenas usar os idiomas aos quais estamos detectando filas?

See also: Explore similar, Wiktionary widget, thumbnail icons in search results

Etiquetas no Phabricator:

Notas de discussão:

Após levar em consideração os comentários da comunidade e as recomendações da equipe de design, iremos iniciar os testes A/B. Veja esta página para mais informações.

Esta página foi criada para encorajar usuários a testarem o recurso, através de uma página auto-guiada com exemplos para aqueles que não são tão técnicos e aqueles são um pouco mais experientes.