Lecture/Web/Fonctionnalité du PDF
Mise à jour pour la génération du PDF, le 15 juillet 2019
Nous avons mis à disposition le nouveau générateur de PDF. Nous attendons les retours, mais nous n'avons pas observé jusqu'à présent de problèmes particuliers. Nous pourrions ajouter quelques suggestions , mais nous voulons préciser qu'il ne s'agit pas là d'un projet actif avec des développements continus. En d'autres termes, maintenant qu'il est déployé et qu'il a prouvé son fonctionnemenent, le nouveau générateur est passé en mode maintenance. La page de discussion de cette page ne sera pas abandonnée, mais cela peut prendre un certain temps avant que quelqu'un ne réagisse, simplement parce qu'il est aussi en charge de beaucoup d'autres tâches.
En ce qui concerne les livres, nous avons laissé le sujet entre les mains de développeurs volontaires et de PediaPress. Nous serons heureux de leur faire parvenir vos questions mais nous n'envisageons pas d'évolution dans le sens technique.
Mise à jour pour la génération du PDF, le 4 juin 2019
Nous avons déployé sur tous les projets, le nouveau générateur de PDF d'articles uniques. Nous espérons que cela résoudra les problèmes liés au générateur Electron qui était souvent instable dans la génération des PDF comme attendu. Veuillez essayer le nouveau générateur et faites-nous part de vos questions ou si vous rencontrez des bogues ou d'autres problèmes.
Mise à jour pour la génération du PDF, le 18 mars 2019
Nous sommes proches du déploiement de notre nouveau générateur, Proton, mais il reste encore quelques tâches bloquantes (comme vous pouvez le voir sur la graphe des tâches dans phab:T181084). Nous publierons une autre mise à jour quand la date de déploiement sera connue. Ce générateur va remplacer le générateur electron en tant que générateur PDF par défaut pour les PDF d'une seule page.
Mise à jour des livres du 17 août 2018
Voici un exemple actualisé et plus complet du nouveau service de rendu de livres. La mise en page a considérablement changé depuis la première version présentée lors de Wikimania. Merci pour tous les retours. L'export présente encore un certain nombre de problèmes : sauts de page, infoboxes, tableaux et formules mathématiques doivent être substantiellement améliorées. Cet exemple centré sur les différents systèmes d'écriture internationaux et les formules mathématiques révèle certains des problèmes encore à résoudre. Actuellement les formules sont rendues en utilisant MathML, et utiliser LaTeX à la place devrait apporter des améliorations significatives.
Mise à jour des livres, le 8 août 2018
Nous avons travaillé avec PediaPress sur la génération et la mise en forme des nouveaux livres. Ils nous ont fournis un échantillon de la sortie de courante, qui sera très semblable à la version finale. Nous avons discuté les points d'amélioration avec l'équipe PediaPress, qui les étudie actuellement. Si vous avez un avis ou des commentaires sur ces échantillons, veuillez les écrire sur la page de discussion.
Mise à jour des livres, avril 2018
La fonction de génération des livres reviendra grâce à PediaPress. Après avoir investigué sur le nouveau générateur PDF en profondeur, nous nous sommes rendus compte que les caractéristiques principales du générateur de livre original (tel que la numérotation des pages et le sommaire) seraient très difficiles à implémenter en utilisant le nouveau générateur. De plus, nous avons eu des problèmes significatifs avec notre code de concaténatión. Donc, nous avons dû chercher des solutions alternatives pour récupérer la fonctionnalité des livres PDF dans les projets Wikimedia. Nous nous avons contacté PediaPress, qui était le sponsor original des livres de Wikipédia, pour voir s'ils seraient intéressés pour reprendre à nouveau la génération des livres PDF. Ils ont approuvé et nous travaillons actuellement sur les détails et le calendrier. Ils commenceront le travail sur une solution temporaire basée sur une technologie plus ancienne que celle utilisée pour créer les PDFs. Ceci peut avoir quelques désavantages lorsqu'il s'agit d'éléments graphiques tels que les cartes, mais ce sera une solution de travail plus rapide. Ensuite ils envisagent de travailler sur un nouveau générateur HTML vers PDF, basé sur les commentaires reçus à propos de la première solution.
Mise à jour de janvier 2018
Nous préparons actuellement les tests de performance concernant la fonction du livre PDF. Nous devrions en savoir plus début février.
Mise à jour de septembre 2017
Notre service actuel de rendu en pdf, l'offline content generator (OCG) ne sera plus maintenu. Il cessera de fonctionner. L'équipe Reading team de la Fondation Wikimédia a travaillé plusieurs mois pour le remplacer. OCG fonctionnait avec un code obsolète susceptible d'introduire des problèmes de sécurité et d'autres problèmes majeurs dans le futur. Durant les trois derniers mois, nous avons placé des bandeaux sur la page de création des pdf afin d'obtenir des commentaires en retour concernant le prototype de notre nouveau moteur de rendu. Le nouveau générateur aura des fonctionnalités améliorées par rapport à OCG, il pourra imprimer les tableaux et les boîtes d'information et utilisera des styles visant à une meilleure lisibilité. Nous avons reçu une bonne quantité de commentaires positifs à propos du prototype et nous travaillons pour incorporer les actualisations nécessaires à nos nouveaux pdf.
Ajout postérieur: désactivation à court terme de la génération des livres en PDF
Malheureusement, les problèmes majeurs que rencontre notre ancien moteur de rendu (OCG) nous obligent à le supprimer en tant qu'option de génération avant de pouvoir terminer les mises à jour nécessaires pour la fonction de création de livres. Cela arrive plus tôt que prévu. Au moment où nous supprimerons OCG, le travail nécessaire pour la création de fichier mono article sera terminé. Néanmoins, la génération des livres sera suspendue le temps d'évaluer et de terminer le travail nécessaire. Notre choix initial de générateur pour le remplacement (le service de rendu Electron) n'est pas capable de prendre en charge les PDF de tailles plus grandes et échoue lorsqu'il faut générer un livre à partir de plusieurs articles. Nous allons travailler sur la sélection d'un nouveau système de génération des livres qui puisse gérer la taille des fichiers et prendre en charge nos besoins. Il ne s'agit pas d'indiquer comment cela va se faire. Il n'a jamais été question de supprimer temporairement la fonctionnalité de génération des livres PDF.
Calendrier :
- Diffusion du générateur entièrement fonctionnel pour les articles uniques (impression en pdf) – 1er octobre 2017
- La génération des livres PDF est suspendue - 1 octobre 2017
- Extinction du générateur OCG – 1 octobre 2017
- Diffusion d'un nouveau générateur de PDF – janvier 2018 (tentative basée sur les résultats de la recherche de systèmes alternatifs de rendu)
Fonctionnalité :
Pour une liste complète des fonctionnalités actuelles et celles à venir, voir ci-dessous.
En plus de la mise à jour de cette page, cela sera communiqué dans une bannière sur la page de création des PDF dans les Actualités techniques et sur certaines listes de diffusion Wikimedia.
Introduction
Notre moteur de rendu PDF actuel, le offline content generator, n'est plus maintenable. En clair, il est en panne. Créé initialement par un tiers, il fonctionne actuellement avec un code obsolète qui peut introduire des vulnérabilités de sécurité et d'autres problèmes majeurs à l'avenir. Si nous voulons conserver la fonctionnalité de création de PDF, nous devons le remplacer, ou nous pourrions soudainement nous retrouver dans la situation de devoir le désactiver sans avoir d'alternative.
De plus, il ne prend pas en charge un nombre de demandes de génération émanant de la communauté, la principale étant la possibilité de générer les tableaux. Nous avons choisi un nouveau service qui est une remplaçant compatible : le service de génération Electron. L'étape suivante sera de dupliquer la fonctionnalité fournie par OCG en utilisant le service de génération Electron. Ci-dessous, nous décrivons les parties principales de la fonctionnalité que nous avons identifiées comme nécessaires. Nous vous invitons à discuter sur ce qui manque ou ce qui est superflu dans la liste fournie. Nous voudrions aussi parler de nos plans futurs pour la génération du PDF afin de constituer déja une liste initiale de commentaires.
Problèmes connus
- Il existe actuellement un bogue dans Firefox (flux montant) qui impacte le format des boîtes d'information affichées sur de multiples pages. L'avancement de Mozilla peut être suivi ici : https://bugzilla.mozilla.org/show_bug.cgi?id=688556.
Base utilisateur
Le tableau suivant donne un exemple de traffic vers le service « Télécharger comme PDF » de Electron sur une période de 6 heures. Le trafic est présenté en fonction du système d'exploitation (OS), du type de navigateur et de sa version majeure (par exemple Windows 7, Chrome v61.*). Remarquez que la majorité du trafic semble provenir de machines basées sur Windows.
OS | Navigateur | Version majeure du navigateur | % de requêtes |
---|---|---|---|
Autre | Autre | - | 14.38 |
Windows 7 | Chrome | 61 | 12.42 |
Windows 10 | Chrome | 61 | 8.83 |
Windows 7 | IE | 11 | 7.33 |
Windows 7 | Firefox | 56 | 6.59 |
Windows 10 | Firefox | 56 | 3.82 |
Windows 10 | Edge | 15 | 3.24 |
Windows 8.1 | Chrome | 61 | 3.07 |
Windows XP | Chrome | 49 | 2.2 |
Windows 10 | Chrome | 59 | 1.53 |
Windows 10 | IE | 11 | 1.51 |
Windows 8.1 | Firefox | 56 | 1.31 |
Windows XP | Firefox | 52 | 1.22 |
Windows 8 | Chrome | 61 | 1.15 |
Windows 8.1 | IE | 11 | 1.15 |
Mac OS X | Safari | 11 | 0.9 |
Windows 7 | Firefox | 53 | 0.89 |
Windows 7 | Firefox | 52 | 0.78 |
Ubuntu | Firefox | 56 | 0.78 |
Windows XP | IE | 6 | 0.7 |
Windows 7 | Chrome | 55 | 0.68 |
Windows 7 | Firefox | 55 | 0.62 |
Mac OS X | Chrome | 61 | 0.62 |
Android | UC Browser | 11 | 0.6 |
Windows 10 | Edge | 14 | 0.59 |
Windows 7 | Opera | 48 | 0.53 |
Android | Chrome Mobile | 61 | 0.49 |
Windows 10 | Opera | 48 | 0.44 |
Windows 7 | Chrome | 60 | 0.4 |
Windows Vista | Chrome | 49 | 0.39 |
Windows 7 | Yandex Browser | 17 | 0.37 |
Windows 10 | Firefox | 55 | 0.37 |
Mac OS X | Safari | 10 | 0.36 |
Windows 10 | Chrome | 50 | 0.34 |
Android | Android | 4 | 0.33 |
Mac OS X | Firefox | 56 | 0.33 |
Windows 10 | Chrome | 60 | 0.32 |
Windows 8.1 | Chrome | 43 | 0.3 |
Android | Amazon Silk | 60 | 0.29 |
Windows 7 | Sogou Explorer | 1 | 0.27 |
Windows 8 | IE | 10 | 0.26 |
Windows 7 | IE | 8 | 0.26 |
Windows 7 | IE | 9 | 0.25 |
Windows 8 | Opera | 12 | 0.25 |
Linux | Firefox | 52 | 0.25 |
Mac OS X | Firefox | 53 | 0.24 |
Windows 7 | Firefox | 45 | 0.24 |
Windows 10 | Firefox | 57 | 0.24 |
Windows 7 | Firefox | 38 | 0.22 |
Windows 10 | Firefox | 47 | 0.21 |
Exigences de la fonctionnalité actuelle
Voici une liste des exigences actuelles pour le rendu en PDF des documents PDF concernant un seul article et pour les livres. Les exigences différentes de l'implémentation actuelle sont affichées en gras.
Historique
- Le rendu des articles en PDF et des livres provenant des pages de Wikipedia est géré par un service appelé OCG. Lorsque vous créez des livres à travers le créateur de livre, il utilise OCG intégré à l'extension Collection . OCG présente plusieurs problèmes, en particulier avec des tableaux.
- Plusieurs problèmes à propos de OCG ont été identifiés, y compris les remarques de la communauté concernant l'impossibilté de OCG à générer les tableaux.
- La génération des tableaux apparaît en position 9 dans la liste des souhaits de la Communauté technique de langue allemande.
- Wikimedia Deutschland a commencé à travailler sur une solution pour générer les tableaux en PDF, et a présenté Electron. Ils l'ont envisagé comme solution parallèle à OCG et non pas pour le remplacer.
- Au même moment que Wikimedia Deutschland travaillait sur le service Electron, les responsables de la maintenance du service OCG à la Fondation Wikimedia ont conclus que OCG devait être remplacé.
- L' équipe Reading de la WMF a pris en charge la responsabilité de la maintenance à long terme de la génération des PDF et a commencé à planifier l'implémentation de la génération des tableaux pour tous les projets.
- L'équipe Reading lance une consultation sur la communauté pour recevoir les commentaires concernant Electron.
- Les équipes Reading Infrastructure et Web commencent à évaluer le travail nécessaire pour porter la fonctionnalité OCG sur le service Electron.
Mise à jour après consultation
Nous avons lancé une consultation sur l'implémentation actuelle du générateur de PDF début juin 2017. Après la revue des réponses, nous avons fait les observations suivantes :
- Un nombre plus grand d'utilisateurs ont préféré le format sur une seule colonne plutôt que deux
- Les utilisateurs qui préfèraint le format sur deux colonnes on fait remarquer que leur préférence était basée sur le style et la présentation sur deux colonnes. Certains utilisateurs ont aussi exprimé leur problèmes avec la taille de la fonte et le gâchis de papier lorsque l'on choisissait d'imprimer les PDFs sur une seule colonne.
- Les demandes de fonctionnalités suivantes ont été faites :
- Hyperliens fonctionnels
- Date et Url, 'cette page a été téléchargée le [date] de [URL]'
- Css personnalisable pour l'affichage, le titre, le sommaire
- Option 2 pour le format des colonnes
- Inclure/exclure les versions des images
- Marges modifiables
- impression par section - vous permet de supprimer les références, les paragraphes que vous ne voulez pas, l'index, etc...
- permet la taille configurable du texte
En fonction des commentaires reçus, nous avons intégré ce qui suit, dans nos nouveaux styles d'impression :
- hyperliens
- information de l'article
- fonte plus petite et dans le style des livres
Le reste des requêtes ci-dessus sera mis en attente jusqu'à la seconde itération du générateur de PDF, dans lequel nous voudrions intégrer un mode de configuration qui permettrait de personnaliser les options disponibles.
Proposition
Voici une proposition pour la portée des fonctionnalités nécessaires au rendu PDF :
- Les articles individuels seront générés en PDF en utilisant le lien « Télécharger comme PDF » dans la barre latérale.
- Les articles multiples seront générés en PDF en utilisant l'outil de création de livres
- Tous les articles afficheront le crédit pour le texte et les images
- Tous les PDF générés pourront imprimer les tableaux
- Les utilisateurs pourront personnaliser la présentation de leurs PDF (facultatif)
Différences entre l'implémentation actuelle et celle à venir
OCG | Nouveau service | Notes | |
---|---|---|---|
Générer les articles individuels | oui | oui | |
Générer des articles multiples en utilisant le créateur de livre | oui | oui | |
Contient le sommaire dans le cas d'articles multiples | oui | oui | |
Génère les tableaux | non | oui | |
Attribution | oui | oui | Question ouverte : emplacement des attributions dans le nouveau service |
Forme | Latex | Nouveaux styles | |
Affichage sur N colonnes | oui | non | |
Affichage par défaut sur 2 colonnes | oui | Essai | L'affichage par défaut sur une ou deux colonnes sera décidé en fonction des commentaires et des tests quantitatifs et/ou qualitatifs. |
Format de sortie | PDF, texte simple | PDF seulement |
Architecture
Les nouveaux styles des PDF seront conçus pour améliorer la lisibilité. En fonction des commentaires de la communauté et des tests qualitatifs ou quantitatifs, la prise en charge de l'affichage sur deux colonnes peut être faite pour le créateur de livres et/ou pour les PDFs individuels.
-
Exemples de la nouvelle sortie en PDF - les styles seront mis à jour en fonction des commentaires reçus
Feuille de route du développement et du déploiement
Voici une description détaillée de la feuille de route du développement et du déploiement. Elle est sujette à changements.
- avril - mai 2017 :
- L'équipe Reading crée le support dans le coeur pour la fonctionnalité identifiée ci-dessus
- Les communautés sont consultées sur l'extension ou la restriction des fonctionnalités proposées
- Test qualitatif réalisé pour l'application du style
- juin – juillet 2017 :
- Les nouveaux styles ont été implémentés
- La première itération est commencée en parallèle avec OCG sur tous les projets et on compare la performance
- Itérations basées sur les sondages et les cas aux limites identifiés
- août 2017 – septembre 2017
- Modifications supplémentaires réalisées si nécessaires
- octobre 2017
- Seconde itération démarrée sans OCG sur tous les projets
Articles individuels
- Un PDF par article sera créé en sélectionnant le lien « Télécharger comme PDF »
- En sélectionnant « Télécharger comme PDF », le fichier PDF sera généré. Pour le télécharger, il faudra sélectionnez le lien « Télécharger le fichier »
- Chaque fichier PDF contiendra :
- Titre de l'article et texte
- Boîte d'information (si nécessaire)
- Tableaux (si nécessaire)
- Présentation sur une seule colonne
- Numéro de page
- Toutes les images d'articles avec les légendes
- Liens vers les pages liées à cet article (liens en bleu et liens externes)
- Sources du texte et des images, contributeurs, et licences
Suivi sur Phabricator
Toutes les modifications relatives aux PDF y compris le déclin de OCG, remplaçant du générateur de PDF Electron, et toutes les mises à jour concernant les livres ou l'extension des collections sont suivies dans le projet Phabricator Proton. La page du projet affichera les dernières mises à jour pour toutes les tâches liées aux PDFs.
Livres
Fonctionalité disponible à partir d'octobre 2017
Note : aucune modification ne sera apportée au flux de travail courant du créateur de livres à l'heure actuelle
- Les utilisateurs appellent la création de livres en choisissant « Créer un livre »
- Ceci les amène sur la page de création du livre en cours
- Pour télécharger un livre, l'utilisateur sélectionne le lien télécharger à partir de la page du livre
- Les utilisateurs ne peuvent télécharger que des livres au format pdf
- Les livres contiennent tous les éléments en partant du format d'un simple article jusqu'à :
- Page du titre du livre
- Les références de chaque article du livre apparaîtront à la fin de l'article
- Chaque article commencera sur une nouvelle page
- Une section unique pour les sources du texte et des images, les contributeurs et les licences, des contributions collectées à partir de chaque article
Fonctionnalité disponible en novembre - décembre 2017
- Les livres auront un sommaire avec les numéros des pages
- En choisissant une section dans le sommaire, vous serez amené à la section correspondante du livre
Les styles des livres seront mis à jour pour améliorer la lisibilité
Autres solutions
Il existe une autre solution pour exporter MediaWiki en LaTeX, PDF, ODT ou EPUB :
http://mediawiki2latex.wmflabs.org/
Les ressources computationnelles sur le serveur sont limitées.
Si vous utilisez Linux Ubuntu et que vous voulez les résultats plus rapidement, vous pouvez installer le paquet m2l-pyqt
ou mediawiki2latex
.