Jump to content

Додаток:Proofread Page

From mediawiki.org
This page is a translated version of the page Extension:Proofread Page and the translation is 100% complete.
Довідка про розширення MediaWiki
Proofread Page
Статус релізу: стабільний
Реалізація Дія сторінки , ContentHandler , Тег , API , База даних
Опис The Proofread Page extension can render a book either as a column of OCR text beside a column of scanned images, or broken into its logical organization (such as chapters or poems) using transclusion.
Автор(и) ThomasV (original author)
Tpt (current maintainer)
Найновіша версія continuous updates
Compatibility policy Snapshots releases along with MediaWiki. Master is not backward compatible.
MediaWiki current master
PHP 7.0+
Зміни в БД Так
Composer mediawiki/proofread-page
Таблиці pr_index
Ліцензія GNU General Public License 2.0 or later
Завантажити
Help Help:Extension:ProofreadPage
Приклад s:Index:Wind in the Willows (1913).djvu
Page, Index
  • $wgProofreadPagePageJoiner
  • $wgProofreadPagePageSeparator
  • $wgProofreadPageNamespaceIds
  • $wgProofreadPageEnableEditInSequence
  • $wgProofreadPageBookNamespaces
  • $wgProofreadPageUseStatusChangeTags
  • $wgProofreadPagePageSeparatorPlaceholder

  • pagequality
  • pagequality-admin
  • pagequality-validate
Translate the Proofread Page extension if it is available at translatewiki.net
Issues Open tasks · Report a bug

Proofread Page extension

2020 Coolest Tool
Award Winner

in the category
Impact


Додаток Proofread Page також створює книгу:

  1. у вигляді стовпчика тексту OCR поруч зі стовпчиком відсканованих зображень, або
  2. з розбиттям на розділи або вірші. Вміст документа з'являється на сторінці MediaWiki (через включення).

Додаток призначений для легкого порівняння тексту з оригінальною оцифровкою.

Цей додаток відображає текст кількома способами, фактично не дублюючи оригінальний текст.[1]

Використання

Додаток встановлюється на всі Вікіджерела. Для синтаксису, подивіться s:mul:Wikisource:ProofreadPage за допомогою документації WikiSource Proofread Page. Раніше він також використовувався на Бібліовікі.

Вимоги та рекомендації

  • Доступ до командного рядка потрібен, якщо запуск сценарію оновлення (maintenance/update.php) з веб-браузера не вдасться (див. Документація з оновлення та Update.php документація).
  • Якщо ви хочете використовувати файли DjVu (необов'язково, але рекомендовано), для конфігурації має бути доступний власний обробник DjVu. Див. також Manual:How to use DjVu with MediaWiki .
  • Крім того, використання ProofreadPage значно покращується завдяки використанню наступних розширень:


Встановлення

Розширення

  • Завантажте і розмістіть файли в каталозі з назвою ProofreadPage у вашій extensions/ папці.
    Розробники та автори коду повинні замість цього встановити розширення з Git, використовуючи:cd extensions/
    git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage
  • Додайте такий код унизу вашого файлу LocalSettings.php :
    wfLoadExtension( 'ProofreadPage' );
    
  • Запустіть скрипт оновлення, який автоматично створить необхідні таблиці бази даних, які потрібні цьому розширенню.
  • Yes Готово – Перейдіть до Special:Version вашої вікі, щоб переконатися, що розширення встановлено успішно.

Ескізи

Розширення посилається безпосередньо на мініатюри зображень, яких часто не існує. Ви повинні відстежувати помилки 404 і генерувати відсутні мініатюри. Ви можете зробити це за допомогою будь-якого "одного" з цих рішень:

  • Встановіть Apache RewriteRule за .htaccess до thumb.php для відсутніх мініатюр:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
  • або встановіть обробник 404 Apache на thumb-handler Вікімедіа. Це обробник 404 загального призначення зі специфічним для Вікімедіа кодом, а не просто генератор мініатюр.
    ErrorDocument 404 /w/extensions/upload-scripts/404.php
  • Для MediaWiki >= 1.20 ви можете просто перенаправляти на thumb_handler.php:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
  • або в apache2.conf:
    ErrorDocument 404 /w/thumb_handler.php
Увага Увага: У каталозі зображень є файл .htaccess, який може перешкоджати будь-яким правилам .htaccess, які ви встановлюєте.

Якщо ви зіткнулися з проблемою, подібною до наведеної нижче:

  • phab:T301291 – PDF- та DjVu-файли на Вікісховищі не вдалося обробити (немає мініатюр, нуль сторінок), але в іншому вони дійсні
  • phab:T298417 – Невидалені DjVu-файли показують неправильні метадані: Розмір 0x0, немає інформації про номер сторінки
  • phab:T299521 – PDF-файл має розмір зображення 0x0 у Вікісховищі після завантаження нової версії, хоча номер сторінки правильний

Спробуйте наступні кроки:

  1. відновити мініатюри для DjVu-файлів ядра MediaWiki (для PDF використовуйте MIME тип application/pdf)
    php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
    
  2. необхідну для актуалізації інформацію про кількість сторінок Special:IndexPages
    php maintenance/refreshLinks.php --namespace 252
    

Простори назв

ProofreadPage створить за замовчуванням два користувацькі простори імен "Page" та "Index" англійською мовою з ідентифікаторами 250 та 252 відповідно.

Їхні назви перекладаються, якщо у вашій вікі використовується інша мова. Full list.

Ви можете налаштувати їхні назви або ідентифікатори: Створення просторів назв вручну і встановити їхні ідентифікатори у Manual:LocalSettings.php за допомогою $wgProofreadPageNamespaceIds global. Ви зробите щось на кшталт:

define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
    'index' => NS_PROOFREAD_INDEX,
    'page' => NS_PROOFREAD_PAGE
);

Налаштування ідентифікатора простору імен не рекомендується і може не підтримуватися у майбутньому.

Конфігурація

Конфігурація простору імен покажчиків

Для більш детальної інформації див. Extension:Proofread Page/Index data configuration

Конфігурація являє собою масив властивостей JSON. Ось структура властивості в масиві, всі параметри не є обов'язковими, встановлюються значення за замовчуванням:

{
  "ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
    "type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
    "size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
    "values":  {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
    "default": "", //the default value
    "header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
    "label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
    "help": "", //a short help text
    "delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
    "data": "" //proofreadpage's metadata type that the property is equivalent to
  }
}

Параметр data може мати значення for: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"

Розділювач сторінок

Розширення ставить роздільник між кожною виключеною сторінкою і наступною, який визначається значенням wgProofreadPagePageSeparator. Значення за замовчуванням -   (пробіл). Встановіть wgProofreadPagePageSeparator = "", щоб приховати роздільник.

З'єднання слів через дефіс на різних сторінках

Коли слово переноситься через дефіс між сторінками, розширення з'єднує дві половини слова. Приклад: "іс-" і "торія" стає "історія". Символ "з'єднувач" визначається wgProofreadPagePageJoiner і за замовчуванням дорівнює "-" (символ ASCII дефіс).

Налаштування тегування змін (необов'язково)

Щоб налаштувати мітки змін, див. Мітки змін.

Використання

Створення першої сторінки (приклад з DjVu)

  • Перед виконанням цих кроків переконайтеся, що ви виконали інструкції в Manual:How to use DjVu with MediaWiki .
  • (коли і в якому просторі імен завантажено сам DjVu-файл?)
  • Створіть сторінку в просторі імен "Page" (або інтернаціоналізовану назву, якщо ви використовуєте неанглійську вікі). Наприклад, якщо ваш простір імен 'Page', створіть Page:Carroll - Alice's Adventures in Wonderland.djvu
  • Створіть відповідний файл для цієї сторінки commons:File:Carroll - Alice's Adventures in Wonderland.djvu (або встановіть Manual:$wgUseInstantCommons на true).
  • Створіть індексну сторінку Index:Carroll - Alice's Adventures in Wonderland.djvu
    • Вставте тег ‎<pagelist /> у поле Pages для візуалізації списку сторінок
  • Щоб відредагувати сторінку 5 книги, перейдіть на 'Page:Carroll - Alice's Adventures in Wonderland/5' і натисніть "Редагувати"

Синтаксис

Це розширення вводить наступні теги: ‎<pages>, ‎<pagelist>

Примітки

  1. Оскільки сторінки не знаходяться в основному просторі імен, вони не враховуються при статистичному підрахунку текстових одиниць.

Див. також