Jump to content

Tiện ích:Proofread Page

From mediawiki.org
This page is a translated version of the page Extension:Proofread Page and the translation is 84% complete.
Outdated translations are marked like this.
Cẩm nang phần mở rộng MediaWiki
Proofread Page
Trạng thái phát hành: ổn định
Cài đặt Page action , ContentHandler , Tag , API , Database
Mô tả The Proofread Page extension can render a book either as a column of OCR text beside a column of scanned images, or broken into its logical organization (such as chapters or poems) using transclusion.
Tác giả ThomasV (original author)
Tpt (current maintainer)
Phiên bản continuous updates
Compatibility policy Snapshots releases along with MediaWiki. Master is not backward compatible.
MediaWiki current master
PHP 7.0+
Database changes
Composer mediawiki/proofread-page
Tables pr_index
Giấy phép GNU General Public License 2.0 or later
Tải xuống
Help Help:Extension:ProofreadPage
Ví dụ s:Index:Wind in the Willows (1913).djvu
Page, Index
  • $wgProofreadPagePageJoiner
  • $wgProofreadPagePageSeparator
  • $wgProofreadPageNamespaceIds
  • $wgProofreadPageEnableEditInSequence
  • $wgProofreadPageBookNamespaces
  • $wgProofreadPageUseStatusChangeTags
  • $wgProofreadPagePageSeparatorPlaceholder

  • pagequality
  • pagequality-admin
  • pagequality-validate
Translate the Proofread Page extension if it is available at translatewiki.net
Phản hồi Open tasks · Báo cáo lỗi

Proofread Page extension

2020 Coolest Tool
Award Winner

in the category
Impact


Tiện ích mở rộng Proofread Page cũng tạo ra một cuốn sách:

  1. dưới dạng một cột văn bản OCR bên cạnh một cột hình ảnh được quét hoặc
  2. được chia thành các chương hoặc bài thơ. Nội dung của tài liệu xuất hiện trong trang MediaWiki (thông qua loại trừ).

Phần mở rộng nhằm mục đích cho phép dễ dàng so sánh văn bản với bản gốc số hóa.

Tiện ích mở rộng này hiển thị văn bản theo nhiều cách mà không thực sự sao chép văn bản gốc.[1]

Sử dụng

Tiện ích mở rộng này được cài đặt trên tất cả wiki Wikisource. Đối với cú pháp, xem $1. Tiện ích cũng được sử dụng trên Bibliowiki.

Yêu cầu và khuyến nghị

  • Cần có quyền truy cập vào dòng lệnh nếu chạy tập lệnh cập nhật (maintenance/update.php) từ trình duyệt web không thành công (tài liệu tại đâytại đây).


Cài đặt

Tiện ích

  • Download and move the extracted ProofreadPage folder to your extensions/ directory.
    Developers and code contributors should install the extension from Git instead, using:cd extensions/
    git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage
  • Thêm mã sau vào dưới cùng tệp $LocalSettings của bạn:
    wfLoadExtension( 'ProofreadPage' );
    
  • Chạy mã cập nhật mà sẽ tự động tạo các bảng cơ sở dữ liệu mà phần mở rộng này cần.
  • Yes Xong – Chuyển tới Special:Version trên wiki của bạn để xác nhận phần mở rộng được cài đặt thành công.

Hình thu nhỏ

Tiện ích mở rộng liên kết trực tiếp đến hình thu nhỏ của hình ảnh thường không tồn tại. Bạn phải phát hiện lỗi 404 và tạo các hình thu nhỏ bị thiếu. Bạn có thể làm điều này với một trong các giải pháp sau:

  • Đặt Apache RewriteRule trong .htaccess thành thumb.php cho các hình thu nhỏ bị thiếu:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
  • hoặc đặt trình xử lý Apache 404 thành thumb-handler của Wikimedia. Đây là trình xử lý 404 có mục đích chung với mã dành riêng cho Wikimedia, không chỉ đơn giản là trình tạo hình thu nhỏ.
    ErrorDocument 404 /w/extensions/upload-scripts/404.php
  • Đối với phiên bản MediaWiki >= 1.20, bạn có thể chỉ cần đổi hướng đến thumb_handler.php:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
  • Hoặc trong apache2.conf:
    ErrorDocument 404 /w/thumb_handler.php
Cảnh báo Cảnh báo: Có một tập tin .htaccess trong thư mục hình ảnh có thể can thiệp vào bất kỳ quy tắc .htaccess nào bạn cài đặt.

If you encounter a problem similar to the following:

  • phab:T301291PDF and DjVu files on Commons failed to be processed (no thumbnails, zero pages) but otherwise valid
  • phab:T298417Undeleted DjVu files show incorrect metadata: 0x0 size, no page number info
  • phab:T299521PDF file has 0x0 image size in Commons after uploading a new version while the page number is correct

Try next steps:

  1. repair thumbnails for DjVu files of the core MediaWiki (for PDF use mimetype application/pdf )
    php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
    
  2. needed for actualization info about the pages counts of the Special:IndexPages
    php maintenance/refreshLinks.php --namespace 252
    

Không gian tên

ProofreadPage sẽ tạo theo mặc định hai không gian tên tùy chỉnh có tên là "Trang" và "Chỉ mục" bằng tiếng Anh với id tương ứng là 250 và 252.

Tên của chúng sẽ được dịch nếu wiki của bạn sử dụng ngôn ngữ khác. Danh sách đầy đủ.

Bạn có thể tùy chỉnh tên hoặc ID của các không gian tên này: Tạo không gian tên bằng tay và đặt id của chúng trong Thủ công:LocalSettings.php bằng cách sử dụng $wgProofreadPageNamespaceIds toàn cục. Ví dụ như sau:

define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
    'index' => NS_PROOFREAD_INDEX,
    'page' => NS_PROOFREAD_PAGE
);

Tùy chỉnh id không gian tên không được khuyến nghị và có thể không được hỗ trợ trong tương lai.

Cấu hình

Cấu hình không gian tên chỉ mục

Để biết thêm thông tin, xem Extension:Proofread Page/Index data configuration .

Cấu hình là một mảng thuộc tính JSON. Đây là cấu trúc của một thuộc tính trong mảng, tất cả các tham số là tùy chọn, giá trị mặc định được đặt:

{
  "ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
    "type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
    "size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
    "values":  {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
    "default": "", //the default value
    "header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
    "label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
    "help": "", //a short help text
    "delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
    "data": "" //proofreadpage's metadata type that the property is equivalent to
  }
}

Tham số dữ liệu có thể có giá trị: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"

Tách trang

Tiện ích mở rộng đặt dấu phân cách giữa mọi trang được nhúng và trang tiếp theo, được xác định bằng wgProofreadPagePageSeparator. Giá trị mặc định là   (khoảng trắng). Đặt wgProofreadPagePageSeparator = "" để chặn dấu tách.

Nối các từ được gạch nối giữa các trang

Khi một từ được gạch nối giữa một trang và trang tiếp theo, phần mở rộng sẽ nối hai nửa của từ lại với nhau. Ví dụ: his-tory trở thành history. Ký tự "joiner" được xác định bởi wgProofreadPagePageJoiner và mặc định là '-' (ký tự ASCII gạch nối).

Định cấu hình gắn thẻ thay đổi (tùy chọn)

Xem Thay đổi gắn thẻ để thiết lập thẻ thay đổi.

Cách sử dụng

Tạo trang đầu tiên của bạn (ví dụ với DjVu)

  • Trước khi làm theo các bước này, hãy đảm bảo bạn đã làm theo hướng dẫn tại Manual:How to use DjVu with MediaWiki .
  • (tệp djvu được tải lên khi nào và trong không gian tên nào?)
  • Tạo một trang trong không gian tên "Trang" (hoặc tên được quốc tế hóa nếu bạn sử dụng wiki không phải tiếng Anh). Ví dụ: nếu không gian tên của bạn là 'Page', hãy tạo Page:Carroll - Alice's Adventures in Wonderland.djvu
  • Tạo tệp tương ứng cho trang này commons:File:Carroll - Alice's Adventures in Wonderland.djvu (hoặc đặt Manual:$wgUseInstantCommons thành true).
  • Tạo trang chỉ mục Index:Carroll - Alice's Adventures in Wonderland.djvu
    • Chèn thẻ ‎<pagelist /> vào trường Trang để trực quan hóa danh sách trang
  • Để chỉnh sửa trang 5 của cuốn sách, hãy điều hướng đến 'Page:Carroll - Alice's Adventures in Wonderland/5' và nhấp vào chỉnh sửa

Cú pháp

Tiện ích mở rộng này giới thiệu các thẻ sau: ‎<pages>, ‎<pagelist>

Ghi chú

  1. Vì các trang không nằm trong không gian tên chính nên chúng không được đưa vào thống kê số lượng đơn vị văn bản.

Xem thêm