Jump to content

MinT

From mediawiki.org
This page is a translated version of the page MinT and the translation is 36% complete.

MinT(ミンティー:Machine in Translation)は機械翻訳サービスの一種でオープンソースのニューラル機械翻訳モデルに基づきます。 当サービスはウィキメディア財団のインフラ上にホスティングされており、他の組織がリリースしたオープンソース・ライセンスの翻訳モデルと競合しません。 無料の知識エコシステムのインフラにとって公開の機械翻訳サービスは鍵となります。 このページでは当該のインフラをもっと多くの人に使えるように、当サービスを判定しようとするイニシアティブを記録します。

この MinT を試用するには、コンテンツ翻訳や翻訳ウィキのサイト translatewiki.net の各プロジェクトに組み込みを使用するか、直接、テスト例を体験できます。

Overview of MinT initiatives

Machine translation can be useful in different contexts. As more products make use of MinT for different purposes, it is useful to differentiate those different contexts. In this way, when users report a bug it is more clear where it needs to be fixed.

  • MinT Service. The backend service running open-source neural machine translation models.
    • MinT test instance. A basic interface to try the different translation models.
  • MinT for Translators. Initiative to integrate the MinT Service with tools that support other machine translaiton services such as Content Translation and the Translate Extension.
    • MinT Client for Content Translation. Client exposing the MinT Service as one of the machine translation services available in Content Translation.
    • MinT Client for Translate extension. Client exposing the MinT Service as one of the machine translation services available in the Translate extension.
  • MinT for Wiki Readers. Product to enable readers to use machine translation to read contents from other languages on a wiki.

You can read more below about each of the MinT initiatives.

参加する

フィードバックを提供するには協議ページに投稿してください。 改善計画はPhabricator にあがっていき改善の案を提示したり問題点を指摘したり、タスクが始まっていたらその進捗チェック、それに関する自分なりの視点を共有してください。 完了した工程の確認もでき、以下にある進捗状況のチェック欄をご参照ください。

MinTサービス

MinT サービスの設計では訳文を複数の機械翻訳モデルから提供します。 現在のところ、以下のモデルを使用しています:

  • NLLB-200。メタの研究チームが手がけた最新モデル No Language Left Behind project です。 当モデルは言語 200 件の翻訳に対応し、その中には他の業者がサポートしていない言語も含まれます。
  • OpusMT(オーパス・エムティー)。ヘルシンキ大学が開発したOPUS (Open Parallel Corpus) projectはフリーライセンスの多言語コンテンツをまとめて翻訳モデルOpusMT 翻訳モデル(オーパスMT)を訓練しています。 誰でもさまざまなプロジェクトに参加してデータをOPUSに提供すると、翻訳の質向上に手軽に貢献できます。 例えば利用者がウィキペディアの記事を訳すときにコンテンツ翻訳拡張機能を使うと、システム側は公開した訳文データを新しいリソースとして回収、同モデルの次のバージョンの翻訳の品質改善に役立てします。 あるいはまたTatoebaを使って訳文を提供すると、利用者が手軽に寄与するもう一つの方法になります。
  • IndicTrans2. The IndicTrans2 project provides translation models to support over 20 Indic languages. These models were developed by AI4Bharat@IIT Madras, a research group at the Indian Institute of Technology, Madras.
  • Softcatalà. Softcatalà is a non-profit organization with the goal to improve the use of Catalan in digital products. As part of the Softcatalà Translation project, translation models used in their translator service to translate 10 languages to and from Catalan have been released.
  • MADLAD-400. MADLAD-400 is a multilingual machine translation model by Google Research that supports 419 languages.

MinT supports over 200 languages, with more than 70 languages not supported by other services (including 27 languages for which there is no Wikipedia yet). You can read more about the initial release of MinT and check some frequently asked questions in the summary page for the service.

技術的な詳細

The translation models have been optimized for performance using OpenNMT Ctranslate2 library in order to avoid the need for GPU acceleration. This makes it easier for organizations and individuals to build and run their own instances. 詳細は以下をご確認ください:

MinT provides a platform to run multiple translation models. In order to support different initiatives, aspects such as sentence segmentation, language detection, pre/post-processing of contents, and rich format support has been developed on top of the plain-text based models.

Test instance

The MinT test instance is a basic interface to try the different translation models. It allow to translate contents across the selected language pairs and select the preferred translation model when multiple are available. This allows different communities to check how well the models support their language. This instance is intended for testing, so performance and availability may be reduced compared to other MinT-based products. You can check the availability status of the MinT test instance.

翻訳者に対してのMinT

MinTを利用するモバイル翻訳

翻訳は多言語利用者にとってウィキメディアエコシステムで貢献する一般的な方法です。 機械翻訳は利用者がレビューして改善するための有用な一次翻訳を提供できます。 言語チームは翻訳をワークフローの面で支援するツールを開発しました。このツールはプロセスを加速するために様々な機械翻訳サービスを統合できます。 MinTが利用可能になったら、 これらのツールを統合するのが影響力を増大させるための論理的な次のステップでした。 MinTは以下のプロジェクトで利用可能です:


ウィキ読者向けのMinT

読者がウィキペディアやその他のウィキから学ぶことができる話題と情報の量は、読者が話す言語に依存します。 機械翻訳は興味のある話題について自分の言語でコンテンツが手に入らないときに人々を助けることができます。

This initiative explores how to surface the machine translation support from MinT in Wikipedia articles in a way that:

  • Allows readers to learn more about the topics of interest from other languages.
  • Clearly differentiates automatically generated content from community-created one.
  • Encourages to access and contribute to community-created content when possible.

At the moment the Language team is working on the initial implementations for this initiative based on the research and the designs. Learnings based on data and community input will determine the next steps for the initiative.

さらに広く利用可能なMinT

Working on the previous initiatives will help to polish and solidify the system. For now, the MinT API is only available for Wikimedia products. As the system gets ready, we'll consider a wider exposure. Providing a service that can be used by communities in innovative ways can be a very powerful tool. New initiatives to make MinT more widely available will be captured here in the future. Meanwhile, feel free to configure your own MinT instance to experiment with it.

免責事項

  1. Accuracy of MinT’s Translations - MinTによって生成される翻訳の正確性は様々な場合があります。 翻訳は完全に正確ではなかったり、元のコンテンツの文脈で意図されていた意味が常に伝わっているわけではなかったりします。 ウィキメディアは自動的に翻訳されたコンテンツの正確性や妥当性について声明や保証をしていません。
  2. Limitation of Liability - Wikimedia, its affiliates, and employees are not liable for any direct, indirect, incidental, punitive, or consequential damages, including but not limited to damages for goodwill, use, data, or any other intangible losses arising out of or in connection with the use of MinT or translations generated with MinT.
  3. Creative Commons Compliance - MinTによって生成された翻訳は元のコンテンツに準拠する適切なクリエイティブ・コモンズ・ライセンスの下で二次的著作物とみなされます。 利用者は翻訳されたコンテンツを利用するときには、適用されるクリエイティブ・コモンズ・ライセンスの規約に従わなければなりません。
  4. Terms of Use and Privacy Policy - MinTの使用はウィキメディアの利用規約およびプライバシーポリシーに準拠します。

更新情報

2024年2月

2024年1月

2023年12月

2023年11月

2023年10月

2023年9月

A message well received by the attendees.

  • Research planning started with an initial draft of the research brief for MinT on Wikipedia
  • Continuing technical explorations for applying machine translation beyond plain text (what underlying models provide) to support the Wikipedia context: A new improved approach for sentence segmentation (with a demo page to try) that provides a more accurate way to identify when a sentence ends in different languages, and with a preference to avoid splitting in case of doubt (preferred in the context of machine translation to avoid fragmenting the context of a translation, for example, misinterpreting the dot of an abbreviation as a fullstop).

2023年8月

2023年7月