Terjemahan konten/Terjemahan Mesin/MinT
MinT (Mesin dalam Terjemahan) adalah layanan terjemahan berdasarkan model penerjemahan mesin saraf bersumber terbuka. Layanan ini diinangi di infrastruktur Yayasan Wikimedia dan akan menjadi bagian dari daftar sistem terjemahan mesin (TM) yang tersedia untuk pengguna Terjemahan Konten dan proyek Wikimedia lainnya. Terjemahan yang disediakan didasarkan pada model terjemahan NLLB-200, OPUS, IndicTrans2 dan Softcatalà yang telah dioptimalkan performanya menggunakan pustaka Ctranslate2 OpenNMT untuk menghindari perlunya akselerasi GPU. Untuk rincian lebih lanjut, Anda dapat memeriksa kode sumber, spek API, dan contoh ujinya.
Fitur-fitur kunci
- Tidak ada informasi pribadi non-publik milik pengguna yang dikirim ke MinT. Sistem TM akan diakses melalui API. Konten artikel (dilisensikan secara bebas) dikirim ke server MinT dan tidak ada komunikasi langsung yang terjadi antara pengguna dan layanan eksternal serta tidak ada informasi pribadi non-publik milik pengguna (IP, nama pengguna) yang dikirim ke layanan MinT. Klien yang kontak dengan MinT adalah sumber terbuka dan Anda dapat memeriksanya di sini. Meskipun layanan MinT dihosting di infrastruktur Wikimedia, integrasinya mengikuti pola yang sama seperti layanan eksternal lainnya (lihat juga diagram pengaturan teknis ini di akhir bagian).
- Setiap informasi berhak cipta dibalikkan dari MinT di bawah lisensi gratis. Ketika MinT digunakan, versi terjemahan dari konten Wikipedia di bawah lisensi bebas akan diambil. Hak cipta dari konten buatan mesin tersebut merupakan pertanyaan hukum terbuka. Sejauh terjemahan MinT dapat dilindungi hak cipta, terjemahan ini tersedia di bawah lisensi gratis yang sama dengan konten Wikipedia yang sedang diterjemahkan. Pengguna dapat memodifikasinya dan menerbitkannya sebagai bagian dari Wikipedia tanpa bertentangan dengan kebijakan yang ada. Konten terjemahan yang dihasilkan oleh MinT dan modifikasi pengguna akan tersedia di bawah lisensi yang sama dengan yang digunakan untuk artikel lainnya di Wikipedia.
- Bermanfaat bagi komunitas terjemahan bersumber terbuka yang lebih luas. Terjemahan yang diperoleh dari MinT dan modifikasi pengguna akan tersedia untuk umum. Terjemahan paska-sunting adalah minat khusus untuk komunitas riset terjemahan yang dapat menggunakan sumber daya ini untuk membuat layanan terjemahan baru untuk mendukung bahasa terjemahan mesin bersumber terbuka yang belum tersedia. Ini akan membantu pengembang membuat dan meningkatkan sistem terjemahan mesin.
- Pengguna dapat menonaktifkannya. Terjemahan otomatis adalah alat opsional dalam Terjemahan Konten. Pengguna memiliki opsi untuk menonaktifkannya jika menurut mereka itu tidak berguna karena alasan tertentu. Meskipun banyak pengguna Terjemahan Konten telah meminta layanan terjemahan, pada akhirnya setiap penggunalah yang memutuskan apakah mereka ingin menggunakannya atau tidak.
Pertanyaan mengenai layanan ini
Kami telah menulis beberapa pertanyaan yang sering diajukan tentang MinT di bagian ini. Itu juga tersedia di halaman Pertanyaan Umum Terjemahan Konten.
Bahasa apa yang ditangani oleh MinT? Apa ada rencana untuk menambahkan lebih banyak bahasa?
MinT dirancang untuk menampung beberapa model penerjemahan terbuka. Jumlah bahasa yang didukung akan bergantung pada model-model tersebut. Laman daftar sistem terjemahan mesin yang tersedia berisi daftar terbaru.
Apa bedanya menggunakan MinT dengan menggunakan Apertium atau layanan lainnya?
Sebagai pengguna Terjemahan Konten, Anda tidak akan merasakan perbedaan apa pun pada antarmuka terjemahan karena MinT akan menampilkan konten yang diterjemahkan dengan cara yang sama seperti yang dilakukan Apertium atau layanan lain saat ini untuk pasangan bahasa yang didukung. Layanan yang berbeda memberikan tingkat kualitas terjemahan yang berbeda, tergantung pada bahasa dan konten. Anda dapat mencoba dan mengubah layanan yang ada, dengan melihat terjemahan awal yang terbaik untuk paragraf tertentu.
Bagaimana terjemahan mesin dilakukan apabila saya memilih MinT?
Saat pengguna mulai menerjemahkan artikel, konten HTML dari setiap bagian artikel sumber akan dikirim ke MinT. Layanan MinT memproses permintaan dan menggunakan salah satu model terjemahan yang tersedia berdasarkan bahasa dan konfigurasi yang didukung. Versi terjemahan akan dikirim balik dan ditampilkan pada kolom terjemahan masing-masing Terjemahan Konten. Tautan dan referensi diadaptasi seperti biasa sehingga pengguna dapat memodifikasi konten sesuai kebutuhan.
Proses ini berlanjut terus untuk semua bagian artikel yang sedang diterjemahkan. Untuk performa yang lebih baik, terjemahan untuk bagian yang seterusnya sudah diambil terlebih dahulu. Pengguna dapat menyimpan terjemahan yang belum diterbitkan (untuk dikerjakan lagi nanti), merevisi, atau menerbitkan artikel seperti biasa. Artikel ini diterbitkan di Wikipedia seperti artikel normal lainnya dengan atribusi dan lisensi yang sesuai.
Apakah MinT didasarkan pada perangkat lunak bersumber terbuka?
Layanan MinT bersumber terbuka dan model yang dirilis diintegrasikan sebagai sumber terbuka:
- Tim riset AI di Meta merilis model terjemahan yang digunakan oleh NLLB-200 dengan lisensi sumber terbuka dan kumpulan data yang digunakan untuk pelatihan sebagai bagian dari proyek No Language Left Behind.
- [Proyek OPUS https://opus.nlpl.eu/] menyediakan [model terjemahan saraf https://github.com/Helsinki-NLP/OPUS-MT pra-pelatihan yang sudah dilatih tentang data OPUS dengan lisensi sumber terbuka].
Model-model itu telah dioptimalkan performanya menggunakan pustaka Ctranslate2 OpenNMT yang juga merupakan pustaka bersumber terbuka.
Terjemahan Konten berevolusi dari kebutuhan klasik untuk menjembatani kesenjangan dalam jumlah konten antara Wikipedia dalam berbagai bahasa. Seperti semua perangkat lunak lain yang digunakan di situs Wikimedia, Terjemahan Konten juga merupakan sumber terbuka. Dalam kasus khusus ini, kami juga menggunakan klien bersumber terbuka untuk berinteraksi dengan layanan eksternal dan mengimpor konten berlisensi bebas untuk membantu pengguna memperluas pengetahuan gratis kami. Untuk menggunakan MinT, kami tidak menambahkan perangkat lunak berpemilik apa pun dalam kode Terjemahan Konten, atau di situs web dan server Wikimedia.
Haruskah saya khawatir tentang informasi pribadi saya saat menggunakan MinT?
Terlepas dari layanan yang Anda gunakan, Anda dapat yakin bahwa hanya konten dari artikel Wikipedia yang ada yang akan dikirim dan hanya konten berlisensi bebas yang akan dibalikkan kembali ke terjemahan. Komunikasi dengan layanan tersebut terjadi di sisi server, sehingga mereka diisolasi dari perangkat pengguna dan tidak memiliki akses ke informasi pribadi non-publik milik pengguna. Lihat diagram ini untuk rincian lengkapnya.
Bagaimana jika MinT adalah satu-satunya perkakas terjemahan mesin yang tersedia tapi saya tidak mau menggunakannya?
Terjemahan Mesin adalah fitur opsional dalam Terjemahan Konten yang dapat dengan mudah Anda nonaktifkan sesuka hati. Jika lebih banyak sistem terjemahan mesin ditambahkan untuk bahasa Anda, Anda dapat memilih untuk mengaktifkan dan memilih kembali layanan TM pilihan Anda.
Apakah konten yang diterjemahkan oleh MinT bebas digunakan di Wikipedia?
Ya. Konten yang diterima dari MinT tersedia secara gratis di platform terjemahan web. Untuk kemudahan penggunaan, Terjemahan Konten menerimanya melalui API supaya tersedia dengan lancar di antarmuka terjemahan. Konten ini dapat dimodifikasi oleh pengguna (jika perlu) dan digunakan dalam artikel Wikipedia dengan lisensi gratis.
Bisakah konten ini digunakan untuk meningkatkan sistem terjemahan mesin secara umum? =
Ya. Terjemahan yang dibuat dalam Terjemahan Konten disimpan dalam basis data kami. Informasi ini akan tersedia untuk umum, bagi siapa saja untuk digunakan sebagai contoh terjemahan untuk meningkatkan layanan terjemahan mereka (dari kelompok riset Universitas, proyek sumber terbuka hingga perusahaan komersial, semua orang!). Konten dapat diakses melalui API Terjemahan Konten. Harap ingat bahwa hanya informasi terkait dengan teks terjemahan saja yang tersedia untuk umum. Ini mencakup – teks sumber dan teks terjemahan, informasi bahasa sumber dan target, serta juga pengidentifikasi segmen teks.