Перевод содержания/Машинный перевод/Google Translate
Поддержка машинного перевода для перевода контента теперь еще более расширена. В добавление к таким платформам как Apertium, LingoCloud, Matxin, Yandex и Youdao, мы добавляем Google Translate в список систем машинного перевода, которые доступны пользователю для перевода текста. Это позволит добавить поддержку машинного перевода для более чем 100 языков, включая новые языки, которые ранее были недоступны в существующих системах перевода.
Google Translate разработан многонациональной компанией Google, штаб-квартира которой находится в США. Различные команды Фонда Викимедиа и Google объединились, чтобы разработать соглашение, которое позволит использовать Google Translate не нарушая при этом принципы Викимедиа на присвоение прав, конфиденциальность данных пользователей, а также образ бренда. Вы можете ознакомиться с деталями соглашения ниже . Мы будем рады услышать ваши вопросы, которые могут возникнуть при ознакомлении с данным сервисом.
Ключевые особенности
- Никакие персональные данные не будут доступны Google Translate. Доступ к использованию систем машинного перевода будет осуществлятся при помощи облачных технологий Google. Содержимое статьи (открыто лицензированное) будет отправлено с серверов Викимедиа на сервера Google. При этом не происходит прямого контакта пользователя с сторонними сервисами, а также персональная информация (IP-адрес, имя пользователя) не отправляется на сервера Google. Способ соединения пользователя с серверами Google находится в открытом доступе. Вы можете посмотреть код здесь. Никакая часть сервиса Google или его кода не будет частью инфраструктуры Викимедиа или кодовой базы перевода контента. Для лучшего ознакомления, посмотрите диаграмму технической структуры в конце раздела.
- Информация полученная от Google Translate находится под действием свободной лицензии. При использовании Google Translate, переведенная версия содержимого статей Викимедиа охватывается свободной лицензией. Пользователи могут изменить и опубликовать полученную информацию как часть Википедии. При этом не будет противоречий с правилами пользования ресурсом. Полученный контент при помощи перевода Google Translate, а также правки пользователя будут доступны под такой же лицензией, которая используется для остальных статей в Википедии.
- Приносит пользу широкому сообществу переводчиков. Переводы полученные при помощи Google Translate, а также пользовательские версии будут находиться в открытом доступе. Отредактированные человеком машинные переводы имеют особый интерес со стороны сообщества изучения переводов. Сообщество может использовать этот ресурс для создания новых сервисов по переводу поддерживающих языки, для которых машинный перевод с открытым кодом еще не доступен. Это поможет разработчикам создавать и улучшать системы машинного перевода.
- Пользователи могут отключить модуль автоматического перевода. Автоматический перевод это вспомогательное средство для перевода содержимого. Пользователи в праве отключить автоматический перевод, если он кажется им неподходящим по киким-либо причинам. Не смотря на это, многие пользователи обращаются к данной услуге по переводу. Каждый в отдельности пользователь может решить, будет ли он пользоваться данным сервисом или нет.
Краткое содержание соглашения с компанией Google
Обязательства со стороны Google
- Использование ключа API для перевода на бесплатной основе для Фонда Викимедии, позволяющему добровольцам на сайтах Викимедии переводить статьи не зависимо от того сколько знаков потребуется для перевода.
Обязательства со стороны Фонда Викимедии
- Предоставлять отредактированные добровольцами версии перевода, чтобы компания Google могла улучшать собственные средства перевода.
- Никакие персональные данные переводчиков не будут раскрыты или переданы.
- Только исходный контент для перевода, его язык и язык на который делается перевод могут быть переданы по запросу Google.
- Переводы, опубликованные переводчиками, с помощью средств машинного перевода или без них, могут быть предоставленны в форме Битекст API перевода содержания. Эти API будут постепенно развиваться и результаты будут находится в свободном доступе.
Важные замечания
- Весь контент будет предоставляться по свободной лицензии CC BY-SA 3.0
- Google не требует никакого обозначения продукта на сайтах Викимедии, помимо внесения Google Translate, как средства для перевода в список, находящийся в всплывающем меню.
- Личная информация добровольцев не может быть передана или обменена.
- Срок действия соглашения ограничен 1 годом, после чего мы можем пересмотреть наши потребности.
- Мы в праве расторгнуть соглашение по любым причинам и в любое время.
- Данное соглашение регулируется в соответствии с законодательством Соединенных Штатов Америки.
Часто задаваемые вопросы об этой услуге
В этом разделе рассмотрены некоторые актуальные вопросы о Google. Ответы на них, также моно найти на странице часто задаваемых вопростов в разделе Перевод содержания.
Какие языки доступны при использовании Google Translate? Есть ли у вас в планах увеличить их число?
Google Translate может быть использован для превода на все доступные языки, кроме английского, который на сегодняшний день не предоставляет возможность для использования машинного перевода в любом его виде.
В чем различия при использовании Google Translate и Apertium?
Как пользователь Перевода содержания, вы не почуствуете никаких координальных различий в интерфейсе, так как Google Translate отображает переведенный текст в таком же виде как и Apertium отображает результат для поддерживаемых языковых пар.
Как происходит машинный перевод если я выберу Google Translate?
Google Translate имеет собственный ключ API, который позволяет веб-сайтам, а также другим сервисам использовать эту систему перевода. Перевод содержания также использует юникальный ключ API, который дает Google Translate доступ к сервисам Google Cloud. В то время, когда пользователь начинает переводить статью, HTML содержимое каждого раздела исходной статьи отправляется в Google Translate, после этого получается переведенная версия текста, которая отображается в соответствующем столбце перевода содеражания. При переводе ссылки и источники перестают быть активными и пользователи могут редактировать текст так, как нужно.
Этот процесс продолжается для всех разделов статьи, пока она не будет переведена полностью. Для лучшей производительности, переводы для последовательно идущих разделов проходят предварительную выборку. Пользователь может сохранить не опубликованный перевод, чтобы в последствиий вернуться к нему, или опубликовать статью как обычно. Статья публикуется на Википедии, точно также как и любая другая статья с сответсвующими атрибуциями и лицензиями.
Диаграмма процесса машинного перевода.
Google Translate основан на проприетарном программном обеспечении. Почему мы используем его?
Перевод содержания эволюционировал от давно ощущаемой потребности в мост между объемом информации предоставляемой статьями Википедии, написанными на разных языках. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge.
При использовании Google Translate, мы не добавляем какое-либо закрытое программное обеспечение в исходный код Перевода содержания или на сайты и сервера Википедии. The service is free of charge as part of Google’s offering to the Wikimedia Foundation.
Google Translate передается только содержание статьи Википедии, находящееся в свободном доступе. Полученный переведенный текст может быть использован на страницах Википедии. The translated content can be modified by users and this data is also available publicly under a free license through the Content Translation API. This is a valuable resource made available for the community to develop open source translation services for those languages where they don't exist yet.
После подробного рассмотрения последствий, мы заметили, что информация, ранее содержавшаяся в сервисах с закрытым исходным кодом, не ограничивает свободу наших знаний или программного обеспечения как в настоящее время, так и в будущем. We have taken special care to make sure that the content provided is freely licensed to make sure it complies with Wikipedia policies. This includes a long process for legal and technical evaluation and compliance. The summary of our agreement is also available above.
Отзывы пользователей показывают, что поддержка машинного перевода действительно полезна для пользователей. Мы готовы лучшим способом поддерживать все существующие языки. Guided by the principles of Wikimedia Foundation's resolution to support free and open source software, we will prioritize the integration of open source services whenever they are available for a language. Apertium has been a critical part of Content Translation since its inception, but currently, it only provides machine translations for about 30 of the numerous possible language combination that Wikipedia can support.
Стоит ли опасаться за конфиденциальность моих персональных данных при использовании Google Translate?
Независимо от того какой сервис используется, вы можете быть спокойны за свои персональные данные. На сервера передается только информация из существующих статей Википедии и только контент защищенный свободной лицензией будет добавлен в перевод. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.
Что делать если Google Translate это единственный доступный сервис машинного перевода? Можно ли выбрать другой сервис машинного перевода?
Машинный перевод является дополнительной функцией в Переводе содержания. Эту опцию можно отключить когда вам угодно. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.
Будет ли контент, переведенный при помощи Google Translate, свободным для использования в Википедии?
Будет. В противном случае перевод полученный при помощи Google Translate находится в свободном доступе на платформе веб-перевода. Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.
Можно ли использовать этот контент для улучшения систем машинного перевода в общем случае?
Да. Все переводы, произведенные в Переводе содержания, сохраняются в нашу базу данных. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source, and target language information and an identifier for the segment of text.
Смотреть также
- Project Glow FAQ - Раздел с часто задаваемыми вопросами на счет партнерства Викимедии и Google.
- Supporting Indian Language Wikipedias Program - Wikimedia Foundation and Google partnership working with the Centre for Internet and Society (CIS), Wikimedia India chapter (WMIN) and user groups in a pilot a program encouraging Wikipedia communities to create locally relevant and high-quality content in Indian languages. AKA Project Tiger