Jump to content

도움:내용 번역/번역/번역 수준

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Translation quality and the translation is 85% complete.
Outdated translations are marked like this.
PD 주의사항: 이 문서를 편집하면 CC0에 따라 당신의 기여한 것을 배포하는 데 동의하는 것으로 간주됩니다. 자세한 내용은 퍼블릭 도메인 도움말 문서를 확인 하세요. PD

번역할 때 번역을 게시하기 전에 반드시 내용을 검토해야 합니다. 당신은 번역된 내용이 본래 의미를 변경하지 않는지 그리고 번역할 언어로 자연스럽게 읽힐 수 있는지 확인할 필요가 있습니다. 초기 기계 번역은 유용한 시작점으로서 번역 과정의 속도를 높이는데 도움을 주지만 그 도구는 사용자가 초기 내용을 검토하고 상당한 부분 편집하기를 권장합니다.

다른 메커니즘은 번역기가 적절하게 초기 번역을 편집했는지 보장합니다. 번역 편집기는 사용자가 초기 번역을 얼마나 수정했는지 추적하고 게시를 방지하기 위해 다른 제한을 정의하거나 사용자에게 콘텐츠를 추가로 검토하도록 경고합니다.

이러한 방식으로 이 도구를 사용하면 사용자가 기계 번역을 잘 활용할 때 기계 번역을 사용할 수 있으며, 가볍게 검토된 저품질 번역이 생성되는 것을 방지 할 수 있습니다. 이러한 제한이 작동하는 방식, 각 언어의 요구 사항에 맞게 조정하는 방법, 도구로 생성 된 콘텐츠의 품질을 측정하는 방법에 대한 자세한 내용은 아래에 제공됩니다.

번역 검토 권장 제한

콘텐츠 번역은 사용자가 제안된 초기 기계 번역에 대한 수정 비율을 측정합니다. 이러한 방식으로 시스템은 초기 번역에서 추가, 제거 또는 수정 된 단어 수를 인식합니다. 이러한 측정은 각 단락과 전체 번역의 두 가지 수준에서 이루어집니다. 아래에 설명 된대로 각 수준에 다른 제한이 적용됩니다.

전체 번역에 대한 제한

수정되지 않은 기계 번역이 너무 많은 번역을 게시하려고하면 오류가 표시됩니다. 이 임계 값은 편집자의 피드백에 따라 인도네시아어에 대해 조정되었습니다.

전체 문서의 95 % 이상이 수정되지 않은 기계 번역 콘텐츠로 구성된 경우 게시가 차단됩니다. 이 제한은 원시에 가까운 기계 번역을 방지하고 명확한 기물 파손 행위를 방지합니다. 또한 사용자가 기계 번역 부분을 편집하지 않고 단순히 콘텐츠를 추가하는 것을 방지합니다. 아래에 설명 된대로 이 제한은 언어별로 조정할 수 있습니다.

각 단락에 대한 제한

수정되지 않은 기계 번역이 제한을 초과하는 특정 단락에 대해 경고가 표시됩니다.

각 단락에 대해 사용자 수정 비율도 측정됩니다. 단락에 초기 기계 번역의 85 % 이상이 포함 된 경우 (또는 원본 문서의 내용을 복사 할 때 수정되지 않은 내용의 60 % 이상이 포함 된 경우) 단락은 문제가있는 것으로 간주됩니다.

번역 편집기는 문제가 있는 각 단락에 대해 경고를 표시하여 사용자가 추가로 편집하도록 권장합니다. 경우에 따라 사용자는 여전히 게시 할 수 있지만 결과 페이지는 커뮤니티에서 검토할 수 있도록 잠재적으로 검토되지 않은 번역의 추적 범주에 추가 될 수 있습니다. 다른 경우에는 사용자가 게시 할 수 없습니다.

다음은 사용자의 게시를 허용할지 여부를 결정하는 데 고려되는 몇 가지 요소입니다 (일부는 아직 개발 중입니다).

  • 문제가있는 문단의 수. 사용자는 문제가있는 문단이 50 개 이상인 번역을 게시 할 수 없습니다. 사용자는 여전히 문제가있는 단락이 50 개 미만인 번역을 게시 할 수 있지만 문제가있는 단락이 10 ~ 49 개인 번역은 커뮤니티에서 검토 할 수 있도록 잠재적으로 검토되지 않은 번역의 추적 범주에 추가됩니다.
  • 이전에 삭제된 번역. 반복되는 문제를 방지하기 위해이 도구는 게시 된 번역이 지난 30 일 동안 삭제 된 사용자를 식별하고 후속 번역 작업에 훨씬 더 엄격한 제한을 적용합니다. 이 경우 문제가 있는 단락이 10개 이상인 번역은 게시가 금지되고, 문제가 있는 단락이 9 개 이하인 번역은 커뮤니티에서 검토 할 수 있도록 잠재적으로 검토되지 않은 번역의 추적 범주에 추가됩니다.
  • 사용자 확인 사용자가 번역 상태를 검토하고 확인했다는 신호로 사용자가 해결 된 것으로 표시된 단락에 대해 덜 엄격한 임계 값이 고려됩니다. 수정되지 않은 콘텐츠 경고가 표시되었지만 사용자가 해결된 것으로 표시 한 단락의 경우 덜 엄격한 임계 값을 적용합니다 (기계 번역의 95 % 또는 소스 콘텐츠의 75 % 허용). 그는 자동 번역이 예외적으로 훌륭하지만 기능의 잠재적 인 남용을 피할 수있는 방법을 제공 할 것입니다 (즉, 사용자 확인을 맹목적으로 따르지 않음).

제한의 영향을받지 않는 콘텐츠

일부 내용은 크게 편집되지 않을 것으로 예상되며, 위에서 설명한 제한을 적용 할 때 고려되지 않습니다. 매우 짧은 섹션 제목, 인용 또는 참고 문헌 목록은 검사에서 제외됩니다. 그렇지 않으면 사용자는 참조 또는 기타 고유 명사에 나타나는 도서 제목과 같이 번역해서는 안되는 콘텐츠를 번역하는 것에 대해 잘못된 경고를받을 수 있습니다.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.

Publication of fast unreviewed translations

Campaigns and contests can result in spikes of translations where some user unfamiliar with the community policies may focus on making many translations and not pay enough attention to review their contents. In order to emphasize quality over quantity, a mechanism has been defined to limit the publication of fast unreviewed translations.

After a user translates a large article, the next translation can only be started after some time has passed. The waiting period estimation considers 1 minute per paragraph up to 10 minutes. That is:

  • For articles with 10 paragraphs or less, we want to make sure that users spent translating it at least N minutes (one minute per paragraph)
  • For articles with more than 10 paragraphs we want to make sure that users spent translating it at least 10 minutes.


This has been applied on mobile initially since it is a space with less activity, and after measuring the impact we'll consider expanding it to desktop too.


한계 조정

위에서 설명한 제한은 일반적인 메커니즘 집합을 제공하지만 각 위키의 특정 요구에 맞게 조정해야 할 수 있습니다. 초기 평가에 따르면 초기 기계 번역에 필요한 수정 정도는 언어 쌍에 따라 10 %에서 70 %까지 다양합니다. 일부 위키에서는 기본 제한이 너무 엄격하여 불필요한 소음이 발생하거나 완벽하게 유효한 번역이 게시되지 않을 수 있습니다. 다른 위키에서는 제한이 충분히 엄격하지 않아 충분히 편집되지 않은 번역을 게시 할 수 있습니다.

다른 임계 값을 조정하면 각 위키가 특정 요구에 따라 도구의 한계를 조정할 수 있습니다. 한계를 적절하게 조정하려면 원어민의 피드백이 필수적입니다. 번역을 만들거나 검토 한 경험을 바탕으로 현재 제한이 제대로 작동하지 않는 것 같으면 피드백 공유하여 더 나은 조정 방법을 알아볼 수 있습니다.

임계값 조정에 대한 피드백을 제공할 때 여러 예제 번역을 만드는 것이 좋습니다 (테스트가 일반 콘텐츠로 게시되지 않을 경우 게시 옵션 확인 확인). 언어에 대한 제한 작동 방식을 테스트 할 때 다음 사항에 유의하는 것이 유용합니다.

  • 두 경우 모두 확인하십시오. 콘텐츠가 충분히 편집되지 않은 번역과 초기 번역이 충분히 편집 된 번역에 대해 제한이 어떻게 작동하는지 확인하십시오. 이러한 방식으로 한도에 적합한 균형을 더 쉽게 찾을 수 있습니다. 한 가지 유형의 문제만 확인하면 임계값을 반대 방향으로 너무 멀리 이동하도록 제안할 수 있습니다.
  • 다른 내용을 확인하세요. 위키의 내용은 매우 다양하며 기계 번역이 다른 경우에 비해 훨씬 더 잘 작동할 수 있습니다. 예를 들어 숫자 데이터 또는 기술 이름으로 가득 찬 콘텐츠는 설명 텍스트가 더 많은 콘텐츠보다 사용자의 편집 작업이 덜 필요할 수 있습니다. 다양한 길이의 다양한 기사 유형을 서로 다른 콘텐츠로 번역하여 테스트해야합니다.
  • 반복 할 준비를하십시오. 임계 값 조정은 반복적 인 프로세스입니다. 임계값을 사용자 지정 조정하거나 일반적인 접근 방식을 개선해야 할 수 있습니다. 어떤 경우 든 각 변경 후 개선 사항을 확인하기 위해 추가 테스트가 필요할 수 있습니다.

편집자와 협력하여 한계를 조정하는 것이 효과적임이 입증되었습니다. 예를 들어, 초기 결과에 따르면 인도네시아 커뮤니티는 수정되지 않은 기계 번역의 70 % 이상으로 번역 게시를 제한하여 문제가 있는 번역의 수를 크게 줄였습니다. 텔루구어와 아삼어에 대해서도 유사한 조정이 이루어졌습니다. 오류가 없는 자동 도구는 없으며 이러한 한계도 예외가 아닙니다.

커뮤니티의 콘텐츠 검토 프로세스는 여전히 필수적이지만 이러한 제한은 커뮤니티가 집중해야하는 번역 수를 줄이는 도구를 제공하여 검토 프로세스를 훨씬 더 효과적으로 만듭니다. 귀하의 의견을 공유해주시면 더 나은 조정 방법을 알아볼 수 있습니다.

잠재적으로 검토되지 않은 번역 추적

A tracking category with the name "cx-unreviewed-translation-category" is provided for communities to easily find articles that have been published with some content exceeding the recommended limits.

이 카테고리는 각 위키의 추적 카테고리 목록에서 찾을 수 있습니다. 게시를 막는 제한을 통과했지만 예상보다 덜 편집 된 단락이 여전히 있는 게시물을 찾을 수 있습니다. 예를 들어 인도네시아 카테고리는 전체 기계 번역의 40 % 미만이지만 일부 문단이 수정되지 않은 기계 번역의 80 % 이상을 포함하는 기사를 포함합니다.

번역 품질 측정

콘텐츠 품질을 자동으로 평가하는 것은 간단하지 않습니다. 삭제율은 생성된 콘텐츠가 편집자 커뮤니티가 삭제하지 않을 만큼 충분한지 여부에 대한 유용한 추정치를 제공합니다. 삭제율 분석에 따르면 번역으로 생성된 기사는 처음부터 생성된 게시물의 초기 버전과 비교하여 삭제 가능성이 적습니다. 이는 다른 게시물 작성 방법에 대해 설정 한 것보다 훨씬 높게 번역하여 참여 한계를 설정하는 것이 실용적이지 않을 수 있음을 시사합니다.

게시 된 번역 찾기

콘텐츠 번역은 게시 된 번역에 contenttranslation편집 태그를 추가합니다. 이를 통해 커뮤니티는 최근 변경 사항 및 유사한 도구를 사용하여 번역 도구를 사용하여 만든 페이지에 집중할 수 있습니다. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

특정 번역 검사

번역 디버거 예

번역 디버거는 전체 문서에 사용되는 기계 번역의 비율이나 각 단락에 사용되는 번역 서비스를 포함하여 특정 번역에 대한 일부 메타 데이터를 검사할 수있는 도구입니다. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

사용자 전문성에 기반한 기타 제한

사용자 전문 지식을 기반으로 한 게시 제한을 표시하는 오류입니다. 이 예제는 확장된 자동 확인 사용자로만 메인 스페이스에 직접 게시하는 것을 제한하는 영어 위키피디아 커뮤니티의 결정을 기반으로합니다.

일부 위키는 저품질 번역의 생성을 줄이기 위해 사용자 권한을 기반으로 번역에 대한 다른 제한 사항을 구현했습니다. 예를 들어 영어 위키피디아에서는 사용자의 확인을 연장해야 함, 즉 번역을 기사로 게시하기 전에 English Wikipedia에서 500 번의 수정을해야합니다. 신입 편집자는 User: 또는 Draft: 네임 스페이스에 번역 된 기사를 게시 한 다음 게시물을 메인 스페이스로 이동합니다.

이 제한은 이 페이지에 설명 된 제한 시스템이 사용 가능하기 전에 만들어졌으며 양질의 번역을 만들도록 권장하는 방법이 아닙니다.

생성된 콘텐츠를 고려하지 않는 제한을 추가하기 전에 위에서 설명한대로 수정되지 않은 콘텐츠의 제한을 조정하는 프로세스를 진행하는 것이 좋습니다. 제한은 저품질 번역을 방지하기 위해 필요한 만큼 엄격하게 만들 수 있지만 여전히 좋은 번역을 만드는 편집자가 게시할 수 있도록 허용합니다.