Google翻訳、DeepL、そして人間で英訳してみた
ポイント
|
皆さんはGoogle翻訳やDeepL、そしてChatGPTなどの自動翻訳を利用されていますか?
こうした自動翻訳を使用すると、人間が翻訳する手間と比較して驚くほど短時間で手軽に翻訳文章が生成・表示されます。しかし、その品質や精度については未知数であり、人間によるチェック、修正というプロセスが不可欠です。精度が上がってきたとはいえ、当社では自動翻訳を経た文章は一次訳文でしかなく、少なくともお客様に納品できるレベルではないと考えています。
一方、最近では、お客様から「Google翻訳で翻訳したのでチェック校正してほしい」といったご依頼をいただくことも徐々に増えてきました。また「Google翻訳と人間の翻訳者との違いを知りたい」といったお問合せもいただくことがあります。
今回のブログでは、技術分野でありがちな例文を使用し、実際にGoogle翻訳、DeepL翻訳、そして人間の翻訳者、の3パターンで、日本語から英語に訳してみた内容を比較し、それぞれの内容を検証してみたいと思います。また自動翻訳を使用して効率的に正しい翻訳文を作るヒントについても探っていきます。
今回、翻訳対象文として使用するのは、カタログで使用されることを想定した以下の文章です。
例文:「用途に合わせ、豊富なバリエーションを提案可能」
これは実際にお客様からご依頼があった原稿内容をブログ用に一部編集した文章で、多様な用途に合わせて多くの製品ラインナップを揃えている、ということを表しています。
Google翻訳の場合
さっそくこの文章をGoogle翻訳に入れてみると、次の英文が表示されました。
原文:「用途に合わせ、豊富なバリエーションを提案可能」
訳文:We can offer a wide variety of variations to suit your application.
間違いとはいえませんが、“a wide variety of variations”は少し違和感のある表現です。日本語で言えば「多様な多様性」と書いてある感じです。
また、これは「私たちはあなたの用途に合うよう豊富なバリエーションを提供できます。」と、口語、つまり話し言葉で書かれた文章になっています。意味は通じるものの、カタログ内の文言としては冗長的です。
DeepL翻訳の場合
次に、DeepLも試してみましょう。
原文:「用途に合わせ、豊富なバリエーションを提案可能」
訳文:A wide range of variations can be proposed according to the application.
これがカタログの文章ということを考えると長く、また“can be proposed” は弱い表現で、やや直訳風といえるでしょう。“can be proposed”というと、提案するのは自社であるのに、どこか他人事のような雰囲気です。さらに、“can” は「~できる」という意味だけでなく「~という可能性がある」(かもしれない)というニュアンスもあることから、受け身で使うことによって、さらに自信の無さそうな表現になってしまいます。
人間の翻訳者の場合
ちなみに、当社で人間の翻訳者がこの文章を訳すとこうなります。
原文:「用途に合わせ、豊富なバリエーションを提案可能」
訳文:Various types of devices suited for customer applications
では上記の訳文について、Google翻訳、DeepLとの違いをみていきましょう。
違い:文脈に応じた語句の追加
よく見ると、日本語にはない語句が足されています。
Various types of devices suited for customer applications
ちなみにこれをGoogle翻訳で日本語に逆翻訳してみましょう。
「お客様の用途に合わせた各種デバイス」
すると、原文にはなかった日本語が登場します。「お客様」、そして「デバイス」です。
概して、英語の場合、日本語に比べて語句を省略する傾向が少ないように思われます。たとえば、日本語では主語を省略することが少なくありません。一方、英語では主語がないと文章が成り立ちません。
原文では省略されている「お客様」と「デバイス」という語句を加えることで、英文では明確で意味のある文章となります。一方、Google翻訳とDeepL翻訳の結果を見ると、日本語の原文になかったこうした語句は登場していません。これは当然のことで、原文にない語句を足すことは、現状の自動翻訳ではユーザーに誤訳と認識される危険性があるからです(実際にその通りです)。
ではなぜ人間の翻訳者はこのような語句を足すことができるのか。それはひとえに、「文脈を知っているから」、もしくは「正しい文脈(状況)を想像することができるから」です。
日本語として自然な原稿であればあるほど、「わかりきっている」語句は省略される傾向にあります。そうしなければ、冗長的で不自然な原稿となるからです。専門知識を有する読者を対象とした技術文書や、制限のある紙面で効果的に意味を伝える必要があるカタログなど販促文書では、この傾向は特に高くなるでしょう。
ちなみにこれが本当に「デバイス」(device)なのか、あるいは「機械」(machine)なのか、「装置・機器」(equipment)なのかは、実機に応じて変えるべき内容となります。これもまた、状況と文脈への理解に応じて訳し分けが必要な内容です。
さらに、「提案可能」という語にも注意が必要です。今回は販売製品の種類が豊富と理解しましたが、「提案可能」には、これ以外にも、汎用製品を多様にカスタマイズする提案が利用可能、という意味である可能性もあり、ここの解釈を誤ると誤訳となるからです。どのような事情背景を「提案可能」という言葉で表現しているのか、実態の理解なくしては正しい翻訳は行えません。
では、自動翻訳でより良い結果を出すためにはどのような方法が可能でしょうか。
それには上記で行った原文の補完が必要です。原文となっている日本語をそのままGoogle翻訳、DeepLに入れるのではなく、一見日本語としては不自然であっても、十分に意味を補完した原文に変えてから入力することで、より的確な英文に近づけることが可能といえるでしょう。
冒頭の文章についても、「お客様の用途に合わせた各種デバイス」と入れてみましょう。
Google翻訳:Various devices tailored to customer needs
DeepL:
Various devices tailored to customer applications
人間が行った翻訳に近くなることがお分かりかと思います。
上述した原文への用語の追加や構文の入れ替えといった修正(プレエディット)作業は、人間の翻訳者が翻訳作業中に脳内で自然に行っている作業です。このプロセスを経ているからこそ、意味の通じる「伝えたい内容が的確に伝わる」翻訳文となるのです。
自動翻訳で留意すること:文脈理解とポストエディットが不可欠
翻訳とは、語句の変換作業ではありません。原文が表そうとしている具体的な実態や文脈、背景状況に関する理解があってこそ、読者にとって意味のある、関連性を持った説明が可能となるのです。
自動翻訳がかなりのレベルで正確な、可能な限り間違いのない作業をした場合でも、そこには根本的に、上述した「状況理解」が欠けています。AIは特定の対象領域について訓練された理解をシミュレートしているに過ぎず、そのため、未だに時折、的外れで残念な結果となることがあり得ます(少なくとも2024年の現時点では)。
AI翻訳を使用する場合、こうした「残念な誤訳結果となっているかもしれない」リスクに、毎回賭けることになります。誤訳には、文法的なものを含め多様な可能性があり、中には安全性や信頼に影響する結果につながる可能性も否めません。翻訳するターゲット言語の特性、そして原文の文脈を徹底的に理解しない限り、誤訳かどうかの判別は難しいのが実情です。しかし、自動翻訳の精度が上がり、見た目には問題のない翻訳が自動でできあがってしまう中、このような見極め作業は、以前よりも難しくなっています。
そのため、自動翻訳を利用する場合には、原文の背景となる状況理解を踏まえたうえで、原文が正しく表記され、意味が補完されているかをかならず確認し、適宜修正することが大切です。
そして、より大切なことは、自動翻訳を行った後、完成した翻訳文章を確認、吟味、校正(ポストエディット)することです。これができない場合には自動翻訳の結果を鵜呑みにすることとなってしまい、残念な結果、危険な結果となるリスクが否定できません。インターネット上にあふれる多くの情報と同様に、自動翻訳を利用した後には、人による確認と判断が不可欠です。
京あはせでは、通常の翻訳作業に加え、翻訳原稿となる原文の校正や用語統一・ライティング、自動翻訳した後の訳文のポストエディットやネイティブチェックについても、格安・リーズナブルな価格で対応しています。企業の大切な資産である文書を、より効率的、効果的に展開したい、そのようなニーズに全力でお応えします。ぜひお気軽にご相談ください。
Comments