• Maki Yamamura

進化が著しいAI翻訳。昨今の翻訳事情や歴史、強み・弱みをご紹介


近年ではビジネスを含め広くAI翻訳が普及してきています。普及に伴い精度も上がり、著しく進化しています。この記事ではAI翻訳の進化の歴史から昨今の翻訳事情、AI翻訳の強み・弱みを紹介します。



1. AI翻訳の進化の歴史

1-1. AI翻訳の概念が誕生したのは17世紀

1-2. 日本に急速に普及したのは1990年前後

1-3. 統計翻訳が主流だった2000年代前半

1-4. 以降は翻訳精度が高いニューラル翻訳へ

2. 従来のAI翻訳と最新AI翻訳の違い

3. AI翻訳の特徴・強み

4. AI翻訳の限界・弱み


 

1. AI翻訳の進化の歴史

ここ数十年で世間に広く知られるようになったAI翻訳ですが、実はAI翻訳という概念が誕生したのは17世紀のことです。それからさまざまな変遷をたどり、現在も進化を続けています。まずはそんなAI翻訳の歴史からその進化を辿ってみましょう。

1-1. AI翻訳の概念が誕生したのは17世紀

AI翻訳(機械翻訳)という概念の誕生は17世紀にまで遡ります。フランスの数学者・哲学者、ルネ・デカルトが、多言語間の類義語にひとつの記号を割り当て、普遍化するアイディアを提唱しました。

その後数百年間、機械翻訳の発展は概念的な段階で停滞しますが、1954年頃にはコンピューターを活用して実用化するための研究がスタート。1980年代には統計翻訳(SMT:Statistical Machine Translation)が猛スピードで普及し、少しずつ成果も見え始めるようになってきました。

現在AI翻訳(機械翻訳)と呼ばれているシステムは、1980年代に普及した統計翻訳の統計的機械学習技術を利用したものです。さまざまなテキストデータに基づいて、一定のアルゴリズムから言語を翻訳する仕組みです。それ以前の機械翻訳は、ルールベースの翻訳が主流でしたが、1980年代における計算機の発達により、情報を統計して翻訳する仕組みが開発されたのです。しかし、当時の統計翻訳は実用性に乏しく、日本語から英語、英語から日本語などの訳文でも正確性に欠けることが多く、費用対効果に見合わないシステムでした。

1-2. 日本で急速に普及したのは1990年前後

日本でAI翻訳(機械翻訳)が急速に広まったのは1990年前後。電気通信事業者から機械翻訳システムが搭載されたワークステーションがリリースされています。その当時、「夢の技術」と話題になった機械翻訳でしたが、正確性に欠ける訳文、機械翻訳後の膨大な編集作業、300万円以上の導入費用を要することから、導入した事業者からは良い評価を得られませんでした。

再び機械翻訳に注目が集まったのは、1995~1997年頃。すでにパソコンが普及し、インターネット通信が始まった時代でもあります。この時代には家庭用の翻訳ソフトも比較的リーズナブルな価格でリリースされ、一般的にも機械翻訳がブームになりました。このように費用面ではかなり進化してきた機械翻訳ですが、一方で技術面においてはこの時代においても翻訳技術はまだまだ正確性が乏しく、実用性に欠けるという評価でした。

1-3. 統計翻訳が主流だった2000年代前半

2005年頃にはMicrosoftが機械翻訳の研究に乗り出しました。2013年には、機械翻訳の英訳レベルがTOEIC600点程度に達したと言われています。TOEICの600点は英検では2級に相当するもので、簡単な英会話や読み書きはできるものの複雑な英訳は難しいレベルです。その後2010年頃までは、集積されるビッグデータを活用した統計翻訳が主流の時代でした。

1-4. 以降は翻訳精度が高いニューラル翻訳へ

2016年頃には、徐々に統計翻訳からニューラル機械翻訳(NMT:Neural MachineTranslation)の時代へと移り変わります。ニューラル機械翻訳とは、ディープラーニング(深層学習)を基礎としたモデルで、人間の脳に似た思考能力を持ち合わせている翻訳システムのことです。同時期にGoogleが提供する翻訳サービスに採用され、統計翻訳以上に自然な訳文の出力を実現しました。

2018年時点では、機械翻訳の英訳レベルがTOEIC800点程度に達したとの声もあがりました。今後も進化は続いていく見通しです。


 

2. 従来のAI翻訳と最新AI翻訳の違い

時代とともにAI翻訳(機械翻訳)は、集積されたビッグデータに基づいた統計翻訳から、人間の脳に似た思考能力を持つニューラル翻訳へと変化してきました。そうした変化によって、従来のAI翻訳と最新のAI翻訳にはさまざまな違いが生じています。具体的にどんな機能性の違いがあるかについてを解説します。

2-1. 違和感のない意訳へと進化

従来のAI翻訳(機械翻訳)では、不自然な訳文や誤訳などが頻発していました。しかし、最新のものでは文章全体の意味を理解した上で、人間が普段の生活で使うような自然な文章に訳すことができます。これはAIのアルゴリズムにより、前後の文章も認識するようになった結果といえるでしょう。

2-2. 学習機能の組み込み

従来のAI翻訳(機械翻訳)では、人間が定期的に新しい言葉の情報をインプットし、的確な訳文に導かなければなりませんでしたが、最新の機械翻訳ではそうした過程が不要になりました。最新の機械翻訳はディープラーニングをベースにしているため、AIが人間の手を必要とせず、自ら学習して答えを出せるようになっているのです。すべての翻訳結果をデータベースに蓄積し、そのデータから人工知能が自ら学習することで、人間の過度な労力を使うこともなくなりました。

2-3. 専門用語も順次対応可能に

従来の機械翻訳では、さまざまな業界で使用される専門用語までは正しく翻訳できませんでした。しかし、最新の機械翻訳では学習機能の高まりから専門用語の翻訳も順次可能になると言われています。使用する機械翻訳ソフト製品によっても差がありますが、そのレベルは従来のものと比較すると確実に精度が高まっています。


 

3. AI翻訳の特徴・強み

ここまでAI翻訳の歴史をもとに、従来のAI翻訳との違いや進化をお伝えしてきました。次にAI翻訳を使用した場合どのようなメリットがあるのか、その特長や強みを考えてみましょう。

3-1. 人的負担・コストの軽減

翻訳作業は、原文言語の解釈能力、訳文言語の運用能力の両方を必要とする、負荷の高い知的労働作業です。AI翻訳を使わずに人海戦術で翻訳業務を担うとなれば、誰が行うにしてもその負担は大きいものです。

社員が翻訳を担当している場合、最悪の場合、本来の業務で実力を最大限発揮できなくなってしまい、企業にとっても大きなロスが生じる恐れがあります。一方、社外に依頼する場合には当然ながら外注費が発生します。AI翻訳を利用することで、このような人的リソースの負担、コスト負担が軽減されます。特にインターネットを利用した無料ソフトを活用する場合、コスト負担は大きく軽減されます。

3-2. 最先端の情報をキャッチアップ

上記でもお伝えしたように、最新のAI翻訳はディープラーニングをベースにしており、人間の手を必要とせず、自ら学習して答えを出せるようになっています。翻訳結果をすべてデータベースに蓄積し、そのデータから人工知能が自ら学習することで、常に新しい情報をキャッチしながら、継続的にアップデートすることができます。つまり随時にAI翻訳を試みることで、自然と最新のテクノロジーや社会現象を加味した表現や語句のデータベースへとアクセスし続けることが可能になるのです。分厚い紙の辞書には載っていない最新用語が、AI翻訳ではすぐに調べられるという利点はそのよい例と言えるでしょう。

3-3. グローバル化の拡大

AI翻訳を使えば、言語の違う膨大な文字数の資料も短い時間で翻訳できます。またこれまで全く知識のない外国の企業に向けても、サービスや商品の提案を多言語に翻訳できます。このように多言語への翻訳が気軽に短時間で行えるため、グローバル化対応への機会を簡単に得られるようになります。



 

4. AI翻訳の限界・弱み

このように便利なAI翻訳ですが、現状では残念ながら限界が多いと考えています。その理由について、以下に述べます。

4-1. 細かいニュアンスの翻訳ができない

翻訳の精度は年々高まっていますが、実際には正確な翻訳が厳しいケースも多くみられます。例えば、正しい文法でない文章や方言などを含んだ文章は確率が高いでしょう。AIが正しくその機能を発揮できるためには、まず人が書く翻訳原稿を正しい内容で準備する必要があります。しかし、現実の社会で運用されている資料は必ずしも、翻訳原稿として正しく書かれたものばかりではありません。そのため、細かいニュアンスや事情背景に沿って意味を補足しながら翻訳する必要性があるのが実情です。とりわけ日本語は言語の特性として主語、述語、動詞、副詞の関係性が他の言語と比較して明確ではないため、同じ意味の文書であってもさまざまな表現が可能です。それだけに曖昧な文章や省略した文章が多く、翻訳者は言外の意味を補い、時には原稿に修正やコメントを入れて、「伝えたい内容」というゴールに向けた翻訳を行っています。そうした丁寧な補足作業は、原稿ありきのAI翻訳では難しいのは当然です。現実の文書運用においては、現段階ではまだしばらく人的翻訳が大きく勝っていると言わざるを得ません。

4-2. 文化の違い・差を把握できない

翻訳するには言語の違いだけでなく、文化の違いも把握している必要があります。例えば対象地域の歴史的、文化的な背景を持つ用語については、単に訳語だけ紹介しても意味が通じず、その解釈や説明が必要となる場合があります(一例をあげると、日本語だと「七五三」、「のど自慢」、「湯呑」など)。また、商品説明などでよく使用される、「パリパリ」、「さらさら」、「ふわふわ」といった擬態語、「ピー」、「カチッ」などの擬音も日本語独特の世界です。さらに一見問題ないように見えて、訳してみても意味が通じないケースも多くあります。「桃の節句に桃色の服を着た」などという文章も、日本語では「桃の花=桃色」という必然性がありますが、英語では”peach”と”pink”との関連性が弱いため、補足が必要です。文章中にこうした難易度の高い表現が混じっている場合、AI翻訳では補足が行えず無理な表現となりがちです。従ってAI翻訳の場合、翻訳後の確認、修正を怠ると、誤った情報を発信してしまうリスクがあります。こうした確認、修正を別途行うにはさらなる手間がかかり、実用的とはいえません。

4-3. 最終的に人のチェックが不可欠

上述した2点から、AI翻訳で訳した文書はそのまま実運用すること、公式なものとして表に出すことは難しく、必ず人の目によるチェックや修正が必要になります。どういった文書であっても最終的なチェックは人が行いますが、AI翻訳の場合、そもそも翻訳が正確かどうか、訳した結果が意味を成すものかどうかをチェックしなければならないので、その分二重に手間がかかるのです。そして何より、AI翻訳では翻訳責任が無いため、誤訳が含まれていないかどうかの判断は常にそれを確認する人間の責任となります。

 

まとめ

今回は、AI翻訳(機械翻訳)の進化の歴史から、その強み、弱みを紹介してきました。最新のAIはディープランニング(深層学習)をもとに自ら学習する仕組みとなっているため、人的労力は削減され、精度も高まりつつあります。しかし、細かなニュアンスまで翻訳できない、文化の違いを理解することが難しい、という理由で、最終的には人のチェックが不可欠となることは否めません。公的な文書やビジネスで実運用できる文書を作成する場合には、効率よくAI翻訳を利用した場合でもしなかった場合でも、最終的に人の手によるチェックや修正翻訳が不可欠となるでしょう。

京あはせではAI翻訳の利点も理解しつつ、その進化を見守りながら、現状では人手による丁寧な翻訳に注力しています。

一方、マニュアルや仕様書など、流用性や繰り返し性の多い原稿については翻訳支援ソフトや翻訳データベースを利用しながら語句の統一を図っています。

進化を続けるAI翻訳の動向を今後も注視しつつ、必要に応じて最適に利用し、しかし最後はやはり「人間による、人間のための文章」を届けたいと考えています。