ニュース

梨本 邦直 教授 : 自動翻訳の幻想

言語そのものを研究対象とする学問は、文系の言語学や文学だけとは限らない。人間の言葉を理解し、人間が理解できる言葉で反応できる人工知能の開発などは情報技術系の究極のテーマであろう。その典型的なアプリケーションに、自動翻訳ソフトがある。日本語を英語に訳すのであれば、入力された日本語文を分析し、語に分解して文法機能を調べ、和英辞書に照らして対応する英単語を確定し、構造制約のフィルターにかけながら英文法のアルゴリズムに従って英文に再構築する。専門家ではないので詳しいことは知らないがだいたいそんなところであろう。しかし、これがうまく働かないことは、自動翻訳ソフトを使って、英作文の宿題を英語の先生に提出してみるとすぐ分かる。真っ赤に訂正された上に、バレて落第させられること請け合いである。

簡単な例を挙げよう。自動翻訳ソフト『Yahoo翻訳』で「好きです」を訳してみる。これだけでは文脈がないので何が好きなのか分からないが、普通、若い人がこの言葉を発すればI love youとなるはずである。なぜなら、日本語では主語が省略され、文脈からも推定できない場合、自動的に話者(=私)が主体になり、また客体が明示されない場合、それは聞き手(=あなた)になるからである。つまり前後の文脈のない文では、話し手と聞き手が自動的に主体・客体として前提される。ところが、翻訳結果はなんとI am goodである。せめてI like itぐらいに訳してくれればまだましだと思うが、これでは話にならない。では好きな対象をはっきりさせるために人名を入れてみよう。「田中さんが好きです」にして翻訳させる。それでもTanaka is goodと出力される。仮にうまくlikeと出力されたとしても、日本語ではloveを「愛する」ではなく、「好き」で表すという言語文化的背景を考慮する必要性がある。つまり英語ではlikeからloveに変えるべきである。いずれにせよ、こんな簡単な文さえも翻訳できないのでは何の役にも立たない。

英語教育に従事していると、世間に氾濫する様々な英語が気になる。次の写真はある電車の車内表示である。

翻訳例

まったく意味を成す英語になっていない。This car is moderately air-conditionedまたはThe air conditioner is set low in this carぐらいにすべきであろう。おそらく自動翻訳ソフトを使ったものと思われる。試しに『Yahoo翻訳』で「この車両は冷房を弱めにしてあります」を翻訳させてみるとThere is this vehicle to weaken an air conditionerとなった。さらにひどくなってしまった。写真の例の訳は「してあります」をis doneと直訳し、『Yahoo翻訳』の例は「あります」をThere is …と直訳したのが大きな誤りである。むろんエアコンに対して使われる動詞weakenの選択も、名詞vehicleの選択も不適切ならば、「?に」に対応すると思われるto不定詞の用法も意味をなさない。さらにエアコンを名詞句air conditionerで訳すならば、その定性が問題になる。つまりan air conditioner(不定名詞句)で使うかthe air conditioner(定名詞句)で使うかである。ここはこの表示が貼ってある特定車両のエアコンだから、theで指定される。anでは意味をなさない。ところがそのような言外の状況などはコンピュータに知る由もないのである。
このようにコンピュータに人間の言語を理解させることは極めて難しい。人間の言語は知識(語彙)と論理(文法)だけで支えられているのではなく、前後の文脈から状況を読み取ったり、言外の意図や前提を理解したり、知的判断の支えとして社会的常識や文化的背景を関与させたりすることによって初めて具体的な意味を帯びるのである。同様に、学生が大学の研究生活で専門知識と論考能力を身につけるのは重要だが、それを取り巻く状況を多角的かつ俯瞰的に観る客観的な視点の養成も不可欠である。理系の教養教育はそのためにある。