字幕表 動画を再生する
How is it that so many intergalactic species in movies and TV just happen to speak perfect English?
どうして映画やTVに出てくる銀河系生物は完璧な英語を話せるのでしょう?
The short answer is that no one wants to watch a starship crew spend years compiling an alien dictionary.
ぶっちゃけ言うと、宇宙船の乗組員がエイリアン語の辞書を引いて長時間悪戦苦闘している場面なんて誰も見たくないですよね。
But to keep things consistent, the creators of Star Trek and other science-fiction worlds have introduced the concept of a universal translator, a portable device that can instantly translate between any languages.
でも物語を首尾一貫させるために、Star Trek やその他のサイエンスフィクション作家は、持ち運びができてどんな言語でもその場で翻訳してくれる統一翻訳機のアイデアを採用しています。
So is a universal translator possible in real life?
ではこの統一翻訳機は現実の世界でも実現可能でしょうか?
We already have many programs that claim to do just that, taking a word, sentence, or entire book in one language and translating it into almost any other, whether it's modern English or Ancient Sanskrit.
すでにそれが出来るというプログラムはたくさん登場していて、単語や文章、本全体を1つの言語から近代英語や古代サンスクリット語まで何語にでも翻訳できるというものです。
And if translation were just a matter of looking up words in a dictionary, these programs would run circles around humans.
もし翻訳というのが単に辞書で言葉を引いて終わりであれば、こういったプログラムは人類に勝る存在になるでしょう。
The reality, however, is a bit more complicated.
しかし、現実と言うのはもう少し複雑なものです。
A rule-based translation program uses a lexical database, which includes all the words you'd find in a dictionary and all grammatical forms they can take, and a set of rules to recognize the basic linguistic elements in the input language.
ルールベースの翻訳プログラムは語彙データベースを使っており、辞書に入っている単語や文法的形式、ならびに入力する言語の基本的言語要素の一連のルールが含まれています。
For a seemingly simple sentence like, "The children eat the muffins," the program first parses its syntax, or grammatical structure, by identifying the children as the subject, and the rest of the sentence as the predicate consisting of a verb "eat," and a direct object "the muffins."
何となくシンプルな文章、例えば「The children eat the muffins」の場合は、プログラムはまず構文または文法構造を解析しますが、この際に children が主語で 残りは動詞の eat や直接目的語の the muffins が入っている述語だと割り出すわけです。
It then needs to recognize English morphology, or how the language can be broken down into its smallest meaningful units, such as the word muffin and the suffix "s," used to indicate plural.
そこから、英語の形態論、もしくは言語がどのようにして最小の意味を持った単位に分割されるのか、を認識する必要があるのでmuffin と接尾辞の s が合わさって複数形だというように把握していきます。
Finally, it needs to understand the semantics, what the different parts of the sentence actually mean.
最後に、文章の異なる場所がそれぞれどういう意味を持つかという意味論的理解が必要です。
To translate this sentence properly, the program would refer to a different set of vocabulary and rules for each element of the target language.
この文章を正確に翻訳するために、プログラムは翻訳していく言語の色々な種類の語彙や各要因におけるルールに照合していきます。
But this is where it gets tricky.
ただ、ここでややこしくなってくるんです。
The syntax of some languages allows words to be arranged in any order, while in others, doing so could make the muffin eat the child.
言語の構文の中にはどの順番でも大丈夫なものもあれば、別の言語に当てはめるとマフィンが子どもを食べてしまうという意味になってしまうものもあるのです。
Morphology can also pose a problem.
形態論も別の問題を引き起こします。
Slovene distinguishes between two children and three or more using a dual suffix absent in many other languages, while Russian's lack of definite articles might leave you wondering whether the children are eating some particular muffins, or just eat muffins in general.
スロベニアの人は2人のこどもと3人以上を他の言語にはない2重接尾辞で区別しますし、ロシア語には冠詞がないので特定のマフィンを食べているのか、一般的な意味でのマフィンを食べているのか分かりません。
Finally, even when the semantics are technically correct, the program might miss their finer points, such as whether the children "mangiano" the muffins, or "divorano" them.
最後に、意味論的に正しい場合でもプログラムは細かなところの「mangiano(食べた)」のか「divorano(むさぼり食べた)」のかを判断できません。
Another method is statistical machine translation, which analyzes a database of books, articles, and documents that have already been translated by humans.
別の方法は統計機械翻訳で、これはすでに人間が翻訳を済ませている本や記事、ドキュメントのデータベースを分析します。
By finding matches between source and translated text that are unlikely to occur by chance, the program can identify corresponding phrases and patterns, and use them for future translations.
原文と翻訳の組み合わせは偶然には起こりえないものですから、プログラムは該当するフレーズやパターンを割り出して将来的な翻訳に活用するわけです。
However, the quality of this type of translation depends on the size of the initial database and the availability of samples for certain languages or styles of writing.
しかし、この種類の翻訳の質は元となるデータベースのサイズや特定の言語サンプルや書き方のスタイルがどれほど準備されているかによります。
The difficulty that computers have with the exceptions, irregularities and shades of meaning that seem to come instinctively to humans has led some researchers to believe that our understanding of language is a unique product of our biological brain structure.
例外やイレギュラー、人間にとって本能的な感じで捉える意味など、コンピューターが判断に苦しむ要素を見る限り、研究者の中には人間の言語理解能力は生態としての脳の構造に起因するものだと信じる人もいます。
In fact, one of the most famous fictional universal translators, the Babel fish from "The Hitchhiker's Guide to the Galaxy", is not a machine at all but a small creature that translates the brain waves and nerve signals of sentient species through a form of telepathy.
事実、フィクションですが最も有名なユニバーサル翻訳者の「The Hitchhiker's Guide to the Galaxy」に登場する魚のBabelは機械ではなく小さな動物ですし、テレパシーを使って脳波や知覚神経シグナルを翻訳していきます。
For now, learning a language the old fashioned way will still give you better results than any currently available computer program.
今のところは、昔ながらの方法で言語を学んでいくことが、現在使われているどのコンピュータープログラムよりも優れた結果を得られます。
But this is no easy task, and the sheer number of languages in the world, as well as the increasing interaction between the people who speak them, will only continue to spur greater advances in automatic translation.
しかし、これは簡単な事ではありませんし、世界にあふれる言語やそれらを操る人たちの交流も増える一方ですから自動翻訳の性能は今後上達する一方でしょう。
Perhaps by the time we encounter intergalactic life forms, we'll be able to communicate with them through a tiny gizmo, or we might have to start compiling that dictionary, after all.
多分、私たちが宇宙人と実際に出会う時にはオモチャのギズモちゃんを使ってコミュニケーションが取れるかもしれませんし、もしかしたら何だかんだ言って昔ながらの辞書に戻る必要があるかも知れません。