Placeholder Image

字幕表 動画を再生する

審査済み この字幕は審査済みです
  • In a fraction of a second, Google Translate can make sense of your surroundings.

    Google 翻訳は一瞬であなたの周囲の状況を理解することができます。

  • But this isn't the same Google Translate from the early 2000s.

    しかし、これは 2000 年代初頭の Google 翻訳とは違います。

  • Over the past two decades, the technology has gone through a complete overhaul, shifting from a basic pattern matching tool to a sophisticated neural network that handles more than 130 languages.

    過去20年の間に、このテクノロジーは全面的な見直しが行われ、基本的なパターンマッチングツールから130以上の言語を扱う洗練されたニューラルネットワークへと移行しました。

  • It works by turning language into something computers can understand:

    それは、言語をコンピューターが理解できるものに変えることで機能します。

  • Math.

    数学です。

  • Exciting times for people who like language and math.

    言語と数学が好きな人にとってはエキサイティングな時代です。

  • This is the tech behind Google Translate.

    これがグーグル翻訳の技術です。

  • There's very little code left today from the early days of the phrase-based translation.

    現在、フレーズベース翻訳の初期の頃のコードはほとんど残っていません。

  • We have shut down and deleted almost all of it.

    私たちはそのほとんどを閉鎖し、削除しました。

  • That Google Translate from two decades ago laid the foundation for what we use today.

    20年前の Google 翻訳が、今日私たちが使っているものの基礎を築いたのです。

  • When it launched in 2006, it worked by playing a matching game.

    2006年に発売された当初は、マッチングゲームによって機能しました。

  • First, the model looked at lots of examples of professional translations scraped from the internet.

    まず、このモデルはインターネットから集めたプロの翻訳例をたくさん見ました。

  • Then, when users entered sentences for translation, the tool would break them into the longest possible chunks of words it had seen before and combine the chunks.

    そして、ユーザーが翻訳のために文章を入力すると、ツールはその文章をできるだけ長い単語の塊に分割し、その塊を組み合わせます。

  • It now uses a much more sophisticated machine learning approach, a so-called transformer model, which is the building block of all modern AI.

    現在では、より洗練された機械学習アプローチ、いわゆるトランスフォーマーモデルを使用しています。

  • Transformers turn language into math by assigning numbers to words.

    トランスフォーマーは、言葉に数字を割り当てることで、言語を数学に変えます。

  • The key insight is that a series of numbers can represent a meaning.

    重要な洞察は、一連の数字が意味を表すことができるということです。

  • You can then do math with those vectors that shows something about the relationships of the meanings of words to each other.

    そして、そのベクトルを使って、言葉の意味同士の関係を示すような計算をすることができます。

  • For each language Google Translate supports, every word gets converted into a vector, which is written like a list of numbers.

    Google 翻訳がサポートする各言語について、すべての単語はベクトルに変換され、数字のリストのように書かれます。

  • This way, the computer can do math with them.

    こうすることで、コンピューターが計算できるようになります。

  • For instance, king minus man plus woman equals queen.

    例えば、王から男を引いて女足すと女王になります。

  • The specific numbers assigned to each word don't really matter, and they're different in different languages.

    各単語に割り当てられた具体的な数字はあまり重要ではなく、言語によって異なります。

  • But what matters is how each word relates to every other word.

    しかし重要なのは、それぞれの単語が他の単語とどのように関係しているかということです。

  • It's all based on machine learning from billions of examples.

    それはすべて、何十億もの事例からの機械学習に基づいています。

  • But most of the time you want to translate something, it's not just an individual word.

    しかし、何かを翻訳したい場合、たいていの場合、個々の単語だけではありません。

  • So the computer also has to figure out how words work together.

    そのため、コンピューターは単語がどのように組み合わされるかを理解しなければなりません。

  • And this is where transformers, a breakthrough in machine learning, come in.

    そこで登場するのが、機械学習における画期的な技術であるトランスフォーマーです。

  • The next generation of neural translation was called the transformer architecture.

    次世代のニューラル・トランスレーションはトランスフォーマー・アーキテクチャーと呼ばれました。

  • And this added a level, so it moved from representing the meaning of one word by a row of numbers to putting all the meanings of all the words into a table and doing math on that whole table.

    そして、これはレベルを追加し、1つの単語の意味を数字の列で表すことから、すべての単語の意味を表にして、その表全体で計算することになりました。

  • And that enables you to do math that talks about not only the meaning of each word, but the importance of the relationships of the words to each other.

    そして、各単語の意味だけでなく、単語同士の関係の重要性を語る数学ができるようになります。

  • Say you're trying to translate this Italian sign into English.

    このイタリア語の看板を英語に翻訳しようとしているとします。

  • First, Google Translate would turn each word into a vector.

    まず、グーグル翻訳が各単語をベクトルに変換します。

  • And those vectors would be put into one giant table, or matrix.

    そして、それらのベクトルは1つの巨大な表(マトリックス)にまとめられます。

  • Then the computer tries to figure out how each word interacts with every other word on this side.

    そしてコンピューターは、各単語がこちら側の他のすべての単語とどのように相互作用するかを解明しようとします。

  • Mathematically, this is basically a lot of multiplication.

    数学的には、これは基本的に多くの掛け算であります。

  • The most important kind of magical step is laying them out in a matrix and doing what's called matrix multiplication.

    最も重要な魔法のステップは、それらを行列に並べ、行列の掛け算と呼ばれるものを行うことです。

  • And if you do enough of that, you can solve this problem.

    そして、それを十分に行えば、この問題を解決することができます。

  • All this creates a new list of numbers.

    これらすべてによって、新しい数字のリストが作成されます。

  • This is what's called a context vector.

    これはいわゆるコンテキストベクターです。

  • And it's something pretty special.

    そして、それはかなり特別なものです。

  • This list of numbers actually represents what the sentence means.

    この数字の羅列は、実際に文の意味を表しています。

  • Not just the sum of all of its words.

    言葉の総和だけではありません。

  • At least, if the model has done its job correctly.

    少なくとも、モデルが正しく仕事をしたのであれば。

  • If you put that together and are very clever, which the people who invented transformers were, and you train on a lot of data, which we do, you can eventually get to a collection of numbers that meaningfully represents the meaning of the sentence.

    変圧器を発明した人々がそうであったように、これを組み合わせて非常に賢くなり、私たちが行っているように、多くのデータで訓練すれば、最終的に文の意味を有意義に表す数字の集まりを得ることができます。

  • So that's called the encoder stage.

    これがエンコーダー・ステージというわけです。

  • Then you have a decoder, which, roughly speaking, is the encoder in reverse.

    デコーダーは、大雑把に言えば、エンコーダーを逆にしたものです。

  • The computer has to decode this back to human language.

    コンピューターはこれを人間の言葉にデコードしなければなりません。

  • The decoder now also goes through lots and lots of operations.

    デコーダーもたくさんの操作をするようになりました。

  • And finally, you start getting vectors out which can be mapped back to individual words.

    そして最終的に、個々の単語にマッピングできるベクトルを取り出します。

  • So we hopefully get closed, four, then holiday.

    だから、うまくいけばクローズ、4クローズ、そしてホリデーになります。

  • So this is how language becomes math.

    こうして言語が数学になるわけです。

  • Getting this math to work requires a lot of training.

    この計算を機能させるには、多くのトレーニングが必要です。

  • Lots of the numbers in this math problem are chosen randomly and then refined as the computer learns from billions of examples.

    この数学の問題では、たくさんの数字がランダムに選ばれ、コンピューターが何十億もの例題から学習するにつれて洗練されていきます。

  • Before deploying an update with a set of values and weights, engineers run numerous tests with their AI evaluator and then professional human translators who check accuracy.

    値や重みを設定したアップデートを展開する前に、エンジニアはAI評価者とともに何度もテストを行い、プロの人間翻訳者が精度をチェックします。

  • But since every possible combination of words leads to a unique equation, it's impossible to test everything.

    しかし、ありとあらゆる言葉の組み合わせが唯一無二の方程式につながるため、すべてをテストすることは不可能です。

  • Since the model has trained on translations going to or from English, it often requires more steps to go between two non-English languages.

    このモデルは英語から英語への翻訳を学習しているため、英語以外の2つの言語間を行き来するには、より多くのステップが必要になることが多いです。

  • For example, if you want to translate something in Japanese to Zulu, it will go from Japanese to English and then English to Zulu.

    例えば、日本語の何かをズールー語に翻訳したい場合、日本語から英語に翻訳され、次に英語からズールー語に翻訳されます。

  • The first thing that happens when you use Google AR Translate is that we have to actually extract the text from the image.

    Google AR Translate を使うと、まず画像からテキストを抽出しなければなりません。

  • And so as you can see here, it detects that now this is Chinese and it translates it to English.

    そしてご覧のように、これが中国語であることを検出し、英語に翻訳します。

  • It makes information a lot more accessible because for many people typing script in a foreign language is not an option.

    多くの人々にとって、外国語でスクリプトを入力することはオプションではないため、情報がより身近なものになります。

  • The key component is a technology called Optical Character Recognition, or OCR.

    その鍵となるのが、光学式文字認識(OCR)と呼ばれる技術です。

  • Google has been using that since 2002, when it started digitizing libraries for Google Books.

    グーグルは、2002年にグーグルブックスのために図書館のデジタル化を開始して以来、これを利用しています。

  • Initially, it would do something very simple like pattern matching.

    最初は、パターンマッチングのような非常に単純なことをします。

  • So you can think of it as, is this the same as this?

    つまり、これはこれと同じなのでしょうか?

  • Yes, so it's an A or B or whatnot.

    そう、だからAとかBとか、そういうことなんです。

  • But now, Optical Character Recognition also uses transformers.

    しかし現在では、光学式文字認識にも変圧器が使われています。

  • First, Google Lens identifies lines of text and text direction.

    まず、Google レンズはテキストの行とテキストの方向を識別します。

  • Then it determines specific characters and words.

    そして、特定の文字や単語を決定します。

  • Instead of dividing the sentence into words and assigning numbers to each word, though, it divides an image into patches of pixels.

    しかし、文章を単語に分割し、各単語に数字を割り当てる代わりに、画像をピクセルのパッチに分割します。

  • These are called tokens.

    これらはトークンと呼ばれます。

  • The encoder of the transformer is going to process all of these tokens simultaneously to predict the best character and the best word eventually.

    変換器のエンコーダーは、これらのトークンをすべて同時に処理し、最終的に最適な文字と単語を予測します。

  • This means that Google Lens, the company's visual search tool, can often read things even when it can't make out every single letter.

    つまり、Google のビジュアル検索ツールである Google Lens は、一文字一文字を読み取ることができなくても、多くの場合、物事を読み取ることができるということです。

  • With transformers, they're able to pick up on grammar.

    トランスフォーマーなら、文法を拾うことができます。

  • If there is a spelling mistake, the transformer will also be able to use the context to disambiguate and still extract the right word.

    スペルミスがあった場合、変換器は文脈を利用して曖昧性を解消し、正しい単語を抽出することもできます。

  • After it completes Optical Character Recognition, Google Lens analyzes the layout of all the text.

    光学式文字認識が完了した後、グーグルレンズはすべてのテキストのレイアウトを分析します。

  • That's how a computer would know to translate this sign as "you matter, don't give up," rather than "you don't matter, give up."

    だから、コンピューターはこのサインを「あなたは重要だ、あきらめるな」と訳すのではなく、「あなたは重要ではない、あきらめるな」と訳すのです。

  • When you look at the newspaper, humans are excellent at just glancing at it and understanding what is the reading order, what should you read first.

    新聞を見るとき、人間は新聞をちらっと見るだけで、読む順番、何を最初に読むべきかを理解することに優れています。

  • This is a concept that isn't actually easy to solve technically.

    これは技術的に解決するのが実は簡単ではない概念です。

  • It's very hard.

    とても難しいです。

  • The key is for Optical Character Recognition to understand something about the meaning of what it's reading.

    重要なのは、光学式文字認識が読み取ったものの意味を理解することです。

  • This is also done through extensive training.

    これもまた、徹底的なトレーニングによって行われます。

  • After the chunks of text are sent to the translator,

    テキストの塊が翻訳者に送られた後、

  • Google Lens uses painting models to erase the text off different signs or backgrounds.

    Google Lens は絵画モデルを使って、さまざまな標識や背景から文字を消します。

  • That way, translated text can be placed on top of clean surfaces.

    そうすれば、翻訳されたテキストをきれいな表面の上に置くことができます。

  • Using generative models, it tries to predict and create pixels that match the surrounding pixels so that when we overlay the translated text, it looks very natural and seamless.

    生成モデルを使って、周囲のピクセルと一致するピクセルを予測・作成しようとするため、翻訳されたテキストを重ね合わせると、とても自然でシームレスに見えます。

  • This doesn't always work seamlessly.

    これは常にシームレスに機能するわけではありません。

  • This one is not picking up the first line. I'm not sure why.

    こちらは1行目を拾いません。理由はよくわかりません。

  • Some translations don't fully account for context, which is why alto on this Mexican stop sign might be mistranslated to high.

    メキシコの停止標識のアルトがハイと誤訳されるのはそのためです。

  • And while Optical Character Recognition can frequently identify text in bad lighting or with complicated perspective, it has its limits.

    また、光学式文字認識では、照明の悪い場所や複雑な遠近法のテキストを頻繁に識別できますが、それには限界があります。

  • One of them is with deformable objects.

    そのひとつが変形可能なオブジェクトです。

  • Whenever there is text on like a sweater or cookie wrapper, depending on the pose and the angle, it might be more challenging and difficult to extract the right OCR.

    セーターやクッキーの包み紙のように文字がある場合、ポーズや角度によっては、正しい OCR を抽出するのが難しくなります。

  • Well-formed, grammatically correct, fluent text we're quite good at.

    整った、文法的に正しい、流暢な文章は私たちの得意とするところです。

  • Where we have challenges is people using slang, using casual speech in chat and social media.

    私たちが課題としているのは、人々がスラングを使ったり、チャットやソーシャルメディアでカジュアルな言葉を使ったりすることです。

  • We don't necessarily see as much of that because we don't have access to as much data.

    私たちは多くのデータにアクセスすることができないので、必ずしもそれを目にすることはありません。

  • Google is working to add some more features, like letting users refine their translations if they want to, similar to how you can ask Google Gemini or ChatGPT to make translation more or less formal,

    Google は、Google Gemini やチャット GPT で、翻訳をよりフォーマルなものにしたり、そうでないものにしたり、ヨーロッパのスペイン語ではなくチリのスペイン語にしたりするのと同じように、ユーザーが望めば翻訳を絞り込むことができるようにするなど、さらにいくつかの機能を追加するために取り組んでいます。

  • or in Chilean Spanish rather than European Spanish.

  • And it's also working to add more languages.

    また、さらなる言語の追加にも取り組んでいます。

  • There are an estimated 6,000 to 7,000 languages in the world.

    世界には 6,000 から 7,000 の言語があると推定されています。

  • Our goal is to support all of them.

    私たちの目標は、彼ら全員をサポートすることです。

In a fraction of a second, Google Translate can make sense of your surroundings.

Google 翻訳は一瞬であなたの周囲の状況を理解することができます。

字幕と単語
審査済み この字幕は審査済みです

ワンタップで英和辞典検索 単語をクリックすると、意味が表示されます