字幕表 動画を再生する
Machine learning is creating tremendous economic value today.
機械学習は今日、莫大な経済価値を生み出している。
I think 99 percent of the economic value created by machine learning today is through one type of machine learning, which is called supervised learning.
現在、機械学習によって生み出される経済価値の99%は、教師あり学習と呼ばれるある種の機械学習によるものだと思う。
Let's take a look at what that means.
その意味を考えてみよう。
Supervised machine learning, or more commonly supervised learning, refers to algorithms that learn X to Y or input to output mappings.
教師あり機械学習、またはより一般的な教師あり学習は、XからY、または入力から出力へのマッピングを学習するアルゴリズムを指す。
The key characteristic of supervised learning is that you give your learning algorithm examples to learn from that include the right answers, where by right answer I mean the correct label Y for a given input X.
教師あり学習の重要な特徴は、学習アルゴリズムに正解を含む例を与えて学習させることである。正解とは、与えられた入力Xに対する正しいラベルYを意味する。
And it's by seeing correct pairs of input X and desired output label Y that the learning algorithm eventually learns to take just the input alone without the output label and gives a reasonably accurate prediction or guess of the output.
そして、入力Xと希望する出力ラベルYの正しいペアを見ることで、学習アルゴリズムは最終的に、出力ラベルなしで入力だけを受け取り、出力の合理的に正確な予測または推測を行うことを学習する。
Let's look at some examples.
いくつかの例を見てみよう。
If the input X is an email and the output Y is this email spam or not spam, this gives you your spam filter.
入力Xが電子メールで、出力Yがこの電子メールがスパムかスパムでないかであれば、これでスパムフィルターができる。
Or if the input is an audio clip and the algorithm's job is to output the text transcript.
あるいは、入力がオーディオクリップで、アルゴリズムの仕事がテキストのトランスクリプトを出力することである場合。
Then this is speech recognition.
これが音声認識だ。
Or if you want to input English and have it output the corresponding Spanish, Arabic, Hindi, Chinese, Japanese, or something else translation, then that's machine translation.
あるいは、英語を入力し、それに対応するスペイン語、アラビア語、ヒンディー語、中国語、日本語などの翻訳を出力させたいのであれば、それは機械翻訳である。
Or the most lucrative form of supervised learning today is probably used in online advertising.
あるいは、教師あり学習で現在最も儲かっているのは、オンライン広告だろう。
Nearly all the large online ad platforms have a learning algorithm that inputs some information about an ad and some information about you and then tries to figure out if you will click on that ad or not.
ほぼすべての大規模なオンライン広告プラットフォームは、広告とあなたに関するいくつかの情報を入力し、あなたがその広告をクリックするかどうかを把握しようとする学習アルゴリズムを持っています。
Because by showing you ads that you're slightly more likely to click on, for these large online ad platforms, every click is revenue.
なぜなら、クリックする可能性が少しでも高い広告を表示することで、これらの大規模なオンライン広告プラットフォームにとっては、すべてのクリックが収益となるからだ。
This actually drives a lot of revenue for these companies.
これは実際に、これらの企業にとって多くの収益をもたらす。
This is something that one's done a lot of work on.
これは、1人が多くの仕事をしてきたことだ。
Maybe not the most inspiring application, but it certainly has a significant economic impact in some companies today.
最も感動的なアプリケーションではないかもしれないが、今日、いくつかの企業で経済的に大きな影響を及ぼしていることは確かだ。
Or if you want to build a self-driving car, the learning algorithm would take as input an image and some information from other sensors, such as a radar or other things, and then try to output the position of, say, other cars so that your self-driving car can safely drive around the other cars.
あるいは、自動運転車を作りたい場合、学習アルゴリズムは、画像とレーダーなどの他のセンサーからの情報を入力として受け取り、自動運転車が他の車の周りを安全に走行できるように、例えば他の車の位置を出力しようとする。
Or take manufacturing.
あるいは、製造業を例に挙げることもできる。
I've actually done a lot of work in this sector at Landing AI.
私はランディングAIでこの分野の仕事をたくさんしてきた。
You can have a learning algorithm take as input a picture of a manufactured product, say a cell phone that just rolled off the production line, and have the learning algorithm output whether or not there is a scratch, dent, or other defect in the product.
生産ラインから出たばかりの携帯電話など、製造された製品の写真を入力として、学習アルゴリズムに入力させ、製品に傷やへこみなどの欠陥があるかどうかを出力させることができる。
This is called visual inspection and is helping manufacturers reduce or prevent defects in their products.
これは目視検査と呼ばれ、メーカーが製品の欠陥を減らしたり防いだりするのに役立っている。
In all of these applications, you would first train your model with examples of inputs X and the right answers, that is, the labels Y.
これらのアプリケーションでは、まず入力Xと正しい答え、つまりラベルYの例でモデルを訓練する。
After the model has learned from these input-output or X and Y pairs, it can then take a brand new input X, something it's never seen before, and try to produce the appropriate corresponding output Y.
モデルがこれらの入出力、つまりXとYのペアから学習した後、まったく新しい入力X、つまり今まで見たことのないものを受け取り、適切な対応する出力Yを出そうとすることができる。
Let's dive more deeply into one specific example.
具体的な例をひとつ挙げてみよう。
Say you want to predict housing prices based on the size of a house.
家の大きさに基づいて住宅価格を予測したいとしよう。
You've collected some data, and say you plot the data, and it looks like this.
あるデータを収集し、そのデータをプロットすると次のようになる。
Here on the horizontal axis is the size of the house in square feet.
横軸は家の広さ(平方フィート)。
And yes, I live in the United States where we still use square feet.
そう、私が住んでいるアメリカでは、いまだに平方フィート(約1.5平方メートル)が使われている。
I know most of the world uses square meters.
世界のほとんどが平方メートルを使っているのは知っている。
And here on the vertical axis is the price of the house in, say, thousands of dollars.
そして縦軸は、その家の価格を数千ドル単位で表している。
So with this data, let's say a friend wants to know what's the price for their 750 square foot house.
このデータを使って、友人が750平方フィートの家の値段を知りたがっているとしよう。
How can a learning algorithm help you?
学習アルゴリズムはどのように役立つのか?
One thing a learning algorithm might be able to do is, say, fit a straight line to the data.
学習アルゴリズムができることのひとつは、例えばデータに直線を当てはめることかもしれない。
And reading off the straight line, it looks like your friend's house could be sold for maybe about, I don't know, $150,000.
直線で計算すると、お友達の家は15万ドルくらいで売れそうですね。
But fitting a straight line isn't the only learning algorithm you can use.
しかし、直線を当てはめることだけが学習アルゴリズムではない。
There are others that could work better for this application.
この用途にもっと適したものが他にもあるだろう。
For example, rather than fitting a straight line, you might decide that it's better to fit a curve, a function that's slightly more complicated or more complex than a straight line.
例えば、直線を当てはめるよりも、曲線、つまり直線よりも少し複雑な、あるいはより複雑な関数を当てはめた方が良いと判断するかもしれない。
If you do that and make a prediction here, then it looks like, well, your friend's house could be sold for closer to $200,000.
そうして予測すると、友人の家は20万ドル近くで売れそうだ。
One of the things you see later in this class is how you can decide whether to fit a straight line, a curve, or another function that is even more complex to the data.
このクラスの後半で見ることのひとつは、直線に当てはめるか、曲線に当てはめるか、あるいはさらに複雑な別の関数に当てはめるかを、どのようにデータに当てはめるかを決める方法である。
Now, it doesn't seem appropriate to pick the one that gives your friend the best price.
今、あなたの友人が最も安く買えるものを選ぶのは適切ではないように思える。
But one thing you see is how to get an algorithm to systematically choose the most appropriate line or curve or other thing to fit to this data.
しかし、あなたが見ていることのひとつは、このデータに当てはめるのに最も適切な直線や曲線などを体系的に選択するアルゴリズムをどうやって手に入れるかということだ。
What you've seen in this slide is an example of supervised learning.
このスライドでご覧いただいたのは、教師あり学習の例です。
Because we gave the algorithm a data set in which the so-called right answer, that is, the label or the correct price y, is given for every house on the plot.
というのも、私たちはアルゴリズムに、いわゆる正解、つまりラベルや正しい価格yがプロット上のすべての家について与えられているデータセットを与えたからだ。
And the task of the learning algorithm is to produce more of these right answers, specifically predicting what is the likely price for other houses like your friend's house.
そして、学習アルゴリズムのタスクは、このような正しい答えをより多く出すことであり、具体的には、あなたの友人の家のような他の家の価格がどれくらいになりそうかを予測することである。
That's why this is supervised learning.
だから教師あり学習なのだ。
To define a little bit more terminology, this housing price prediction is a particular type of supervised learning called regression.
もう少し専門用語を定義すると、この住宅価格予測は回帰と呼ばれる教師あり学習の特殊なタイプである。
And by regression, I mean we're trying to predict a number from infinitely many possible numbers, such as the house prices in our example, which could be 150,000 or 70,000 or 183,000 or any other number in between.
回帰というのは、無限にあり得る数字から数字を予測しようということで、例えば、この例では住宅価格は15万円かもしれないし、7万円かもしれないし、18万3千円かもしれないし、その中間の数字かもしれない。
So that's supervised learning, learning input-output or x-to-y mappings.
これが教師あり学習で、入力と出力、あるいはXとYのマッピングを学習する。
And you saw in this video an example of regression, where the task is to predict a number.
このビデオでは、数字を予測する回帰の例を見ましたね。
But there's also a second major type of supervised learning problem called classification.
しかし、教師あり学習の問題には、分類と呼ばれる第二の主要なタイプもある。
Let's take a look at what that means in the next video.
それが何を意味するのか、次のビデオで見てみよう。