字幕表 動画を再生する
-
America's favorite pie is?
翻訳: Masako Kigami 校正: Miki H
-
Audience: Apple. Kenneth Cukier: Apple. Of course it is.
アメリカで人気のパイと言えば?
-
How do we know it?
聴衆:「アップルパイ」 もちろん アップルパイですよね
-
Because of data.
どうして分かるのでしょうか?
-
You look at supermarket sales.
データがあるからです
-
You look at supermarket sales of 30-centimeter pies
スーパーの売上げを考えてみましょう
-
that are frozen, and apple wins, no contest.
30cmの冷凍パイの売上げについてです
-
The majority of the sales are apple.
アップルパイが断トツ1位です
-
But then supermarkets started selling
売上げの大部分がアップルパイです
-
smaller, 11-centimeter pies,
ところが スーパーが小さな
-
and suddenly, apple fell to fourth or fifth place.
11cmセンチのパイを売り始めると
-
Why? What happened?
突然 アップルパイは 4、5番目に転落しまいました
-
Okay, think about it.
なぜでしょうか? 何が起こったのでしょうか?
-
When you buy a 30-centimeter pie,
考えてみてください
-
the whole family has to agree,
30cmのパイを買う時は
-
and apple is everyone's second favorite.
家族全員の希望に沿うパイを選びます
-
(Laughter)
アップルパイは家族の第二希望なのです
-
But when you buy an individual 11-centimeter pie,
(笑)
-
you can buy the one that you want.
でも 個人用の11cmのパイを買う時は
-
You can get your first choice.
自分が欲しいパイを買います
-
You have more data.
自分の第一希望を買えるのです
-
You can see something
データがたくさんあると
-
that you couldn't see
データが少ない時には
-
when you only had smaller amounts of it.
分からなかったことが
-
Now, the point here is that more data
分かってくるのです
-
doesn't just let us see more,
つまり より多くのデータがあると
-
more of the same thing we were looking at.
多くが見えるだけでなく
-
More data allows us to see new.
見ていたことからも多くが分かるのです
-
It allows us to see better.
データが多いほど 新しいことが分かってきます
-
It allows us to see different.
より良い見方や
-
In this case, it allows us to see
違う見方ができるようになります
-
what America's favorite pie is:
この例で 分かることは
-
not apple.
「アメリカで人気のパイは
-
Now, you probably all have heard the term big data.
アップルパイではない」ということです
-
In fact, you're probably sick of hearing the term
皆さんは「ビッグデータ」という言葉を お聞きになられたことがあるでしょう
-
big data.
もしかしたら 耳にタコがでくるくらい
-
It is true that there is a lot of hype around the term,
お聞きになっているかもしれません
-
and that is very unfortunate,
ビッグデータは 誇大宣伝されている部分もあり
-
because big data is an extremely important tool
非常に残念なことです
-
by which society is going to advance.
なぜなら ビッグデータは 社会の進歩に欠かせない
-
In the past, we used to look at small data
非常に重要なツールだからです
-
and think about what it would mean
昔は 少ないデータから
-
to try to understand the world,
世界を理解しようと
-
and now we have a lot more of it,
考えてきました
-
more than we ever could before.
現在は 以前では考えられなかった程の
-
What we find is that when we have
大量のデータがあるのです
-
a large body of data, we can fundamentally do things
大量のデータがあると
-
that we couldn't do when we only had smaller amounts.
データ量が少なかった時に 不可能だったことが
-
Big data is important, and big data is new,
根本的に可能になる ということが分かってきました
-
and when you think about it,
ビッグデータは重要で 新しいものです
-
the only way this planet is going to deal
ビックデータについて考えてみると
-
with its global challenges —
地球規模の課題について-
-
to feed people, supply them with medical care,
食糧問題や医療の供給
-
supply them with energy, electricity,
エネルギーや電力の供給などに
-
and to make sure they're not burnt to a crisp
対処する唯一の方法であり
-
because of global warming —
地球温暖化の影響で
-
is because of the effective use of data.
カリカリに焼けることがないように
-
So what is new about big data? What is the big deal?
データを効率的に使うことが必要なのです
-
Well, to answer that question, let's think about
ビッグデータの新しいモノとは何で 重大事とは何でしょうか?
-
what information looked like,
その問いに答えるために
-
physically looked like in the past.
情報がどのようなもので
-
In 1908, on the island of Crete,
過去には 物理的にどう映っていたのかを 考えてみましょう
-
archaeologists discovered a clay disc.
1908年 クレタ島で
-
They dated it from 2000 B.C., so it's 4,000 years old.
考古学者が粘土の円盤を発見しました
-
Now, there's inscriptions on this disc,
4.000年前の紀元前2,000年のものです
-
but we actually don't know what it means.
この円盤には文字が書かれていますが
-
It's a complete mystery, but the point is that
実質的には 解読できません
-
this is what information used to look like
完全に謎なのですが
-
4,000 years ago.
4,000年前の情報がどんなもの
-
This is how society stored
だったのかを言いたいのです
-
and transmitted information.
これが 社会が情報を保管して
-
Now, society hasn't advanced all that much.
伝えたやり方です
-
We still store information on discs,
さて 社会はそれほど進歩しませんでした
-
but now we can store a lot more information,
今でもディスクに情報を保管しています
-
more than ever before.
でも 以前よりもずっと大量の情報を
-
Searching it is easier. Copying it easier.
保管できるのです
-
Sharing it is easier. Processing it is easier.
検索やコピーも より簡単です
-
And what we can do is we can reuse this information
共有や処理も より簡単です
-
for uses that we never even imagined
情報を収集する時
-
when we first collected the data.
かつては想像だにしなかった
-
In this respect, the data has gone
情報の再利用もできるのです
-
from a stock to a flow,
この点において データは
-
from something that is stationary and static
固定的なモノから流動的なモノへ
-
to something that is fluid and dynamic.
変化のない静的なモノから
-
There is, if you will, a liquidity to information.
変わりやすくダイナミックスなモノへと 変化しているのです
-
The disc that was discovered off of Crete
いうなれば 情報には流動性があります
-
that's 4,000 years old, is heavy,
クレタ島で発見された
-
it doesn't store a lot of information,
4,000年前の円盤は重く
-
and that information is unchangeable.
情報はたくさん書かれていませんし
-
By contrast, all of the files
書き変えることはできないのです
-
that Edward Snowden took
対照的に エドワード・スノーデンが
-
from the National Security Agency in the United States
アメリカの国家安全保障局から
-
fits on a memory stick
持ち出したファイルはすべて
-
the size of a fingernail,
指の爪サイズの
-
and it can be shared at the speed of light.
USBに保存でき
-
More data. More.
光速で共有できるのです
-
Now, one reason why we have so much data in the world today
データは膨れ上がっています
-
is we are collecting things
さて 今日の世界に大量のデータがあるのは
-
that we've always collected information on,
常時 情報を集めているモノを
-
but another reason why is we're taking things
収集しているからです
-
that have always been informational
別の理由は 常に情報を含みつつも
-
but have never been rendered into a data format
データ形式にレンダレングされていない
-
and we are putting it into data.
ものを集めているからです
-
Think, for example, the question of location.
そしてデータに置き換えます
-
Take, for example, Martin Luther.
例として 場所について考えてみましょう
-
If we wanted to know in the 1500s
マーティン・ルターを例に挙げます
-
where Martin Luther was,
1,500年代に
-
we would have to follow him at all times,
マーティン・ルターの居場所を知りたいのなら
-
maybe with a feathery quill and an inkwell,
常に彼の後をついて行き
-
and record it,
羽ペンとインク入れを持ち運び
-
but now think about what it looks like today.
居場所を記録しなければなりません
-
You know that somewhere,
でも 今日ではどうでしょうか
-
probably in a telecommunications carrier's database,
電気通信業者のデータペースにより
-
there is a spreadsheet or at least a database entry
居場所が分かります
-
that records your information
常に あなたの居場所に関する情報を
-
of where you've been at all times.
記録するスプレッドシートや
-
If you have a cell phone,
データベースへの登録などがあります
-
and that cell phone has GPS, but even if it doesn't have GPS,
携帯電話を持っているなら
-
it can record your information.
GPS機能があります GPS機能のない機種でも
-
In this respect, location has been datafied.
あなたの情報を記録できるのです
-
Now think, for example, of the issue of posture,
つまり 場所はデータ化されるのです
-
the way that you are all sitting right now,
別の例として 姿勢について考えてみましょう
-
the way that you sit,
今皆さん全員座っておられますが
-
the way that you sit, the way that you sit.
あなたの座り方
-
It's all different, and it's a function of your leg length
あなたの座り方 あなたの座り方
-
and your back and the contours of your back,
全て異なります 足の長さや
-
and if I were to put sensors, maybe 100 sensors
背中や背中の曲線などが違います
-
into all of your chairs right now,
今皆さんが座られている椅子に
-
I could create an index that's fairly unique to you,
100個のセンサーを付けるなら
-
sort of like a fingerprint, but it's not your finger.
あなた独自の座り方の特徴を
-
So what could we do with this?
指ではないですが 指紋のように 分類できるのです
-
Researchers in Tokyo are using it
これで何ができるのでしょうか?
-
as a potential anti-theft device in cars.
東京の研究者は
-
The idea is that the carjacker sits behind the wheel,
これを車の盗難防止装置 として使えると考えています
-
tries to stream off, but the car recognizes
運転席に車泥棒が座るという発想により
-
that a non-approved driver is behind the wheel,
防犯につなげようとしています
-
and maybe the engine just stops, unless you
認証されていないドライバーが 運転席に座ると
-
type in a password into the dashboard
「自分は認証されたドライバーである」
-
to say, "Hey, I have authorization to drive." Great.
と伝えるために ダッシュボードにパスワードを入力しないと
-
What if every single car in Europe
エンジンが始動しないかもしれません 素晴らしいですね
-
had this technology in it?
ヨーロッパで全ての車が この技術を搭載すると
-
What could we do then?
どうなるのでしょうか?
-
Maybe, if we aggregated the data,
その時 何ができるのでしょうか?
-
maybe we could identify telltale signs
おそらく データを収集すると
-
that best predict that a car accident
車の事故が 次の5秒で起こることを
-
is going to take place in the next five seconds.
ピタリと言い当てることが
-
And then what we will have datafied
できるかもしれません
-
is driver fatigue,
そして ドライバーの疲労を
-
and the service would be when the car senses
データ化し
-
that the person slumps into that position,
車がドライバーの姿勢が悪くなってきたと
-
automatically knows, hey, set an internal alarm
感じたら 自動的に 内部アラームを設定します
-
that would vibrate the steering wheel, honk inside
ハンドルを振動させたり
-
to say, "Hey, wake up,
「起きてください
-
pay more attention to the road."
道路にもっと注意を向けましょう」と
-
These are the sorts of things we can do
言葉で教えてくれます
-
when we datafy more aspects of our lives.
暮らしの様々な側面をデータ化すると
-
So what is the value of big data?
私たちのできることを分類できます
-
Well, think about it.
つまり ビックデータの価値とは 何でしょうか?
-
You have more information.
考えてみてください
-
You can do things that you couldn't do before.
あなたは より多くの情報を持っており
-
One of the most impressive areas
以前にはできなかったことが できるのです
-
where this concept is taking place
このコンセプトが生じる
-
is in the area of machine learning.
最も印象的な領域の1つが
-
Machine learning is a branch of artificial intelligence,
機械学習の領域です
-
which itself is a branch of computer science.
機械学習とは 人口知能に含まれ
-
The general idea is that instead of
コンピュータ・サイエンスの1つです
-
instructing a computer what to do,
その概念は コンピュータに
-
we are going to simply throw data at the problem
何をするかを教える代わりに
-
and tell the computer to figure it out for itself.
単純に問題となるデータを投げると
-
And it will help you understand it
コンピュータが独自に解明してくれるのです
-
by seeing its origins.
その起源を辿ると
-
In the 1950s, a computer scientist
分かりやすいでしょう
-
at IBM named Arthur Samuel liked to play checkers,
1950年代 アーサー・サミュエルという
-
so he wrote a computer program
IBMのコンピュータ科学者は チェッカーが好きでした
-
so he could play against the computer.
コンピュータ・プログラムを書き
-
He played. He won.
彼はコンピュータと対戦しました
-
He played. He won.
彼は対戦して 勝ちました
-
He played. He won,
彼は対戦して 勝ちました
-
because the computer only knew
彼は対戦して 勝ちました
-
what a legal move was.
コンピュータが正式なルールしか
-
Arthur Samuel knew something else.
知らなかったからです
-
Arthur Samuel knew strategy.
アーサー・サミュエルは すごいことを知っていました
-
So he wrote a small sub-program alongside it
彼は 戦略を知っていました
-
operating in the background, and all it did
彼はサブプログラムを作成して
-
was score the probability
バックグラウンドで走らせました
-
that a given board configuration would likely lead
サブプログラムは 一手ごとに
-
to a winning board versus a losing board
その盤面の配置から
-
after every move.
勝つ確率と負ける確率を
-
He plays the computer. He wins.
記録したのです
-
He plays the computer. He wins.
彼はコンピュータと対戦して 勝ちました
-
He plays the computer. He wins.
彼はコンピュータと対戦して 勝ちました
-
And then Arthur Samuel leaves the computer
彼はコンピュータと対戦して 勝ちました
-
to play itself.
そして アーサー・サミュエルは
-
It plays itself. It collects more data.
コンピュータ自体が ゲームをするようにしました
-
It collects more data. It increases the accuracy of its prediction.
コンピュータは独自にゲームをし より多くのデータを集めました
-
And then Arthur Samuel goes back to the computer
より多くのデータを集めると 予測の精度も上がります
-
and he plays it, and he loses,
そしてアーサー・サミュエルは
-
and he plays it, and he loses,
コンピュータの所へ戻り 対戦して 負けました
-
and he plays it, and he loses,
彼は対戦して 負けました
-
and Arthur Samuel has created a machine
彼は対戦して 負けました
-
that surpasses his ability in a task that he taught it.
アーサー・サミュエルは 教えたタスクで
-
And this idea of machine learning
彼の能力を凌ぐ コンピュータを作りあげました
-
is going everywhere.
機械学習という発想は
-
How do you think we have self-driving cars?
どこにでもあります
-
Are we any better off as a society
自動運転車はどのように 作られたと思いますか?
-
enshrining all the rules of the road into software?
ソフトウェアに 全道路法規を記入すると
-
No. Memory is cheaper. No.
より豊かな社会なのでしょうか?
-
Algorithms are faster. No. Processors are better. No.
いいえ 記憶装置は安価? いいえ
-
All of those things matter, but that's not why.
アルゴリズムがより速い? いいえ プロセッサがより良い? いいえ
-
It's because we changed the nature of the problem.
それらはすべて重要ですが それが理由ではありません
-
We changed the nature of the problem from one
問題の性質を変えているからです
-
in which we tried to overtly and explicitly
私たちの言わんとすることを-
-
explain to the computer how to drive
例えば 「自動車の周辺には多くの情報があり
-
to one in which we say,
皆さんは それを理解しています
-
"Here's a lot of data around the vehicle.
信号機についても理解しています
-
You figure it out.
信号機は赤で青ではないので
-
You figure it out that that is a traffic light,
停止する必要があり
-
that that traffic light is red and not green,
前進できません」ということを
-
that that means that you need to stop
コンピュータに明確に
-
and not go forward."
説明しようと試みていた
-
Machine learning is at the basis
問題の性質を変えてしまいました
-
of many of the things that we do online:
機械学習は 私たちが
-
search engines,
ネット上で行う多くの事の 根底となっています
-
Amazon's personalization algorithm,
例えば 検索エンジン
-
computer translation,
Amazonのパーソナライズ・アルゴリズム
-
voice recognition systems.
自動翻訳
-
Researchers recently have looked at
音声認識などです
-
the question of biopsies,
最近 研究者は生検や
-
cancerous biopsies,
ガンの生検について
-
and they've asked the computer to identify
研究しており
-
by looking at the data and survival rates
細胞が実際ガンに冒されているか
-
to determine whether cells are actually
どうかを調べるために
-
cancerous or not,
データや生存率を使って
-
and sure enough, when you throw the data at it,
コンピュータに 特定させようとしています
-
through a machine-learning algorithm,
案の定 データを入力すると
-
the machine was able to identify
機会学習のアルゴリズム経由で
-
the 12 telltale signs that best predict
コンピュータは12個の兆候を
-
that this biopsy of the breast cancer cells
特定することで
-
are indeed cancerous.
乳ガン細胞の生検結果はガンであると
-
The problem: The medical literature
ビタリと予測します
-
only knew nine of them.
問題は 医学文献が
-
Three of the traits were ones
9個しか兆候を知らなかったことです
-
that people didn't need to look for,
特性のうち 3個は
-
but that the machine spotted.
探す必要がないものでしたが
-
Now, there are dark sides to big data as well.
コンピュータは見つけました
-
It will improve our lives, but there are problems
さて ビックデータにも負の側面があります
-
that