字幕表 動画を再生する
America's favorite pie is?
翻訳: Masako Kigami 校正: Miki H
Audience: Apple. Kenneth Cukier: Apple. Of course it is.
アメリカで人気のパイと言えば?
How do we know it?
聴衆:「アップルパイ」 もちろん アップルパイですよね
Because of data.
どうして分かるのでしょうか?
You look at supermarket sales.
データがあるからです
You look at supermarket sales of 30-centimeter pies
スーパーの売上げを考えてみましょう
that are frozen, and apple wins, no contest.
30cmの冷凍パイの売上げについてです
The majority of the sales are apple.
アップルパイが断トツ1位です
But then supermarkets started selling
売上げの大部分がアップルパイです
smaller, 11-centimeter pies,
ところが スーパーが小さな
and suddenly, apple fell to fourth or fifth place.
11cmセンチのパイを売り始めると
Why? What happened?
突然 アップルパイは 4、5番目に転落しまいました
Okay, think about it.
なぜでしょうか? 何が起こったのでしょうか?
When you buy a 30-centimeter pie,
考えてみてください
the whole family has to agree,
30cmのパイを買う時は
and apple is everyone's second favorite.
家族全員の希望に沿うパイを選びます
(Laughter)
アップルパイは家族の第二希望なのです
But when you buy an individual 11-centimeter pie,
(笑)
you can buy the one that you want.
でも 個人用の11cmのパイを買う時は
You can get your first choice.
自分が欲しいパイを買います
You have more data.
自分の第一希望を買えるのです
You can see something
データがたくさんあると
that you couldn't see
データが少ない時には
when you only had smaller amounts of it.
分からなかったことが
Now, the point here is that more data
分かってくるのです
doesn't just let us see more,
つまり より多くのデータがあると
more of the same thing we were looking at.
多くが見えるだけでなく
More data allows us to see new.
見ていたことからも多くが分かるのです
It allows us to see better.
データが多いほど 新しいことが分かってきます
It allows us to see different.
より良い見方や
In this case, it allows us to see
違う見方ができるようになります
what America's favorite pie is:
この例で 分かることは
not apple.
「アメリカで人気のパイは
Now, you probably all have heard the term big data.
アップルパイではない」ということです
In fact, you're probably sick of hearing the term
皆さんは「ビッグデータ」という言葉を お聞きになられたことがあるでしょう
big data.
もしかしたら 耳にタコがでくるくらい
It is true that there is a lot of hype around the term,
お聞きになっているかもしれません
and that is very unfortunate,
ビッグデータは 誇大宣伝されている部分もあり
because big data is an extremely important tool
非常に残念なことです
by which society is going to advance.
なぜなら ビッグデータは 社会の進歩に欠かせない
In the past, we used to look at small data
非常に重要なツールだからです
and think about what it would mean
昔は 少ないデータから
to try to understand the world,
世界を理解しようと
and now we have a lot more of it,
考えてきました
more than we ever could before.
現在は 以前では考えられなかった程の
What we find is that when we have
大量のデータがあるのです
a large body of data, we can fundamentally do things
大量のデータがあると
that we couldn't do when we only had smaller amounts.
データ量が少なかった時に 不可能だったことが
Big data is important, and big data is new,
根本的に可能になる ということが分かってきました
and when you think about it,
ビッグデータは重要で 新しいものです
the only way this planet is going to deal
ビックデータについて考えてみると
with its global challenges —
地球規模の課題について-
to feed people, supply them with medical care,
食糧問題や医療の供給
supply them with energy, electricity,
エネルギーや電力の供給などに
and to make sure they're not burnt to a crisp
対処する唯一の方法であり
because of global warming —
地球温暖化の影響で
is because of the effective use of data.
カリカリに焼けることがないように
So what is new about big data? What is the big deal?
データを効率的に使うことが必要なのです
Well, to answer that question, let's think about
ビッグデータの新しいモノとは何で 重大事とは何でしょうか?
what information looked like,
その問いに答えるために
physically looked like in the past.
情報がどのようなもので
In 1908, on the island of Crete,
過去には 物理的にどう映っていたのかを 考えてみましょう
archaeologists discovered a clay disc.
1908年 クレタ島で
They dated it from 2000 B.C., so it's 4,000 years old.
考古学者が粘土の円盤を発見しました
Now, there's inscriptions on this disc,
4.000年前の紀元前2,000年のものです
but we actually don't know what it means.
この円盤には文字が書かれていますが
It's a complete mystery, but the point is that
実質的には 解読できません
this is what information used to look like
完全に謎なのですが
4,000 years ago.
4,000年前の情報がどんなもの
This is how society stored
だったのかを言いたいのです
and transmitted information.
これが 社会が情報を保管して
Now, society hasn't advanced all that much.
伝えたやり方です
We still store information on discs,
さて 社会はそれほど進歩しませんでした
but now we can store a lot more information,
今でもディスクに情報を保管しています
more than ever before.
でも 以前よりもずっと大量の情報を
Searching it is easier. Copying it easier.
保管できるのです
Sharing it is easier. Processing it is easier.
検索やコピーも より簡単です
And what we can do is we can reuse this information
共有や処理も より簡単です
for uses that we never even imagined
情報を収集する時
when we first collected the data.
かつては想像だにしなかった
In this respect, the data has gone
情報の再利用もできるのです
from a stock to a flow,
この点において データは
from something that is stationary and static
固定的なモノから流動的なモノへ
to something that is fluid and dynamic.
変化のない静的なモノから
There is, if you will, a liquidity to information.
変わりやすくダイナミックスなモノへと 変化しているのです
The disc that was discovered off of Crete
いうなれば 情報には流動性があります
that's 4,000 years old, is heavy,
クレタ島で発見された
it doesn't store a lot of information,
4,000年前の円盤は重く
and that information is unchangeable.
情報はたくさん書かれていませんし
By contrast, all of the files
書き変えることはできないのです
that Edward Snowden took
対照的に エドワード・スノーデンが
from the National Security Agency in the United States
アメリカの国家安全保障局から
fits on a memory stick
持ち出したファイルはすべて
the size of a fingernail,
指の爪サイズの
and it can be shared at the speed of light.
USBに保存でき
More data. More.
光速で共有できるのです
Now, one reason why we have so much data in the world today
データは膨れ上がっています
is we are collecting things
さて 今日の世界に大量のデータがあるのは
that we've always collected information on,
常時 情報を集めているモノを
but another reason why is we're taking things
収集しているからです
that have always been informational
別の理由は 常に情報を含みつつも
but have never been rendered into a data format
データ形式にレンダレングされていない
and we are putting it into data.
ものを集めているからです
Think, for example, the question of location.
そしてデータに置き換えます
Take, for example, Martin Luther.
例として 場所について考えてみましょう
If we wanted to know in the 1500s
マーティン・ルターを例に挙げます
where Martin Luther was,
1,500年代に
we would have to follow him at all times,
マーティン・ルターの居場所を知りたいのなら
maybe with a feathery quill and an inkwell,
常に彼の後をついて行き
and record it,
羽ペンとインク入れを持ち運び
but now think about what it looks like today.
居場所を記録しなければなりません
You know that somewhere,
でも 今日ではどうでしょうか
probably in a telecommunications carrier's database,
電気通信業者のデータペースにより
there is a spreadsheet or at least a database entry
居場所が分かります
that records your information
常に あなたの居場所に関する情報を
of where you've been at all times.
記録するスプレッドシートや
If you have a cell phone,
データベースへの登録などがあります
and that cell phone has GPS, but even if it doesn't have GPS,
携帯電話を持っているなら
it can record your information.
GPS機能があります GPS機能のない機種でも
In this respect, location has been datafied.
あなたの情報を記録できるのです
Now think, for example, of the issue of posture,
つまり 場所はデータ化されるのです
the way that you are all sitting right now,
別の例として 姿勢について考えてみましょう
the way that you sit,
今皆さん全員座っておられますが
the way that you sit, the way that you sit.
あなたの座り方
It's all different, and it's a function of your leg length
あなたの座り方 あなたの座り方
and your back and the contours of your back,
全て異なります 足の長さや
and if I were to put sensors, maybe 100 sensors
背中や背中の曲線などが違います
into all of your chairs right now,
今皆さんが座られている椅子に
I could create an index that's fairly unique to you,
100個のセンサーを付けるなら
sort of like a fingerprint, but it's not your finger.
あなた独自の座り方の特徴を
So what could we do with this?
指ではないですが 指紋のように 分類できるのです
Researchers in Tokyo are using it
これで何ができるのでしょうか?
as a potential anti-theft device in cars.
東京の研究者は
The idea is that the carjacker sits behind the wheel,
これを車の盗難防止装置 として使えると考えています
tries to stream off, but the car recognizes
運転席に車泥棒が座るという発想により
that a non-approved driver is behind the wheel,
防犯につなげようとしています
and maybe the engine just stops, unless you
認証されていないドライバーが 運転席に座ると
type in a password into the dashboard
「自分は認証されたドライバーである」
to say, "Hey, I have authorization to drive." Great.
と伝えるために ダッシュボードにパスワードを入力しないと
What if every single car in Europe
エンジンが始動しないかもしれません 素晴らしいですね
had this technology in it?
ヨーロッパで全ての車が この技術を搭載すると
What could we do then?
どうなるのでしょうか?
Maybe, if we aggregated the data,
その時 何ができるのでしょうか?
maybe we could identify telltale signs
おそらく データを収集すると
that best predict that a car accident
車の事故が 次の5秒で起こることを
is going to take place in the next five seconds.
ピタリと言い当てることが
And then what we will have datafied
できるかもしれません
is driver fatigue,
そして ドライバーの疲労を
and the service would be when the car senses
データ化し
that the person slumps into that position,
車がドライバーの姿勢が悪くなってきたと
automatically knows, hey, set an internal alarm
感じたら 自動的に 内部アラームを設定します
that would vibrate the steering wheel, honk inside
ハンドルを振動させたり
to say, "Hey, wake up,
「起きてください
pay more attention to the road."
道路にもっと注意を向けましょう」と
These are the sorts of things we can do
言葉で教えてくれます
when we datafy more aspects of our lives.
暮らしの様々な側面をデータ化すると
So what is the value of big data?
私たちのできることを分類できます
Well, think about it.
つまり ビックデータの価値とは 何でしょうか?
You have more information.
考えてみてください
You can do things that you couldn't do before.
あなたは より多くの情報を持っており
One of the most impressive areas
以前にはできなかったことが できるのです
where this concept is taking place
このコンセプトが生じる
is in the area of machine learning.
最も印象的な領域の1つが
Machine learning is a branch of artificial intelligence,
機械学習の領域です
which itself is a branch of computer science.
機械学習とは 人口知能に含まれ
The general idea is that instead of
コンピュータ・サイエンスの1つです
instructing a computer what to do,
その概念は コンピュータに
we are going to simply throw data at the problem
何をするかを教える代わりに
and tell the computer to figure it out for itself.
単純に問題となるデータを投げると
And it will help you understand it
コンピュータが独自に解明してくれるのです
by seeing its origins.
その起源を辿ると
In the 1950s, a computer scientist
分かりやすいでしょう
at IBM named Arthur Samuel liked to play checkers,
1950年代 アーサー・サミュエルという
so he wrote a computer program
IBMのコンピュータ科学者は チェッカーが好きでした
so he could play against the computer.
コンピュータ・プログラムを書き
He played. He won.
彼はコンピュータと対戦しました
He played. He won.
彼は対戦して 勝ちました
He played. He won,
彼は対戦して 勝ちました
because the computer only knew
彼は対戦して 勝ちました
what a legal move was.
コンピュータが正式なルールしか
Arthur Samuel knew something else.
知らなかったからです
Arthur Samuel knew strategy.
アーサー・サミュエルは すごいことを知っていました
So he wrote a small sub-program alongside it
彼は 戦略を知っていました
operating in the background, and all it did
彼はサブプログラムを作成して
was score the probability
バックグラウンドで走らせました
that a given board configuration would likely lead
サブプログラムは 一手ごとに
to a winning board versus a losing board
その盤面の配置から
after every move.
勝つ確率と負ける確率を
He plays the computer. He wins.
記録したのです
He plays the computer. He wins.
彼はコンピュータと対戦して 勝ちました
He plays the computer. He wins.
彼はコンピュータと対戦して 勝ちました
And then Arthur Samuel leaves the computer
彼はコンピュータと対戦して 勝ちました
to play itself.
そして アーサー・サミュエルは
It plays itself. It collects more data.
コンピュータ自体が ゲームをするようにしました
It collects more data. It increases the accuracy of its prediction.
コンピュータは独自にゲームをし より多くのデータを集めました
And then Arthur Samuel goes back to the computer
より多くのデータを集めると 予測の精度も上がります
and he plays it, and he loses,
そしてアーサー・サミュエルは
and he plays it, and he loses,
コンピュータの所へ戻り 対戦して 負けました
and he plays it, and he loses,
彼は対戦して 負けました
and Arthur Samuel has created a machine
彼は対戦して 負けました
that surpasses his ability in a task that he taught it.
アーサー・サミュエルは 教えたタスクで
And this idea of machine learning
彼の能力を凌ぐ コンピュータを作りあげました
is going everywhere.
機械学習という発想は
How do you think we have self-driving cars?
どこにでもあります
Are we any better off as a society
自動運転車はどのように 作られたと思いますか?
enshrining all the rules of the road into software?
ソフトウェアに 全道路法規を記入すると
No. Memory is cheaper. No.
より豊かな社会なのでしょうか?
Algorithms are faster. No. Processors are better. No.
いいえ 記憶装置は安価? いいえ
All of those things matter, but that's not why.
アルゴリズムがより速い? いいえ プロセッサがより良い? いいえ
It's because we changed the nature of the problem.
それらはすべて重要ですが それが理由ではありません
We changed the nature of the problem from one
問題の性質を変えているからです
in which we tried to overtly and explicitly
私たちの言わんとすることを-
explain to the computer how to drive
例えば 「自動車の周辺には多くの情報があり
to one in which we say,
皆さんは それを理解しています
"Here's a lot of data around the vehicle.
信号機についても理解しています
You figure it out.
信号機は赤で青ではないので
You figure it out that that is a traffic light,
停止する必要があり
that that traffic light is red and not green,
前進できません」ということを
that that means that you need to stop
コンピュータに明確に
and not go forward."
説明しようと試みていた
Machine learning is at the basis
問題の性質を変えてしまいました
of many of the things that we do online:
機械学習は 私たちが
search engines,
ネット上で行う多くの事の 根底となっています
Amazon's personalization algorithm,
例えば 検索エンジン
computer translation,
Amazonのパーソナライズ・アルゴリズム
voice recognition systems.
自動翻訳
Researchers recently have looked at
音声認識などです
the question of biopsies,
最近 研究者は生検や
cancerous biopsies,
ガンの生検について
and they've asked the computer to identify
研究しており
by looking at the data and survival rates
細胞が実際ガンに冒されているか
to determine whether cells are actually
どうかを調べるために
cancerous or not,
データや生存率を使って
and sure enough, when you throw the data at it,
コンピュータに 特定させようとしています
through a machine-learning algorithm,
案の定 データを入力すると
the machine was able to identify
機会学習のアルゴリズム経由で
the 12 telltale signs that best predict
コンピュータは12個の兆候を
that this biopsy of the breast cancer cells
特定することで
are indeed cancerous.
乳ガン細胞の生検結果はガンであると
The problem: The medical literature
ビタリと予測します
only knew nine of them.
問題は 医学文献が
Three of the traits were ones
9個しか兆候を知らなかったことです
that people didn't need to look for,
特性のうち 3個は
but that the machine spotted.
探す必要がないものでしたが
Now, there are dark sides to big data as well.
コンピュータは見つけました
It will improve our lives, but there are problems
さて ビックデータにも負の側面があります
that we need to be conscious of,
私たちの暮らしを向上させますが
and the first one is the idea
意識しなければならない 問題もあります
that we may be punished for predictions,
最初の問題は
that the police may use big data for their purposes,
『マイノリティ・リポート』のように
a little bit like "Minority Report."
警察が目的のためにビックデータを使って
Now, it's a term called predictive policing,
予測に基づいて 罰するかもしれないということです
or algorithmic criminology,
さて 予測警備とか
and the idea is that if we take a lot of data,
アルゴリズム的犯罪学 という用語です
for example where past crimes have been,
例えば 過去の犯罪がどこで起こったか
we know where to send the patrols.
というデータがたくさんあると
That makes sense, but the problem, of course,
パトロールすべき所が分かる という考え方です
is that it's not simply going to stop on location data,
その通りですが もちろん問題もあります
it's going to go down to the level of the individual.
場所のデータだけで止まらず
Why don't we use data about the person's
個人レベルにまで下りていってしまうことです
high school transcript?
個人の高校の成績証明書のデータを
Maybe we should use the fact that
使うのはどうでしょうか?
they're unemployed or not, their credit score,
失業しているのかどうか
their web-surfing behavior,
信用情報 ネットサーフィンの行動パターン
whether they're up late at night.
夜更かしするのかどうか などを
Their Fitbit, when it's able to identify biochemistries,
使うかもしれません
will show that they have aggressive thoughts.
Fitbit による生化学情報を得れば
We may have algorithms that are likely to predict
使用者が積極的な考え方をしていることさえ分かります
what we are about to do,
私たちの行動を予測し得る
and we may be held accountable
アルゴリズムがあり
before we've actually acted.
実際に私たちが行動する前に
Privacy was the central challenge
責任を負うことになるかもしれません
in a small data era.
スモールデータの時代では
In the big data age,
プライバシーが中心的な課題でしたが
the challenge will be safeguarding free will,
ビックデータの時代では
moral choice, human volition,
課題は 自由意思や道徳基準の選択
human agency.
人間の決断力や行為主体性などを
There is another problem:
保護することです
Big data is going to steal our jobs.
ビックデータに職を奪われるという
Big data and algorithms are going to challenge
別の問題もあります
white collar, professional knowledge work
ビックデータやアルゴリズムは
in the 21st century
20世紀に 工場の自動化や
in the same way that factory automation
組立ラインが
and the assembly line
ブルーカラーに対抗したように
challenged blue collar labor in the 20th century.
21世紀には ホワイトカラーや専門職に
Think about a lab technician
対抗することになるでしょう
who is looking through a microscope
顕微鏡を使って
at a cancer biopsy
ガン生検を調べて
and determining whether it's cancerous or not.
ガンであるかどうかを決める
The person went to university.
検査技師について考えてみましょう
The person buys property.
その検査技師は大学教育を受けました
He or she votes.
不動産物件を買ったり
He or she is a stakeholder in society.
投票したり
And that person's job,
社会への出資者でもあります
as well as an entire fleet
そして 検査技師の仕事とは
of professionals like that person,
同じような専門職の一群と同様に
is going to find that their jobs are radically changed
同じような専門職の一群と同様に
or actually completely eliminated.
仕事内容が根本的に変わったり
Now, we like to think
完全に無くなったりします
that technology creates jobs over a period of time
短い一時的な混乱の後
after a short, temporary period of dislocation,
長年に渡って テクノロジーが仕事を作ってきた
and that is true for the frame of reference
ことについて考えてください
with which we all live, the Industrial Revolution,
私たちが暮らす枠組み
because that's precisely what happened.
産業革命-は真実で
But we forget something in that analysis:
まさに起こったことです
There are some categories of jobs
しかし その分析で 忘れていることがあります
that simply get eliminated and never come back.
それはなくなり 二度と戻ってこなかった
The Industrial Revolution wasn't very good
職種があるということです
if you were a horse.
産業革命は あまり有難くないものでした
So we're going to need to be careful
あなたが馬であれば
and take big data and adjust it for our needs,
ですから 注意深く ビックデータを取扱い
our very human needs.
私たちのニーズ 非常に人間的なニーズのために
We have to be the master of this technology,
調整していく必要があります
not its servant.
私たちは この技術の召使ではなく
We are just at the outset of the big data era,
所有者にならなければなりません
and honestly, we are not very good
ビックデータの時代は 始まったばかりなので
at handling all the data that we can now collect.
正直言って 今集められた全データに
It's not just a problem for the National Security Agency.
私たちは あまりうまく対処できていません
Businesses collect lots of data, and they misuse it too,
国家安全保障局だけの 問題ではありません
and we need to get better at this, and this will take time.
企業も多くのデータを集め 乱用しています
It's a little bit like the challenge that was faced
うまく使えるようになるには 時間がかかります
by primitive man and fire.
原始人と火が直面していた課題に
This is a tool, but this is a tool that,
ちょっと似ています
unless we're careful, will burn us.
これはツールですが
Big data is going to transform how we live,
注意しないと 私たちを焼いてしまうツールなのです
how we work and how we think.
ビックデータは 生き方や働き方や考え方を
It is going to help us manage our careers
変えていくことでしょう
and lead lives of satisfaction and hope
私たちのキャリアを管理して
and happiness and health,
満足して希望が持て 幸福で健康な暮らしに
but in the past, we've often looked at information technology
導くことでしょう
and our eyes have only seen the T,
しかし 過去に 情報技術でよくあったように
the technology, the hardware,
物理的なものであるT-
because that's what was physical.
技術やハードウェアに
We now need to recast our gaze at the I,
目が行きがちになります
the information,
明確でない部分があるものの
which is less apparent,
いくつかの点において
but in some ways a lot more important.
かなり重要である I-
Humanity can finally learn from the information
情報に再び着目する必要があります
that it can collect,
世界や私たちの居場所を理解するために
as part of our timeless quest
時代を超えた冒険の一端として
to understand the world and our place in it,
集めた情報から
and that's why big data is a big deal.
人間性がついに学べるのです
(Applause)
そのことがビックデータが 重大事な理由なのです