字幕表 動画を再生する
I'm going to be talking about statistics today.
翻訳: Naoko Fujii 校正: Eriko T
If that makes you immediately feel a little bit wary, that's OK,
今日は統計について お話しします
that doesn't make you some kind of crazy conspiracy theorist,
即座に身構えてしまう方も 大丈夫ですよ
it makes you skeptical.
統計を疑うのは 狂気の陰謀論者というわけではありません
And when it comes to numbers, especially now, you should be skeptical.
疑い深いだけです
But you should also be able to tell which numbers are reliable
数字について 特に今は 疑い深くあるべきです
and which ones aren't.
でも どの数値が信頼できて どれは信頼できないのか
So today I want to try to give you some tools to be able to do that.
区別もできるべきです
But before I do,
今日はそれを可能にする いくつかのヒントをお教えします
I just want to clarify which numbers I'm talking about here.
でもその前に
I'm not talking about claims like,
私の言う数値とは どんなものか 明確にしましょう
"9 out of 10 women recommend this anti-aging cream."
こういうものではありません
I think a lot of us always roll our eyes at numbers like that.
「10人中9人の女性が この美容クリームを勧めています」
What's different now is people are questioning statistics like,
この類の数値に いつも呆れている人は多いでしょう
"The US unemployment rate is five percent."
でも今 疑問が呈されているのは こんな統計なんです
What makes this claim different is it doesn't come from a private company,
「米国の失業率は5%」
it comes from the government.
どこが違うかというと これは民間企業ではなく
About 4 out of 10 Americans distrust the economic data
政府が出した数値だという点です
that gets reported by government.
米国人の10人中4人は 政府が報告する経済データを
Among supporters of President Trump it's even higher;
信用していません
it's about 7 out of 10.
トランプ大統領の支持者だと この割合は更に高く
I don't need to tell anyone here
10人中7人です
that there are a lot of dividing lines in our society right now,
皆さんもご存知のように
and a lot of them start to make sense,
目下 社会の分断が いくつも起こっており
once you understand people's relationships with these government numbers.
そういった多くの分断の意味が
On the one hand, there are those who say these statistics are crucial,
人々と 政府の出す数値との 関係を理解すれば 見えてきます
that we need them to make sense of society as a whole
一方には このような統計は 欠かせないと言う人たちもいます
in order to move beyond emotional anecdotes
統計値は社会全体を 把握するために必要で
and measure progress in an [objective] way.
感情的な逸話を超えて
And then there are the others,
客観的に物事の推移を 見定めるために必要だと
who say that these statistics are elitist,
他方では こんな統計は
maybe even rigged;
エリート主義的で
they don't make sense and they don't really reflect
操作されていると 言う人々もいます
what's happening in people's everyday lives.
統計の数値は辻褄が合わず
It kind of feels like that second group is winning the argument right now.
人々の日常生活の状況を あまり反映していないというのです
We're living in a world of alternative facts,
今は 2番目のグループの主張が 優勢であるように感じます
where people don't find statistics this kind of common ground,
「もう一つの事実」の世界に 私たちは生きています
this starting point for debate.
人々は統計が 世界を捉える際の 共通の土台だとか
This is a problem.
議論の出発点だとは 考えていません
There are actually moves in the US right now
これは問題です
to get rid of some government statistics altogether.
ちょうど今 米国で 実際に見られるのが
Right now there's a bill in congress about measuring racial inequality.
一部の政府統計を まるごと削除しようとする動きです
The draft law says that government money should not be used
今まさに開会中の議会に 人種的不平等の調査に関する法案が出ています
to collect data on racial segregation.
その草案によると 政府のお金は
This is a total disaster.
人種差別のデータ収集に 使うべきでないそうです
If we don't have this data,
そんなことになったら 大惨事です
how can we observe discrimination,
このデータ無しで
let alone fix it?
差別の是正はおろか
In other words:
どうやれば差別を 把握できるのでしょう?
How can a government create fair policies
言い換えると
if they can't measure current levels of unfairness?
現状の不公平さを測定できないなら
This isn't just about discrimination,
どうやれば公平な政策を 政府は作れるのでしょう?
it's everything -- think about it.
これは差別についてだけではなく
How can we legislate on health care
全てに言えることです いいですか
if we don't have good data on health or poverty?
健康や貧困に関する きちんとしたデータ無しで
How can we have public debate about immigration
どうやれば医療政策を 立案できるのでしょう?
if we can't at least agree
出入国者数について 共通理解にさえ
on how many people are entering and leaving the country?
達していないなら
Statistics come from the state; that's where they got their name.
どうやれば公に移民に関する議論が できるというのでしょう?
The point was to better measure the population
statistics (統計) という語の由来は state (国) です
in order to better serve it.
つまり より良い公共サービスを 提供するために
So we need these government numbers,
国民をより正確に測定するのです
but we also have to move beyond either blindly accepting
だから 政府の統計は必要なんです
or blindly rejecting them.
でも それを盲目的に受け入れたり 拒絶したりする態度も
We need to learn the skills to be able to spot bad statistics.
改めねばなりません
I started to learn some of these
誤った統計を見抜くスキルを 身に付ける必要があります
when I was working in a statistical department
私がそのスキルを学び始めたのは
that's part of the United Nations.
国連にある統計部門で
Our job was to find out how many Iraqis had been forced from their homes
働いていた頃でした
as a result of the war,
私達の仕事は何人のイラク人が 戦争の結果 家を追われ
and what they needed.
また彼らに何が必要なのか
It was really important work, but it was also incredibly difficult.
見いだすことでした
Every single day, we were making decisions
非常に重要な仕事でしたが 信じられないほど難しくもありました
that affected the accuracy of our numbers --
私達の日々下す決断が
decisions like which parts of the country we should go to,
数値の正確さに影響を及ぼしました
who we should speak to,
イラクのどの地域に行くべきか
which questions we should ask.
誰と話をするべきか
And I started to feel really disillusioned with our work,
どんな質問をするべきかなどです
because we thought we were doing a really good job,
そして私は自分達の仕事に 幻滅を覚えるようになりました
but the one group of people who could really tell us were the Iraqis,
自分達は非常に良い仕事を していると思っていましたが
and they rarely got the chance to find our analysis, let alone question it.
それが いちばん分かるはずの 当のイラクの人達が
So I started to feel really determined
分析結果を目にする機会は稀で 検証する機会は尚更なかったからです
that the one way to make numbers more accurate
それで私は強い確信を 持つようになりました
is to have as many people as possible be able to question them.
より正確な数値を得る方法の1つは
So I became a data journalist.
できるだけ多くの人々がそれを 検証できるようにすることだと
My job is finding these data sets and sharing them with the public.
それでデータ・ジャーナリストに なったんです
Anyone can do this, you don't have to be a geek or a nerd.
私の仕事はこのようなデータを見つけ 公に広めることです
You can ignore those words; they're used by people
誰でもできることです オタクでなくていいんです
trying to say they're smart while pretending they're humble.
そんな言葉 無視して結構 そういう言い方をするのは
Absolutely anyone can do this.
謙虚なふりをして 自分が賢いのだと言いたい人達です
I want to give you guys three questions
本当に誰でもできます
that will help you be able to spot some bad statistics.
問うべき3つの質問を 皆さんにお教えします
So, question number one is: Can you see uncertainty?
誤った統計を見抜くのを 助けてくれる質問です
One of things that's really changed people's relationship with numbers,
では質問1 データの不確実さが分かるか?
and even their trust in the media,
人々の統計値との関係や
has been the use of political polls.
メディアへの信頼さえも変えた 事柄の1つは
I personally have a lot of issues with political polls
政治に関する世論調査です
because I think the role of journalists is actually to report the facts
政治関連の世論調査には 個人的に思うところが多々あります
and not attempt to predict them,
なぜなら記者の役割は 事実を報道することであって
especially when those predictions can actually damage democracy
予測を試みることではないからです
by signaling to people: don't bother to vote for that guy,
特にそういった予測は 民主主義を損ないかねません
he doesn't have a chance.
人々にシグナルを送ることになるからです 「彼へ投票する価値はない」
Let's set that aside for now and talk about the accuracy of this endeavor.
「彼には勝ち目がないよ」と
Based on national elections in the UK, Italy, Israel
それはさておき この試みの正確性について話しましょう
and of course, the most recent US presidential election,
イギリス、イタリア、イスラエルの 国政選挙や
using polls to predict electoral outcomes
それにもちろん 最近の アメリカ大統領選を見る限り
is about as accurate as using the moon to predict hospital admissions.
選挙予測に世論調査を用いるのは
No, seriously, I used actual data from an academic study to draw this.
月を見て入院数を予測する程度の 正確さしかありません
There are a lot of reasons why polling has become so inaccurate.
本当ですよ このグラフを描くのには ある学術研究のデータを使っています
Our societies have become really diverse,
世論調査が非常に不正確になったのには 多くの理由があります
which makes it difficult for pollsters to get a really nice representative sample
私達の社会は 多様性を著しく増しており
of the population for their polls.
世論調査員が 適切な代表的サンプルを得るのが
People are really reluctant to answer their phones to pollsters,
難しくなっています
and also, shockingly enough, people might lie.
電話で世論調査に答えることに 人々は本当に消極的ですし
But you wouldn't necessarily know that to look at the media.
ショックなことですが 嘘をつく人までいるんです
For one thing, the probability of a Hillary Clinton win
でも報道を見ていて 必ずしもそういうことは分かりません
was communicated with decimal places.
例えば ヒラリー・クリントンの勝率は
We don't use decimal places to describe the temperature.
小数の位まで報道されていました
How on earth can predicting the behavior of 230 million voters in this country
気温を示すとき 小数の位は使いませんね
be that precise?
この国の2億3千万人いる 有権者の行動予測が
And then there were those sleek charts.
そんなに正確にできるでしょうか?
See, a lot of data visualizations will overstate certainty, and it works --
そして しゃれた図表がありました
these charts can numb our brains to criticism.
データの視覚化は 多くの場合 確実性を誇張してしまいます
When you hear a statistic, you might feel skeptical.
そうした図表は 脳の批判的思考力を 麻痺させるんです
As soon as it's buried in a chart,
統計データを耳から聞くと 疑い深くなるかもしれませんが
it feels like some kind of objective science,
それが図表にされるや否や
and it's not.
客観的な科学の類に 思えてしまうんです
So I was trying to find ways to better communicate this to people,
実際は違います
to show people the uncertainty in our numbers.
それで私は人々に 数値のこうした不確実性について
What I did was I started taking real data sets,
うまく伝える方法を探していました
and turning them into hand-drawn visualizations,
私がしたのは 現実のデータセットを入手して
so that people can see how imprecise the data is;
それを手描きで 視覚化するということでした
so people can see that a human did this,
データの不正確さを 分かってもらうためです
a human found the data and visualized it.
統計は人間が集計していて
For example, instead of finding out the probability
人間がデータを見いだし 視覚化しているのだと分かるように
of getting the flu in any given month,
例えば インフルエンザに かかる確率を
you can see the rough distribution of flu season.
月ごとに算出するのではなく
This is --
流行シーズンがいつかという分布を 示してもいいんです
(Laughter)
こんな風に —
a bad shot to show in February.
(笑)
But it's also more responsible data visualization,
2月の今 見るものではないですね
because if you were to show the exact probabilities,
でもこれはより責任感のある データの視覚化です
maybe that would encourage people to get their flu jabs
もし正確な確率だけ見せたら
at the wrong time.
人々が予防接種を受けるのに
The point of these shaky lines
誤ったタイミングを 促しかねません
is so that people remember these imprecisions,
このような震えた線を使うポイントは
but also so they don't necessarily walk away with a specific number,
人々にこれの不正確さを 思い出させるだけでなく
but they can remember important facts.
特定の数値だけ見て おしまいにせず
Facts like injustice and inequality leave a huge mark on our lives.
重要な事実を覚えておいて もらえるようにです
Facts like Black Americans and Native Americans have shorter life expectancies
不公平や不平等が私達の生活に 大きな痕を残しているような事実です
than those of other races,
アフリカ系やネイティブアメリカン達の 平均余命は
and that isn't changing anytime soon.
他の人種に比べ短く
Facts like prisoners in the US can be kept in solitary confinement cells
それがすぐには 変わりそうにないという事実や
that are smaller than the size of an average parking space.
米国の受刑者は 平均的な駐車スペースより
The point of these visualizations is also to remind people
狭い独房に収監されかねない という事実があります
of some really important statistical concepts,
これらの視覚化がまた 人々に思い出させてくれるのは
concepts like averages.
いくつかの非常に重要な統計の概念ー
So let's say you hear a claim like,
平均値といったものです
"The average swimming pool in the US contains 6.23 fecal accidents."
こんなことを 耳にしたとしましょう
That doesn't mean every single swimming pool in the country
「米国のプールが含む 粗相(大)の平均は6.23」
contains exactly 6.23 turds.
だからといって この国のあらゆるプールに
So in order to show that,
ウンチがちょうど6.23個 浮いている訳ではありません
I went back to the original data, which comes from the CDC,
これを示すために
who surveyed 47 swimming facilities.
元のデータに戻りました CDC(米国疾病予防管理センター)の
And I just spent one evening redistributing poop.
47の水泳施設対象の調査でした
So you can kind of see how misleading averages can be.
一晩を費やして ウンチの分布をやり直しました
(Laughter)
平均値がいかに誤解を招き得るか お分かりになるでしょう
OK, so the second question that you guys should be asking yourselves
(笑)
to spot bad numbers is:
では 第2の質問です 誤った数値を見抜くには
Can I see myself in the data?
自分にこう尋ねましょう
This question is also about averages in a way,
そのデータに自分を当てはめられるか?
because part of the reason why people are so frustrated
この質問もある意味 平均値に関するものです
with these national statistics,
なぜなら人々が 国によるこのような統計に
is they don't really tell the story of who's winning and who's losing
大変不満を覚える理由の一部は
from national policy.
それが国の政策によって 誰が損や得をしているのかを
It's easy to understand why people are frustrated with global averages
伝えていないからです
when they don't match up with their personal experiences.
なぜ人々が 自分の経験と一致しない 全体から算出された平均値に
I wanted to show people the way data relates to their everyday lives.
不満を感じるかは 容易に理解できます
I started this advice column called "Dear Mona,"
私は日常生活と関連のある形で 統計値を示したいと思い
where people would write to me with questions and concerns
『親愛なるモナへ』という 助言コラムを始めました
and I'd try to answer them with data.
人々が質問や懸念を私に書いて送り
People asked me anything.
私がそれに統計値を使って 答えるというものです
questions like, "Is it normal to sleep in a separate bed to my wife?"
あらゆる質問が来ました
"Do people regret their tattoos?"
「妻と別々のベッドで眠るのは 正常ですか?」
"What does it mean to die of natural causes?"
「タトゥーは後悔するものですか?」
All of these questions are great, because they make you think
「自然死の意味するところは?」
about ways to find and communicate these numbers.
どれも素晴らしい質問です なぜならこれらに関する統計を見つけ
If someone asks you, "How much pee is a lot of pee?"
それを伝える方法を 考えさせてくれるからです
which is a question that I got asked,
「おしっこの量が多いとは どのくらいのこと?」
you really want to make sure that the visualization makes sense
そんな質問がありましたが
to as many people as possible.
できるだけ多くの人が 理解しやすいような視覚化を
These numbers aren't unavailable.
工夫することが大切です
Sometimes they're just buried in the appendix of an academic study.
これらの数値は 入手不可能ではありません
And they're certainly not inscrutable;
時には学術研究の付録の中に 埋もれています
if you really wanted to test these numbers on urination volume,
それに突き止められないような ものでもありません
you could grab a bottle and try it for yourself.
もし本当に排尿量の 数値を検証したければ
(Laughter)
瓶を用意して 自分で試せばいいんです
The point of this isn't necessarily
(笑)
that every single data set has to relate specifically to you.
ここで大事なことですが 必ずしも
I'm interested in how many women were issued fines in France
1つ1つのデータは 自分に特に関係なくてもいいんです
for wearing the face veil, or the niqab,
フランスで何人の女性が ニカブ(顔のヴェール)の着用で
even if I don't live in France or wear the face veil.
罰金を科せられたのか 興味がありますが
The point of asking where you fit in is to get as much context as possible.
私はフランス住まいでもないし ヴェールもしません
So it's about zooming out from one data point,
自分に当てはまるかを考えるうえで 大事なのは 極力 文脈を知ることです
like the unemployment rate is five percent,
そのためには 1つのデータ点から 視野を広げてみることです
and seeing how it changes over time,
失業率が5%であるという点から
or seeing how it changes by educational status --
時間的変化を見ていったり
this is why your parents always wanted you to go to college --
教育水準によってどう変わるか 見たりするんです
or seeing how it varies by gender.
だから親御さんは皆さんに 大学へ行って欲しがったんですね
Nowadays, male unemployment rate is higher
あるいは 性別でどう違うかを 見たりします
than the female unemployment rate.
最近では 男性の失業率は
Up until the early '80s, it was the other way around.
女性より高くなっています
This is a story of one of the biggest changes
80年代初めまでは逆だったんです
that's happened in American society,
これはアメリカ社会で起きた
and it's all there in that chart, once you look beyond the averages.
最大の変化の1つです
The axes are everything;
平均値以上のことに目を向ければ すべて図表の中に読み取れるのです
once you change the scale, you can change the story.
XY軸が重要です
OK, so the third and final question that I want you guys to think about
尺度を変えれば 物語られることも変わるのです
when you're looking at statistics is:
いいでしょう では皆さんが統計を見るときに
How was the data collected?
考えてもらいたい 最後の3番目の質問です
So far, I've only talked about the way data is communicated,
そのデータは どうやって集められたのか?
but the way it's collected matters just as much.
これまでの話は データの伝えられ方についてだけです
I know this is tough,
でもデータの収集方法も 同じくらい重要です
because methodologies can be opaque and actually kind of boring,
これは難しいことです
but there are some simple steps you can take to check this.
手法は不透明かもしれず 実際退屈なものです
I'll use one last example here.
でも これを確かめる 簡単なステップがあります
One poll found that 41 percent of Muslims in this country support jihad,
1つ 例を使います 最後の例です
which is obviously pretty scary,
ある世論調査では この国のムスリムのうち 41%がジハードを支持するという結果でした
and it was reported everywhere in 2015.
明らかに恐ろしいことです
When I want to check a number like that,
2015年 この結果は あらゆるところで報道されました
I'll start off by finding the original questionnaire.
私がこのような数値を確認したいとき
It turns out that journalists who reported on that statistic
元のアンケートを 探すことから始めます
ignored a question lower down on the survey
分かったことは その統計を報告した記者達は
that asked respondents how they defined "jihad."
アンケートの後ろの方にあった 質問を無視していたことです
And most of them defined it as,
それは回答者の「ジハード」の 定義についてでした
"Muslims' personal, peaceful struggle to be more religious."
大半の回答者の定義は
Only 16 percent defined it as, "violent holy war against unbelievers."
「ムスリムが より信心深くあろうと 個人的・平和的に努力すること」で
This is the really important point:
「不信心者に対する聖なる暴力的戦い」 と定義したのは たった16%でした
based on those numbers, it's totally possible
これは実に重要な点です
that no one in the survey who defined it as violent holy war
このような数値に基づけば
also said they support it.
ジハードを「聖なる暴力的戦い」と定義し かつジハードを支持するという回答者は
Those two groups might not overlap at all.
皆無だった可能性が十分あります
It's also worth asking how the survey was carried out.
この2グループは 全く重ならないかもしれないのです
This was something called an opt-in poll,
調査方法を尋ねることも大事です
which means anyone could have found it on the internet and completed it.
このケースはオプトイン世論調査と 呼ばれるもので
There's no way of knowing if those people even identified as Muslim.
誰でもネット上で調査を見つけ 回答を完了できるものでした
And finally, there were 600 respondents in that poll.
回答者が本当にムスリムかさえ 知る方法はありません
There are roughly three million Muslims in this country,
最後に この調査には 600名が回答しました
according to Pew Research Center.
この国にはだいたい 300万人のムスリムがいます
That means the poll spoke to roughly one in every 5,000 Muslims
ピュー研究所のデータです
in this country.
つまりその世論調査に回答したのは この国のムスリムの
This is one of the reasons
5000人に1人だけということです
why government statistics are often better than private statistics.
政府の統計が民間の統計よりも
A poll might speak to a couple hundred people, maybe a thousand,
しばしば優れている理由の1つが ここにあります
or if you're L'Oreal, trying to sell skin care products in 2005,
世論調査のサンプルは200人とか 1000人かもしれません
then you spoke to 48 women to claim that they work.
2005年にスキンケア製品を売ろうとした ロレアル社の場合は
(Laughter)
効果を主張するために 調査した女性は48名でした
Private companies don't have a huge interest in getting the numbers right,
(笑)
they just need the right numbers.
民間企業は正しい数値を得ることに 強い関心を持ってはいません
Government statisticians aren't like that.
都合のいい数値がほしいだけです
In theory, at least, they're totally impartial,
政府の統計家達は違います
not least because most of them do their jobs regardless of who's in power.
少なくとも理屈の上では 政府の統計は完全に公平です
They're civil servants.
権力者が誰かには関係なしに 働いている人が大半だからです
And to do their jobs properly,
彼らは公僕なんです
they don't just speak to a couple hundred people.
そして仕事を適切に行うために
Those unemployment numbers I keep on referencing
200人から回答を得るだけで 済ませたりしません
come from the Bureau of Labor Statistics,
私が引用し続けている あの失業率の数値は
and to make their estimates,
労働統計局によるものです
they speak to over 140,000 businesses in this country.
この推計値を算出するために
I get it, it's frustrating.
米国の14万の企業を 調査しています
If you want to test a statistic that comes from a private company,
分かります 厄介でしょう
you can buy the face cream for you and a bunch of friends, test it out,
民間企業による統計の正確さを 検証するには
if it doesn't work, you can say the numbers were wrong.
フェイスクリームを 自分や友達に買って 試してみて
But how do you question government statistics?
効かなければ 数値は間違いだと言えるでしょう
You just keep checking everything.
でも政府の統計の正確さを問う方法は?
Find out how they collected the numbers.
全てをチェックし続けることです
Find out if you're seeing everything on the chart you need to see.
政府がどうやって 数値を収集したか知り
But don't give up on the numbers altogether, because if you do,
図表に 知るべきことが 全て表されているか確かめるのです
we'll be making public policy decisions in the dark,
でも全部の数値を一緒くたに 見限ってはいけません
using nothing but private interests to guide us.
そんなことをしたら 公的な政策決定は 闇の中で行われることになり
Thank you.
私益に左右されてしまうでしょう
(Applause)
ありがとうございました