字幕表 動画を再生する
("The hardest part of learning something new is not embracing new ideas, but letting go of old ones." - Todd Rose, "The End of Average")
(「新しいことを学ぶのに一番難しいことは、新しい考えを受け入れることではなく、古い考えを手放すことだ。」- トッド・ローズ、「平均値の終わり」)
The first standardized tests that we know of were administered in China over 2,000 years ago during the Han dynasty.
私たちの知る最初の統一試験は2000年以上前、漢朝時代の中国で行われました。
Chinese officals used them to determine aptitude for various government posts.
中国の役人たちは、その試験で様々な官職への適正を判断しました。
The subject matter included philosophy, farming, and even military tactics.
科目には、哲学や農学、戦法も含まれました。
Standardized tests continued to be used around the world for the next two millennia,
統一試験はその後2000年にわたり、世界中で使用され続け、
and today, they're used for everything from evaluating stair climbs for firefighters in France
そして、今日では、フランスの消防士が受ける階級昇降の試験や、
to language examinations for diplomats in Canada to students in schools.
カナダの外交官の言語試験、学校での学生の試験などあらゆる場面で利用されています。
Some standardized tests measure scores only in relation to the results of other test-takers.
統一試験の中には、他の受験者の結果の関連性だけでスコアを測定するものがあります。
Others measure performances on how well test-takers meet predetermined criteria.
また、受験者があらかじめ決められた基準をどれだけ満たしているかを測定するものもあります。
So, the stair climb for the firefighter could be measured by comparing the time of the climb to that of all other firefighters.
つまり、その消防士の階級昇降は、他のすべての消防士の階級昇降と時間を比較することで測定できるのです。
This might be expressed in what many call a "bell curve".
これは「ベルカーブ」と呼ばれるもので表されるかもしれません。
Or it could be evaluated with reference to set criteria, such as carrying a certain amount of weight a certain distance up a certain number of stairs.
それか、一定の重量を持ち、一定の距離、一定の数の階級を上るといった、設定された基準で評価することも可能です。
Similarly, the diplomat might be measured against other test-taking diplomats or against a set of fixed criteria, which demonstrate different levels of language proficiency.
同様に、外交官は受験した他の外交官と比べられるのかもしれないし、様々なレベルの言語運用能力を定めた基準と照らし合わせて評価されるのかもしれません。
And all of these results can be expressed using something called a "percentile".
そして、これらの結果はすべて「パーセンタイル」というものを使って表すことができます。
If a diplomat is in the 70th percentile, 70% of test-takers scored below her.
もし、ある外交官が70パーセンタイルなら、受験者の70%は彼女より下の点数を取っていることになります。
If she scored in the 30th percentile, 70% of test-takers scored above her.
仮に彼女が30パーセンタイルなら、70%の受験者が彼女より上の得点を取ったことになります。
Although standardized tests are sometimes controversial, they're simply a tool.
統一試験は時々議論されますが、単なる手段でしかありません。
As a thought experiment, think of a standardized test as a ruler.
思考実験として、統一試験を物差しと考えてみましょう。
A ruler's usefulness depends on two things.
物差しの有用性は2つの要素に左右されます。
First, the job we ask it to do.
1つ目は、私たちが求める仕事。
Our ruler can't measure the temperature outside or how loud someone is singing.
物差しでは外の気温や、歌っている人の声量は測れません。
Second, the ruler's usefulness depends on its design.
2つ目は、物差しの有用性はそのデザインに左右されます。
Say you need to measure the circumference of an orange.
例えば、オレンジの周りの長さを測りたいとします。
Our ruler measures length, which is the right quantity, but it hasn't been designed with the flexibility required for the task at hand.
物差しは長さを測るものなので、そこは正しいですが、今やりたいことをするための柔軟性はありません。
So, if standardized tests are given the wrong job or aren't designed properly, they may end up measuring the wrong things.
つまり、統一試験に間違ったことを求めたり、適切な設計がされていないと、間違ったことを測定してしまうかもしれません。
In the case of schools, students with test anxiety may have trouble performing their best on a standardized test,
学校だと、試験で緊張する生徒は統一試験でベストを尽くすことが難しいかもしれませんが、
not because they don't know the answers, but because they're feeling too nervous to share what they've learned.
それは答えが分からないからでなく、学んだことを伝えるのに緊張してしまうからです。
Students with reading challenges may struggle with the wording of a math problem,
読み書きに問題のある生徒は、数学の問題の表現に苦労することがあり、
so their test results may better reflect their literacy rather than numeracy skills.
そうすると試験結果は数学の能力でなく、読み書きの能力が反映されるかもしれません。
And students who are confused by examples on tests that contain unfamiliar cultural references may do poorly,
また、試験で見慣れない文化の例が挙げられていて混乱する生徒は、うまくいかない可能性があり、
telling us more about the test-taker's cultural familiarity than their academic learning.
それは学問的な学習よりも、文化の知識が試験結果に反映されるのです。
In these cases, the tests may need to be designed differently.
こういう場合は、試験の様式を変える必要があるかもしれません。
Standardized tests can also have a hard time measuring abstract characteristics or skills, such as creativity, critical thinking, and collaboration.
また、統一試験では、創造性、批判的思考、協調性など、抽象的な特性やスキルを測定することが難しい場合があります。
If we design a test poorly or ask it to do the wrong job or a job it's not very good at, the results may not be reliable or valid.
試験の設計が悪かったり、間違った仕事や苦手な仕事をお願いしたりすると、結果が信頼できなかったり、有効でなかったりすることがあります。
Reliability and validity are two critical ideas for understanding standardized tests.
統一試験を理解するためには、信頼性と有効性の2つの重要な考え方があります。
To understand the difference between them, we can use the metaphor of two broken thermometers.
この2つの違いを理解するために2つの壊れた温度計を例としましょう。
An unreliable thermometer gives you a different reading each time you take your temperature,
信頼性の低い温度計では、温度を測るたびに違う結果が出て、
and the reliable but invalid thermometer is consistently ten degrees too hot.
そして、信頼性はあるが有効性のない温度計では、常に10度高く表示されます。
Validity also depends on accurate interpretations of results.
有効性は、結果の正しい解釈にも左右されます。
If people say the results of a test mean something they don't, that test may have validity problem.
もし、あるテストの結果が、実際には意味しないと言われたら、そのテストには有効性の問題があるかもしれません。
Just as we wouldn't expect a ruler to tell us how much an elephant weighs, or what it had for breakfast,
象の体重や朝食を物差しで測ろうとは思わないのと同じで、
we can't expect standardized tests alone to reliably tell us how smart someone is,
統一試験だけで、その人の頭の良し悪しが確実にわかるとは思えませんが、
how diplomats will handle a tough situation,
外交官が厳しい状況に直面した際どう対処するか、
or how brave a firefighter might turn out to be.
あるいは、消防士がどれほど勇敢になれるか。
So, standardized tests may help us learn a little about a lot of people in a short time,
つまり、統一試験では短時間で多くの人について少し知ることができるかもしれませんが、
but they usually can't tell us a lot about a single person.
通常、1人の人間について多く知ることはできません。
Many social scientists worry about test scores resulting in sweeping and often negative changes for test-takers, sometimes with long-term life consequences.
多くの社会科学者は、試験の点数によって受験者が大きく変化し、時には長期的な人生に影響を及ぼすことを懸念しています。
We can't blame the tests, though.
でも試験のせいではありません。
It's up to us to use the right tests for the right jobs and to interpret results appropriately.
適材適所の検査を行い、結果を適切に解釈するのは、私たち次第なのです。
If you'd like to learn more about this topic, we highly recommend a best-selling book called "The End of Average" by Harvard Professor Todd Rose.
このテーマについてもっと知りたい方は、ハーバード大学のトッド・ローズ教授のベストセラー「The End of Average」という本をお勧めします。
In it, Rose investigates the rampant misuse of standardized test with clarity and urgency.
この本の中でローズは、統一試験の悪用が横行していることを、はっきりとそして緊急に調査しています。
He also proposes a solution to the problem.
そして、その解決策も提示しています。
You can download an audio version of this book for free on audible.com/teded.
本書のオーディオ版は、audible.com/teded で無料でダウンロードできます。
And every free trial encourages Audible to continue supporting Ted-Ed's nonprofit mission.
無料トライアルの度に、Audible が Ted-Ed の非営利団体を支援できるのです。
We're very passionate about this issue, and we're very grateful to any Ted-Ed community members who take the time to read or listen to this important book.
私たちはこの問題に対してとても熱心で、この重要な本を読んだり聞いたりする時間を割いてくれる Ted-Ed の共同団体のメンバーにとても感謝しています。
Thanks for watching, and thanks for your support.
ご視聴、ご支援いただきありがとうございます。