字幕表 動画を再生する
-
The first standardized tests that we know of
私たちの知る最初の統一試験は
-
were administered in China over 2,000 years ago during the Han dynasty.
2000年以上前、漢朝時代の中国で行われました。
-
Chinese officals used them to determine aptitude for various government posts.
中国の役人たちは、その試験で様々な官職への適正を判断しました。
-
The subject matter included philosophy, farming, and even military tactics.
科目には、哲学や農学、戦法も含まれました。
-
Standardized tests continued to be used around the world for the next two millennia,
統一試験はその後2000年にわたり、世界中で使用され続けました。
-
and today, they're used for everything from evaluating stair climbs for firefighters in France
今日では、フランスの消防士が受ける階段を上る試験から
-
to language examinations for diplomats in Canada to students in schools.
カナダの外交官の言語試験、学生に至るまで実施されています。
-
Some standardized tests measure scores only in relation to the results of other test takers.
他の受験者の結果との相対点数を出すだけの試験や、
-
Others measure performances on how well test takers meet predetermined criteria.
所定の基準と成績を比較する試験もあります。
-
So the stair climb for the firefighter could be measured by comparing the time of the climb to that of all other firefighters.
消防士の階段試験は、階段を上るのに要した時間を、他の全消防士の時間と比較するのかもしれません。
-
This might be expressed in what many call a bell curve.
これはベルカーブと呼ばれるもので表されるかもしれないし
-
Or it could be evaluated with reference to set criteria,
既定の基準と照らし合わせて評価されるのかもしれません。
-
such as carrying a certain amount of weight a certain distance up a certain number of stairs.
例えばある重量を、ある距離、ある段数運ぶ、といったようなものです。
-
Similarly, the diplomat might be measured against other test-taking diplomats,
同様に、外交官は受験した他の外交官と比べられるのかもしれないし、
-
or against a set of fixed criteria, which demonstrate different levels of language proficiency.
様々なレベルの言語運用能力を定めた基準と照らし合わせて評価されるのかもしれません。
-
And all of these results can be expressed using something called a percentile.
全結果は、パーセンタイルと呼ばれるもので表されます。
-
If a diplomat is in the 70th percentile, 70% of test takers scored below her.
もし、ある外交官が70パーセンタイルなら、70%の受験者がその人より下です。
-
If she scored in the 30th percentile, 70% of test takers scored above her.
30パーセンタイルなら、70%の受験者がその人の上にいるのです。
-
Although standardized tests are sometimes controversial, they are simply a tool.
統一試験は議論の対象にもなりますが、単なるツールでしかありません。
-
As a thought experiment, think of a standardized test as a ruler.
思考実験として、統一試験を物差しと考えましょう。
-
A ruler's usefulness depends on two things.
物差しの有用性は2つの要素に左右されます。
-
First, the job we ask it to do.
1つ目は、物差しでできること。
-
Our ruler can't measure the temperature outside or how loud someone is singing.
物差しでは外の気温や、歌っている人の声量は測れません。
-
Second, the ruler's usefulness depends on its design.
2つ目は、物差しの設計。
-
Say you need to measure the circumference of an orange.
オレンジの周りの長さを測りたいとします。
-
Our ruler measures length, which is the right quantity,
物差しは長さを測るのでそこは正しいですが
-
but it hasn't been designed with the flexibility required for the task at hand.
今やりたいことをするための柔軟性はありません。
-
So, if standardized tests are given the wrong job,
つまり、統一試験にできないことを求めたり
-
or aren't designed properly, they may end up measuring the wrong things.
適切な設計がされていないと、誤った事柄を測ってしまうかもしれません。
-
In the case of schools, students with test anxiety may have trouble performing their best on a standardized test,
学校だと、試験で緊張する生徒は統一試験でベストを尽くすことが難しいかもしれません。
-
not because they don't know the answers,
答えが分からないからでなく、
-
but because they're feeling too nervous to share what they've learned.
学んだことを生かすのに緊張してしまうから。
-
Students with reading challenges may struggle with the wording of a math problem,
読解に難点のある生徒は、数学の問題の言葉が分からないかもしれません。
-
so their test results may better reflect their literacy rather than numeracy skills.
すると試験結果は数学の能力でなく、読解力をより反映するかもしれません。
-
And students who were confused by examples on tests that contain unfamiliar cultural references may do poorly,
試験で、未知の文化の例が挙げられていて混乱した生徒は、点数が悪いかもしれず、
-
telling us more about the test taker's cultural familiarity than their academic learning.
学術的な側面より、文化の知識が試験結果に反映されるのです。
-
In these cases, the tests may need to be designed differently.
こういう場合は、試験の様式を変える必要があるかもしれません。
-
Standardized tests can also have a hard time measuring abstract characteristics or skills,
統一試験では、抽象的な特徴や能力を測ることも難しいです。
-
such as creativity, critical thinking, and collaboration.
例えば創造性、批判的思考能力、協調性などです。
-
If we design a test poorly, or ask it to do the wrong job, or a job it's not very good at,
試験の設計を間違ったり、的外れな内容や測りづらい内容を入れようとしたりすると
-
the results may not be reliable or valid.
結果の信頼性や有効性が疑わしくなります。
-
Reliability and validity are two critical ideas for understanding standardized tests.
信頼性と有効性は、統一試験を理解する上で鍵となる2つの概念です。
-
To understand the difference between them,
この2つの違いを理解するために
-
we can use the metaphor of two broken thermometers.
2つの壊れた温度計を例としましょう。
-
An unreliable thermometer gives you a different reading each time you take your temperature,
信頼性のない温度計は、温度を測るたびに違う結果が出ます。
-
and the reliable but invalid thermometer is consistently ten degrees too hot.
信頼性はあるが有効性のない温度計は、常に10度高く表示されます。
-
Validity also depends on accurate interpretations of results.
有効性は、結果の正しい解釈にも左右されます。
-
If people say the results of a test mean something they don't, that test may have validity problem.
ある試験結果に、実際その試験ではしていないことが含まれると、有効性に問題があります。
-
Just as we wouldn't expect a ruler to tell us how much an elephant weighs, or what it had for breakfast,
物差しでは象の体重や、象が朝何を食べたか測れないのと同様に、
-
we can't expect standardized tests alone to reliably tell us how smart someone is,
統一試験だけでは、ある人がどれほど賢いか、
-
how diplomats will handle a tough situation,
外交官が困難な状況に直面した際どう対処するか、
-
or how brave a firefighter might turn out to be.
消防士が実はどれほど勇敢か、信頼できる結果は得られません。
-
So standardized tests may help us learn a little about a lot of people in a short time,
統一試験では、短時間で多くの人のことを少し知ることができるかもしれませんが
-
but they usually can't tell us a lot about a single person.
大抵、ある1人の人間について多く知ることはできません。
-
Many social scientists worry about test scores resulting in sweeping and often negative changes for test takers,
社会科学者の多くが危惧するのは、試験の点によって受験者が一掃されたり、マイナスの変化が起きてしまったり
-
sometimes with long-term life consequences.
時には人生に関わる長期的な影響が出てしまうことです。
-
We can't blame the tests, though.
でも試験のせいではありません。
-
It's up to us to use the right tests for the right jobs, and to interpret results appropriately.
ある事柄に適切な試験を用い、結果を正確に解釈するのは、私たちなのです。
-
If you would like to learn more about this topic, we highly recommend a best selling book called
このトピックに関してもっと知りたい人には、すごくオススメの本があります。
-
The End of Average by Harvard Professor Todd Rose.
ハーバード大学のTodd Rose著”The end of Average”です。
-
In it, Rose investigated the rampant misuse of standardized test with clarity and urgency.
同著内でRose氏は、統一試験の誤用の蔓延について、明確性と危機感を持って研究しており
-
He also proposes a solution to a problem.
解決策も提示しています。
-
You can download the audio version of this book for free on audible.com/teded.
本著のオーディオバージョンを、audible.com/tededから無料でダウンロードできます。
-
And every free trial encourages audible to continue supporting Ted-Ed nonprofit mission.
無料トライアルの度に、AudibleがTed-Edの非営利ミッションを支援できるのです。
-
We are very passionate about this issue. And, we are very grateful to
この問題には非常に関心を持っています。
-
any Ted-Ed community members, who take time to read or listen to this important book.
Ted-Edのコミュニティに属する皆さんには、この重要な著書をぜひ読んだり聞いたりしていただきたいです。
-
Thanks for watching. And, thanks for your support.
ご覧いただき、またサポートいただき、ありがとうございます。