字幕表 動画を再生する AI 自動生成字幕 字幕スクリプトをプリント 翻訳字幕をプリント 英語字幕をプリント Hi. It's Mr. Andersen and welcome to my podcast on the Chi-squared test. Chi-squared こんにちは、アンダーセンです。 カイ二乗検定についてのポッドキャストにようこそ。カイ二乗 test if you look at the equation lots of students get scared right away. It's really simple テストでは、方程式を見ると、多くの生徒がすぐに怖がってしまいます。本当に簡単なことです。 once you figure it out. So don't be scared away, but Chi-squared test especially in AP あなたはそれを把握したら。だからドン'tは離れて怖がっているが、カイ二乗テストは特にAPで biology, especially in science is very important. And it's a way to compare when you collect 生物学、特に科学では非常に重要です。そして、それはあなたが収集するときに比較する方法です。 data, is the variation in your data just due to chance or is it due to one of the variables データの変動は偶然によるものなのか、それとも変数の1つによるものなのか。 that you're actually testing. And so the first thing you should figure out is what are the, 実際にテストしていることを確認してみましょう。最初に把握しなければならないのは、何があるかということです。 what do all these variables mean? これらの変数は何を意味するのでしょうか? So the first one, this right here stands for Chi-squared. And so this was developed way 最初のもの、これはカイ二乗の略ですこれが開発されたのは in the early part of the 1900s by Carl Pearson. Pearson's Chi-squared test. So, what is this 1900年代初頭にカール・ピアソンによってピアソンのカイ二乗検定ですで、これは何かというと then? That is going to be a sum. So we're going to add up a number of values in a Chi-squared それじゃそれは合計になります。つまり、カイ二乗の値の数を足し算することになります。 test. What does the O stand for? Well that's going to be for the data you actually collect. のテストを行います。Oは何の略ですか?そうですね.........実際に収集したデータのためのものです。 And so we call that observed data. And then the E values are going to be the expected これを観測データと呼びます。そして、E値は期待される values. And so if you're ever doing an experiment, you can actually figure out your expected の値を計算することができます。ですから、もし実験をしているならば、実際に予想される values before you start. And then you just simply compare them to your observed values. の値を開始する前に、その値を比較します。そして、単に観測値と比較するだけです。 Let me give you an example of that with these coins over here. ここにあるコインを例に挙げてみましょう。 Let's say I flip a coin 100 times. And I get コインを100回ひっくり返したとしようそして、私は 62 heads and I get 38 tails. Well is that due to just chance? Or is there something 62人の頭と38人の尻尾だそれは偶然なのか?それとも何か wrong with the coin? Or the way that I'm flipping the coin? And so the Chi-squared test allows コインに問題があるのか?それともコインの裏返し方が悪いのでしょうか?そして,カイ二乗検定は,以下のことを可能にします us to actually answer that. And so what I'm thinking in my head is something called a 実際にそれに答えるためにそれで、私が頭の中で考えているのは Null Hypothesis. And so if we're flipping a coin 100 times. And I think I said 62 head 仮説コインを100回ひっくり返したとしても62回と言ったと思います and 38 tails. Well that would be the observed value that we get in an experiment. But there'd そして38の尾。まあ、それは実験で得られる観測値でしょう。しかし、そこには also be expected values because you know it should be 50 heads and 50 tails. And so you これも期待値であることがわかります。そして、あなたは used something called a null hypothesis in this case where you're saying there's not この場合、帰無仮説と呼ばれるものを使用しています。 statistical significant difference between the observed values and the expected frequencies 観測値と期待される度数との統計的有意差 that we expect to get and what do we actually find. 私たちが期待しているものと、実際には何を見つけることができるのか。 And so it's cool, Chi-squared, because we そして、それはクールなカイ二乗で、私たちは can actually measure our data, or look at our data and see is there a statistical difference 実際にデータを測定したり、データを見て統計的な違いがあるかどうかを確認したりすることができます。 between those two. The best way to get good at Chi-squared is actually to do some problems. その二つの間にカイ二乗が得意になる一番の方法は、実際にいくつかの問題をやることです。 Before we get to that there's two terms that I have to define. One is degrees of freedom その前に2つの用語を定義しなければなりません。一つは自由度です。 and then one is critical values. And so the whole point of a Chi-squared test is either そして1つは臨界値です。そして、カイ二乗検定の全体的なポイントは to accept or reject our null hypothesis. And so you have to either exceed or don't exceed 帰無仮説を受け入れるか否かを決めるためにはを超えるか超えないかのどちらかでなければなりません。 your critical value. But first of all we have to figure out where that number is in this あなたの臨界値ですしかし、まず、その数字がこの中のどこにあるのかを 把握しなければなりません。 big chart right here. ここに大きなチャートがあります。 First thing is something called degrees of freedom. So since we're comparing outcomes, 最初に自由度と呼ばれるものがあります。結果を比較しているので you have to have at least two outcomes in your experiment. So in this case if we have の場合、実験では少なくとも2つの結果が必要です。つまり、このケースでは heads and tails, we have two outcomes that we could get, so we'll say that's 2. And then head and tails, 私たちは2つの結果を得ることができるので、2とします。そして we simply subtract the number 1 from that to get the degrees of freedom. And so in this そこから1を引くだけで自由度が得られますこのように case we have two outcomes minus 1 and so we would have 1 degree of freedom. Now you might の場合、2つの結果からマイナス1を引いたものがあるので、自由度は1になります。さて、次のようになります。 think to yourself why isn' there a zero on this chart? Well, if you just have one outcome このチャートにゼロがあるのはなぜだろうと考えてみてください。もし、あなたが一つの結果を持っているならば you have nothing to compare it to. So that's an easy way to think about that. So we figured 比較するものが何もないだからそれは簡単に考えればいいのですそこで私たちは考えました out that there is one degree of freedom in this case. The next thing you're looking at この場合の自由度は1つであることを知りました。次に見ているのは is for a critical value. And the critical value that we'll always use in the class is は臨界値のためのものです。そして、私たちがクラスで常に使用するクリティカル値は the 0.05 value. And so that's going to be this column right here. So the first thing 0.05の値です。これがこの列になりますということで、最初の you do is find the 0.05 value and you don't worry about all of the other numbers. So that's 0.05の値を見つければ、他の数字を気にする必要はありません。ということは 3.841 is something I just know because it means that I'm in the right chart or I'm in 3.841は、それは私が右のチャートにいることを意味するので、私はちょうど私が知っているものです。 the right column. 右側の欄に A way that I explain this to kids is that you can think of that as being 95% sure that 私が子供たちに説明している方法は、95%の確率で次のように考えることができるということです。 you're either accepting or rejecting your null hypothesis. And you can see that our 帰無仮説を肯定するか否定するかのどちらかです。そして、私たちの critical values get higher over here. So you can think as we move this way, if we really 臨界値はこちらの方が高くなりますだから、このように移動しながら考えることができますもし、本当に want to be sure we'd have to exceed a higher critical value. So what's our null hypothesis より高い臨界値を超えなければならないことを 確認したいのですでは、帰無仮説は何でしょうか? again. Null hypothesis's no statistical difference between observed and expected and so we either を再度参照してください。ヌル仮説は、観測されたものと期待されたものの間に統計的な違いはないので、我々はどちらかの accept or reject that value. So in this case our critical value would be 3.841. And so は、その値を受け入れるか否かを決定します。この場合の臨界値は3.841になりますということになります。 when you calculate Chi-squared, if you get a number that is higher than 3.841 then you カイ二乗を計算するとき、3.841よりも高い数値が出た場合は、次のようになります。 reject that null hypothesis. And so there actually is something aside from just chance 帰無仮説を棄却する実際には偶然以外にも何かがあります that is causing you to get more heads than tails. And if you don't exceed the critical それはあなたが尾よりも多くの頭を取得する原因となっています。そして、もしあなたが臨界値を超えていなければ value then you accept that null hypothesis. And this is usually what ends up happening, の値を設定すると、その帰無仮説を受け入れることになります。そして、これが通常の結末です。 unless you have a variable that's impacting your results. Let's apply this in a couple 結果に影響を与える変数がある場合を除きます。これをいくつかの例で適用してみましょう。 of different cases. 異なるケースの So this is my wife here. I asked her to flip a coin and so I asked the statistics teacher で、ここにいるのが妻です。コインをめくってもらったので、統計学の先生に how much data do you have to get before you can actually apply the Chi-squared test? And カイ二乗検定を実際に適用する前に、どのくらいのデータを取得する必要がありますか?そして Mr. Humberger said something magic about 30. And so I want to exceed that number in each ハンバーガーさんは30くらいの魔法のようなことを言っていました。その数を超えたいと思っています of these experiments and so this is my wife down here. This is her hand. And what she's これらの実験をしていて これが妻の手ですこれが彼女の手ですそして彼女の手は going to do is she's going to, let me get a value you can see, she's going to flip 50 行うつもりは、彼女がしようとしている、私はあなたが見ることができる値を取得してみましょう、彼女はフリップ50をしようとしている coins. You can see she's really fast so she's flipping 50 coins and then she's sorting them コインを並べ替えています。彼女はとても速いので、50枚のコインをひっくり返して、それを選別しているのがわかります。 out. And so if we look at that, the first thing, even before you collect the data is アウトです。で、それを見てみると、まず、データを集める前であっても we could look at the expected values. And so we've got heads or tails. And so if you 期待値を見ることができましたこれで頭か尻尾かがわかりましたそれで、もし flip 50 coins how many do we expect to come up as heads? The right answer would be 25. 50枚のコインを裏返すと...何枚が頭になると思いますか?正解は25枚でしょう And how many would we expect to come up as tails? 25 as well. Now let's say your data そして、何人がしっぽとして出てくると予想されますか?25個です。さて、あなたのデータを is not as even as that. If you're looking at fruit flies it might be 134 or 133. Well はその程度ではありません。フルーツバエなら134か133かもしれませんね。さて let's say I flip 51 coins for example instead of 50 then my expected values would be 25.5 例えば、50枚のコインの代わりに51枚のコインをめくってみると、期待値は25.5枚になります。 and 25.5. So expected values since they're just due to probability don't have to be a と25.5です。ということは、期待値は確率に起因するものであるため、必ずしも whole number. 全数 If we look at our observed values, well let's look down here. How many heads did we get? 観測値を見てみると...下を見てみましょう何人の頭を得たのでしょうか? 28 heads. And how many tails did we get? So that would just be 22. Okay. So now we're 28人の頭尻尾は何本あった?22個になりましたそうですか、今は going to apply Chi-squared and come up with a critical value. And so, what does that mean? カイ二乗を適用して 臨界値を導き出しますそれで、それはどういう意味ですか? Well let me get this out of the way. So we're going to take our equation which is O minus さて、ここからが本題です。だから、私たちの式を取ることにします......それはOマイナス E squared over E, and we're going to do that for the heads column and then we're going EをEの上に二乗したものを頭の列に適用して、次のようにします。 to do it for the tails column. So we've also got O minus E squared over E for the tails を用いて、尾の列のためにそれを行うことができます。つまり、OからEを引いたものをEの上に二乗したものが尾の列になります。 column. And so our observed value is going to be 28. So it's 28 minus 25, which is expected, の欄を見てみましょう。観測値は28になります。ですから、28から25を引いた値になりますが、これは予想通りです。 squared over 25. Now this sum means that we're going to add these two values together so の2乗を25で割ったものです。この和は、この2つの値を足し合わせることを意味します。 I'm going to put a plus sign right here. Now we're going to do the tails side. So what's ここにプラスのサインを入れます。今度はテイルズ側をやります。で、何が our observed? It's 22 minus 25 squared over 25. So you can do this in your head. 28 minus 観測された?それは22から25を引いた25乗ですこれを頭の中でやってみるといいでしょう28マイナス 25 is 3, square that is 9. 9 over 25 plus 22 minus 25 is negative 3 squared. It's 9 25は3で、9であることを2乗したものです。それは9 over 25. And so our answer is 18 over 25 which equals 0.72. 25以上答えは25以上の18で 0.72に等しい Okay. So that's our Chi-squared value for これがカイ二乗の値です this data that we just collected. Now let's go over here to our critical values. Well 今集めたデータですでは、ここで臨界値を確認してみましょうさて we said that we had 1 degree of freedom, because there's two outcomes. 2 minus 1 is 1. So we're 2つの結果があるので、自由度は1だと言いました。2から1を引くと1になります だから私たちは in this right here, this row right here. And then here is our magical 0.05 column and so この行はここにありますそして、ここに魔法の0.05カラムがあります。 our critical value is 3.841. And so if we get a number higher than that we reject our 臨界値は3.841ですこれよりも高い数値が出た場合は null hypothesis. We didn't, so we got a value that is lower than that, 0.72 so that means 帰無仮説です。そうではなかったので、それよりも低い0.72という値が得られました。 we have to accept our null hypothesis. That means that my wife did a great job. There's 帰無仮説を受け入れなければなりませんつまり 妻が頑張ってくれたということですそこには nothing wrong with the coins. There's not way more heads then there should be and so コインには何の問題もありません。There's not way more heads then there should be and so we have to accept the null hypothesis that there's no statistical difference between の間に統計的な差がないという帰無仮説を受け入れなければなりません。 what we observe and what we expect to see. 私たちが観察しているものと期待しているもの So now let's try a little more complex problem. Now we've got dice. So we've got 36 dice. では、もう少し複雑な問題に挑戦してみましょう。さて、サイコロが出ました。36個のサイコロがあります。 So let me get this out here. So our expected values, well there are six things you could ここでこれを出してみましょう私たちの期待値は...6つのことができます get. So we could get a 1, 2, 3, 4, 5 or 6. And so let's play this out. So expected values, を得ることができます。だから、1、2、3、4、5、6を手に入れることができますそれではこれをプレイアウトしてみましょう期待値ですね since I have 36 dice here, we would expect to get 6 of each of those numbers coming up. ここに36個のサイコロを持っているので、それぞれの数字が6個ずつ出てくることが予想されます。 So I'm just taking 36 total dice divided by 6 so I got 6. But let's see what we get for 36個のサイコロを6で割って6個にしたので、6個になりました。でも、何が得られるか見てみましょう。 observed values. Oh, it looks like we're getting a lot of sixes. So if we look at the observed 観測値。おお、6がたくさん出ているようですね観測値を見てみると values for one here we get 2 ones. We look at the twos, we get 4 of those. For the threes ここでは1の値が2になります。2を見てみると 4つの値が得られます3の場合は it looks like 8 threes. For the fours we get 9. For the fives we just get 3. And then for 8つのスリーに見える4は9だ5は3だそれから the sixes, look at all the sixes, so we get 10 right here. Okay. Now we have to figure 6つの数字を見て、6つの数字を全部見て、だからここに10個の数字がある。これでいいわ今、私たちは図らなければならない out a Chi-squared value. So let me get this out of the way. カイ二乗値を出しますということで、本題に入ります。 And I'm going to stop talking and do the math そして、私は話をやめて計算をするつもりです。 and speed up the video a little bit. And so hopefully I don't screw up any of this. So ビデオのスピードを少し上げてうまくいけば 台無しにならないと思いますそれで that is 58 over 6 which is 9.6. So that is our Chi-squared value. It's 9.6 in this case. 6の上に58、つまり9.6です。これがカイ二乗値ですこの場合は9.6です。 Since we added all these up. So now we've got to go over here to our chart. And so first これを全部足してからではここでチャートを見てみましょうそれで、最初に of all we have to figure out how many degrees of freedom do we have. Well, since there are 自由度が何度あるのかを 把握しなければなりませんまあ、以下のようなものがあるので 6 different outcomes and we take 6 minus 1, so we've got 5. We're in this column of the 6つの異なる結果があり、6から1を引くと5になります。のこの列にいます。 0.05 right here so if I read across our critical value is 11.070. And so if we look at that, 0.05ですから、ここを読むと 臨界値は11.070になりますこれを見ると did our value go higher than that, no it's only 9.6, it's lower than that, so in this 私たちの価値はそれよりも高くなりましたか、いや、それは9.6だけです。 case since it's 9.6, even though we had all of those sixes we still need to accept our 9.6なので、6を全部持っていたとしても、まだ受け入れる必要があります。 null hypothesis that there's no statistical significance between or difference between の間に統計的有意差がないという帰無仮説 what we observed and then what we expected. 私たちが観察したもの、そして私たちが予想したもの。 So now let's leave you with this question. So in the animal behavior podcast as I talk では、この質問を残しておきましょう。動物行動ポッドキャストの中では about that, we're looking at pill bugs and if they spend more time in the wet or if they そのことについて、私たちはピルバグを見ていると、彼らは濡れた状態でより多くの時間を過ごすか、または spend more time in the dry. And so if you look at the values right here, this is recording 乾いた状態でより多くの時間を過ごしますこの値を見ると、これが記録されています how much time they spend in the wet and how much time they spend in the dry. So what I've 濡れた状態でどれだけの時間を過ごすのか、乾いた状態でどれだけの時間を過ごすのか。だから私がしたことは done is we would expect since there are 10 pill bugs we'd have 5 on each side. But since 10錠のバグがあるので、我々は各側に5つを持っているだろうと期待しています。しかし it looks like they're spending more time on the wet, you can even see them in the video それは彼らが濡れた上でより多くの時間を費やしているように見えます、あなたもビデオでそれらを見ることができます here spending more time in the wet, I take the average of the wet and the average of ここではウェットでより多くの時間を費やして、私はウェットの平均と the dry column. And that gives me my wet and my dry and so now I'm not going to show you 乾いた列になります。これは私の湿った部分と乾いた部分を示しています。 how to do this one, but try to apply Chi-squared to figure out if there's a statistical difference どのようにこれを行うには、しかし、統計的な違いがあるかどうかを把握するためにカイ二乗を適用してみてください。 between the expected values of what we expect and what we observed. And you can put your 期待値と観測した値の間にそして、あなたの answer down in the comments. And so I hope that's helpful. コメントで答えてください。そして、それがお役に立てれば幸いです。