字幕表 動画を再生する AI 自動生成字幕 字幕スクリプトをプリント 翻訳字幕をプリント 英語字幕をプリント In this video, we'll introduce terms and notation that we'll use throughout this course. このビデオでは、このコースで使用する用語と表記法を紹介する。 Let's start with variable types. まずは変数の型から。 We'll compare and contrast two pairs of variable types. 2組の変数型を比較対照する。 Here's the first. まずはこれだ。 The first pair is response variable versus explanatory variable. 最初のペアは、応答変数対説明変数である。 The analyst is primarily interested in the response variable. 分析者は主に応答変数に関心がある。 We want to know if, and how, we can understand the response variable better using other variables. 他の変数を用いて、応答変数をよりよく理解できるかどうか、またどのように理解できるかを知りたいのである。 In the Commute and Chris setup, questions 1 and 2 have commute as the response variable. 通勤時間とクリスの設定では、質問1と2は通勤時間を応答変数としている。 Chris hopes to understand how commute is affected by other variables. クリスは、通勤時間が他の変数によってどのように影響されるかを理解したいと考えている。 The response variable goes by other names, like output variable and dependent variable. 応答変数は、出力変数や従属変数のような他の名前で呼ばれる。 In contrast, an explanatory variable is any variable used to study the response variable. 対照的に、説明変数は、応答変数を研究するために使用されるあらゆる変数である。 The goal here is to find potential relationships between the response variable and an explanatory variable. ここでの目的は、応答変数と説明変数の間の潜在的な関係を見つけることである。 In the Commute and Chris setup, question 1 uses departure as an explanatory variable to analyze commute. 通勤とクリスの設定では、質問1は出発を説明変数として通勤を分析している。 We also call explanatory variables input variables or independent variables. 説明変数を入力変数または独立変数と呼ぶこともある。 Sometimes, we may even call them predictors or features. 予測因子や特徴量と呼ぶこともある。 Even though we can call response and explanatory variables dependent and independent variables, they are conceptually different from the independent random variables that we encountered in probability. 応答変数と説明変数を従属変数と独立変数と呼ぶことはできても、それらは確率で遭遇した独立確率変数とは概念的に異なる。 Okay, that's our first pair. よし、これが最初のペアだ。 Our second variable type pair is a quantitative variable versus a qualitative variable. 2つ目の変数タイプは、量的変数と質的変数のペアである。 As the name suggests, quantitative variables take on quantities, which we can divide into two main groups, which creates count variables and continuous variables. その名が示すように、量的変数は量を持ち、大きく2つのグループに分けることができる。 Count variables take on non-negative integers, while continuous variables take on values from an interval. カウント変数は非負の整数をとり、連続変数は区間の値をとる。 We commonly call qualitative variables as categorical variables. 一般に、質的変数をカテゴリー変数と呼ぶ。 These variables take on a small number of possible categories, also known as classes or levels. これらの変数は、クラスまたはレベルとしても知られている、少数の可能なカテゴリを取る。 It's common that we'll assign numbers to the categories, but this does not convert the variables into count variables. カテゴリーに数字を割り当てることはよくあるが、これは変数をカウント変数に変換するものではない。 Okay, let's review the commute and Chris setup and categorize the eight variables into count, continuous, and categorical variables. さて、通勤とChrisのセットアップを見直して、8つの変数をカウント変数、連続変数、カテゴリー変数に分類しましょう。 Commute is measured in minutes. 通勤時間は分単位で計測される。 Because any value exceeding zero is possible, commute is a continuous variable. ゼロを超える値もあり得るので、通勤時間は連続変数である。 For similar reasons, departure, temp, and precip chance are also continuous variables. 同様の理由で、出発、気温、降水確率も連続変数である。 They just take on values from different intervals. ただ、異なる間隔の値を取るだけだ。 Next, precip, season, and accident all take on two or four possible outcomes, making them categorical variables. 次に、降水量、シーズン、事故はすべて2つまたは4つの可能性のある結果をとり、カテゴリー変数となる。 Last is police, which takes on non-negative integers, making it a count variable. 最後はpoliceで、これは非負の整数を取るのでカウント変数となる。 We can subdivide categorical variables further into nominal and ordinal variables. カテゴリー変数は、さらに名義変数と順序変数に細分化できる。 If there's not a meaningful order to the categories, then it's a nominal variable. カテゴリーに意味のある順序がなければ、それは名義変数である。 In the case where we assign numbers to categories, the numbers only act as labels. カテゴリーに数字を割り当てる場合、数字はラベルとしてしか機能しない。 If there is a meaningful order to the categories, then it's an ordinal variable. カテゴリーに意味のある順序があれば、それは順序変数である。 In the case where numbers are assigned to the categories, the numbers communicate the order. カテゴリーに数字が割り当てられている場合、数字は順番を伝える。 Let's use season from the commute and Chris setup as an example. 通勤とクリスのセットアップのシーズンを例にしてみよう。 If we assign 1 to winter, 2 to spring, 3 to summer, and 4 to fall, then the categories follow the calendar seasons in sequence and therefore have meaningful order. 仮に1を冬、2を春、3を夏、4を秋とすると、各カテゴリーは暦の季節に沿って順番に並んでいるため、意味のある順番となる。 This makes season an ordinal variable. このため、季節は順序変数となる。 If instead we assign numbers based on alphabetical order of the seasons, then we do not have meaningful order to the categories. その代わりに、季節のアルファベット順に基づいて番号を割り振ると、カテゴリーに意味のある順序がなくなってしまう。 And this makes season a nominal variable. そして、これがシーズンを名目上の変数にしている。 Now that we've explored variable types, let's establish basic notation that we'll use throughout this course. さて、変数の型について説明したので、このコースを通して使用する基本的な記法を確立しよう。 We denote variables in general by the letter x. 一般的に変数をxで表す。 If there are multiple variables, we use the subscript j to distinguish between variables. 複数の変数がある場合は、添え字 j を使って変数を区別する。 However, it's common to use the letter y to denote response variables. しかし、応答変数を表すにはyという文字を使うのが一般的である。 We use p to represent the number of variables in a dataset, excluding the response variable if there is one. 応答変数がある場合はそれを除いて、データセット中の変数の数を表すためにpを使用する。 This means j can take on integer values from 1 to p. つまり、jは1からpまでの整数値を取ることができる。 For example, x sub 2 represents the second explanatory variable. 例えば、xサブ2は2番目の説明変数を表す。 Now, what if we want to refer to a specific observation of a variable? では、ある変数の特定の観測値を参照したい場合はどうするのか? We use subscript i for this, and the letter n represents the total number of observations in the dataset. このために添え字 i を使い、文字 n はデータ集合のオブザベーションの総数を表す。 This means i can take on integer values from 1 to n. つまり、iは1からnまでの整数値を取ることができる。 Using the commute and Chris scenario as an example, the fifth observation contains values from the fifth recorded day. 通勤とクリスのシナリオを例にとると、5番目の観測値には5日目に記録された値が含まれる。 These include y sub 5, the response variable data point recorded on that day, and x sub 5 comma 1 through x sub 5 comma p, data points for the explanatory variables from the same day. これらは、その日に記録された応答変数のデータポイントであるyサブ5と、同じ日に記録された説明変数のデータポイントであるxサブ5コンマ1からxサブ5コンマpを含む。 But a word of caution about subscripts. しかし、添え字については注意が必要だ。 When x has two numbers in its subscript, the first number is i, the second number is j, as we have shown. xの添え字に2つの数字がある場合、最初の数字はi、2番目の数字はjである。 However, if x has only one number in its subscript, it can be either i or j. ただし、xの添え字に数字が1つしかない場合は、iかjのどちらかになる。 So, how can we identify which is which? では、どのように見分ければいいのだろうか? Well, it depends on the context. まあ、それは文脈によるね。 Make sure you read carefully. 注意深く読むように。 In general, if there is only one x variable, that is, p equals 1, then there is no purpose for subscript j. 一般に、x変数が1つしかない場合、つまりpが1に等しい場合、添え字jの意味はない。 So, in this case, the one number in the subscript is usually i. つまり、この場合、添え字の1つの数字は通常iである。 However, if there are multiple x variables, then the one number in the subscript is usually j. ただし、x変数が複数ある場合、添え字の数字は通常jとなる。 You may recall from a probability course that we use uppercase letters to represent random variables, such as capital X and capital Y. 大文字のXや大文字のYなど、確率変数を表すのに大文字を使うことは、確率の授業で習った記憶があるかもしれない。 We can add subscripts to these letters the same way. これらの文字にも同じように添え字をつけることができる。 Introducing subscript i adds clarity, but it can also make equations or expressions messy and difficult to read. 添え字iを導入することで明瞭さは増すものの、方程式や式がごちゃごちゃして読みにくくなることもある。 But we combat this problem by moving to vector and matrix notations. しかし、ベクトルや行列の表記に移行することで、この問題に対処する。 If we use a matrix to represent a data set, rows represent the observations, while columns represent the variables. データ集合を表すために行列を使用する場合、行はオブザベーションを表し、列は変数を表す。 We'll see more of this in future sections, but for now, let's review some basic facts about matrices. これについては今後のセクションで詳しく説明するが、今は行列に関する基本的な事実を復習しておこう。 First, for matrix A, A superscript T is A's transpose. まず、行列Aについて、Aの上付き添字TはAの転置行列である。 Transposing simply means swapping the rows and columns so that the k-th column becomes the k-th row, and vice versa. 転置とは、k番目の列がk番目の行になるように、行と列を入れ替えることである。 Notice transposing a matrix also reverses its dimensions. 行列を転置すると次元も逆になることに注意。 If A is an A by B matrix, then A transpose is a B by A matrix. AがA×Bの行列である場合、Aの転置行列はB×Aの行列である。 And second, A superscript negative one is A's inverse. そして第二に、Aの上付き負の1はAの逆数である。 If we multiply a matrix by its inverse in any order, we will get the identity matrix. 行列に任意の順序で逆行列を掛けると、恒等行列が得られる。 Note that the identity matrix has ones in its diagonal and zeros elsewhere. 恒等行列は対角線上に1を持ち、それ以外の部分にゼロを持つことに注意。 One of the enemies in this course is confusion. このコースの敵の一つは混乱だ。 We'll try to minimize confusion by using clear and consistent notation. 明確で一貫性のある表記を用いることで、混乱を最小限に抑えたい。 However, don't assume that the conventions that we use here are universal. ただし、私たちがここで使っている規約が普遍的なものだと思わないでほしい。 Remember, notation only represents concepts. 表記は概念を表すだけだということを忘れないでほしい。 However, authors may use different notation to suit their needs. しかし、著者はニーズに合わせて異なる表記法を使うことができる。 They may even use the same notation for different but similar concepts. 異なるが似たような概念に同じ表記法を使うことさえある。 So, train yourself to distinguish the concept from the notation. だから、概念と表記を区別する訓練をするんだ。
B2 中上級 日本語 米 変数 応答 通勤 カテゴリー 数字 場合 1 1 データ用語と表記法 SRMコーチング・アクチュアリー (1 1 Data Terminology and Notation SRM Coaching Actuaries) 11 0 楊成明 に公開 2024 年 06 月 25 日 シェア シェア 保存 報告 動画の中の単語