実施年度 | 問題数 | 確認した日 |
---|---|---|
2018/11 | 34 | 2019/01/19 |
2018/06 | 34 | 2019/02/11 |
2017/11 | 34 | 2019/02/17 |
2017/06 | 35 | 2019/02/22 |
2016/11 | 34 | 2019/02/24 |
2016/06 | 34 | 2019/02/26 |
2015/11 | 34 | |
2015/06 | 34 | |
2014/11 | 35 | |
2014/06 | 33 | |
2013/11 | 35 | |
2013/05 | 35 | |
2012/11 | 35 | |
2012/05 | 35 | |
2011/11 | 33 |
参考サイト | URL | 説明 |
---|---|---|
統計Web | https://bellcurve.jp/statistics/ | 過去問の説明が分かり易い。 |
データ科学便覧 | https://data-science.gr.jp/theory.html#tpd | 統計Webでカバーしてない難しい公式など。 |
項目 | 出題箇所 | 出題確率 |
---|---|---|
度数分布表 | 2018/11[1],2017/11[1,2,3],2017/06[3,4,5],2016/11[3,4] | 67% |
ヒストグラム | 2017/11[3,8],2017/06[2],2016/11[3,4,5,6],2016/06[2] | 67% |
幹葉図 | 2016/11[1,2] | 17% |
分布の形状 | 2016/11[6] | 17% |
散布図 | 2016/06[4,5] | 17% |
項目 | 出題箇所 | 出題確率 |
---|---|---|
四分位範囲 | 2017/06[4],2016/11[6,20] | 33% |
箱ひげ図 | 2018/11[2,3],2018/06[1],2017/11[8],2017/06[1,2] | 67% |
標準偏差 | 2018/06[2] | 17% |
出題箇所 | 出題確率 |
---|---|
2018/06[6,7,8] | 17% |
用語 | 意味 |
---|---|
ローレンツ曲線 | 累積相対値を縦軸に、累積相対度数を横軸にした折れ線グラフ |
完全平等線 | 対角線の直線。分配が完全に均等な場合、ローレンツ曲線は完全平等線に一致する |
ジニ係数 | ローレンツ曲線と完全平等線とで囲まれた面積の2倍の値。分配が均等になるほど0に近付く |
出題箇所 | 出題確率 |
---|---|
2018/11[17,18,19] | 17% |
用語 | 説明 | 正の場合 | 0の場合 | 負の場合 | 公式 |
---|---|---|---|---|---|
歪度 | 分布の左右対称性を示す指標 | 右裾が長い | 左右対称 | 左裾が長い | $\frac{{\mu _3 }}{{\sigma ^3 }}=\frac{E[(X-\mu)^3]}{{\sigma ^3 }}$ |
尖度 | 分布の山の尖り度と裾の広がり度を示す指標 | 尖った分布 | 正規分布と同じ | 扁平な分布 | $\frac{{\mu _4 }}{{\sigma ^4 }}-3=\frac{{E[(X-\mu)^4]}}{{\sigma ^4 }}-3$ |
項目 | 出題箇所 | 出題確率 |
---|---|---|
偏差 | 2018/06[1] | 17% |
標準得点(z得点) | 2018/06[1] | 17% |
変動係数 | 2018/06[4],2017/11[7] | 33% |
用語 | 説明 | 公式 |
---|---|---|
偏差 | 平均値と測定値の差 | $\large{\mu - x_{i}}$ |
標準得点(z得点) | 平均が0、標準偏差が1になるように変換した得点 | $\LARGE{x_{i}-\mu \over \sigma }$ |
変動係数 | 標準偏差を平均で割った値 | $\LARGE{\sigma \over \mu }$ |
項目 | 出題箇所 | 出題確率 |
---|---|---|
相関係数 | 2017/06[9] | 17% |
偏相関係数 | 2018/06[5] | 17% |
擬相関(擬似相関) | 2018/11[34],2018/06[5] | 33% |
相関係数とグラフの傾き | 2018/11[4],2018/06[3],2017/11[4],2016/11[7,8],2016/06[3] | 83% |
用語 | 説明 | 公式 |
---|---|---|
偏相関係数 | 2変数から第3の変数の影響を取り除いて求めた相関係数。 2変数の残差の相関係数からも求められる。 |
${\LARGE r_{xy\cdot z} = \frac{r_{xy} - r_{xz}r_{yz}} {\sqrt{1 - r_{xz}^2} \sqrt{1 - r_{yz}^2}}} $ $ \LARGE{= r_{e1\cdot{e2}}}=\frac{\mathrm{Cov}(e_{1},e_{2})}{\sqrt{V(e_{1})V(e_{2})}} $ |
擬相関 (擬似相関) |
2つの事象に因果関係がないのに、見えない要因(潜伏変数)によって因果関係があるかのように推測される事 | ー |
項目 | 出題箇所 | 出題確率 |
---|---|---|
2元クロス表 | 2016/06[6,7,8] | 17% |
用語 | 説明 | 例 |
---|---|---|
要因 | データの値に変化を与える要素 | 算数のテストの場合、「組」、「その日の体調」、「気温」、「テスト時間」 |
因子 | 母平均に差をもたらすと考えられる要因 | - |
水準 | 1つの要因に含まれる項目 | 「組」の水準は「1組、2組、3組」の3つであり、水準数は「3」 |
◯元配置 | データに含まれる因子の数 | 1組、2組、3組の場合、含まれる因子の数は「組」のみなので「一元配置」 |
分散分析の種類 | 説明 | 例 |
---|---|---|
一元配置分散分析 | 1つの因子からなるデータを分析。 因子に含まれる水準間の平均値の差を見る。 |
ある学校の1組、2組、3組の算数のテストのデータがある場合、 各組の平均点に差があるか検定する。 |
二元配置分散分析 | 2つの因子からなるデータを分析。各因子における水準間の平均値の差を見る。 各因子の相乗効果の有無の見る。 |
薬A、B、Cをそれぞれ10mg、20mg投与した場合の効果についてのデータがある場合、薬の種類や投与量によって得られる平均値に差があるか検定 |
多元配置分散分析 | 3つ以上の因子からなるデータを分析する方法 | - |
出題箇所 | 出題確率 |
---|---|
2018/06[25],2017/11[33,34],2017/06[30,31,32] | 50% |
因子 | 平方和 | 自由度 | 平均平方 | F値 |
---|---|---|---|---|
要因 | [全体の平均値]-[因子各水準の平均値] | [因子水準の個数]-1 | $$\frac{要因の平方和}{要因の自由度}$$ | $$\frac{要因の平方和}{残差の平方和}$$ |
残差 | [因子各水準の平均値]-[各データ] | [全体の自由度]-[因子水準の個数] | $$\frac{残差の平方和}{残差の自由度}$$ | なし |
全体 | [データ全体の平均値]-[各データ] | [全体の自由度]-1 | なし | なし |
F値が有意水準より小さいと帰無仮説「全ての水準間で母平均は等しい」は棄却される。
名前 | 出題箇所 | 出題確率 |
---|---|---|
変化率 (成長率) |
2018/11[5],2018/06[9,10],2017/11[11],2017/06[6,7],2016/06[9,10] | 83% |
移動平均 | 2018/11[6] | 17% |
階差系列 | 2016/06[11] | 17% |
用語 | 説明 | 公式 |
---|---|---|
変化率 (成長率) |
前時点での値に対する、ある時点と前時点との値の差の割合 | (ある時点の値 ー 前時点の値)÷(前時点の値) |
移動平均 | 一定区間毎の平均値を区間をずらしながら求める値 | 区間が奇数の場合(3移動平均):$\LARGE{\bar{x}_9 = \frac{x_{8} + x_{9} +x_{10}}{3}}$ 区間が偶数の場合(4移動平均):$\LARGE{\bar{x}_9 = \frac{\frac{x_{7}+x_{8} + x_{9} +x_{10}}{4} + \frac{x_{8}+x_{9} + x_{10} +x_{11}}{4}}{2}}$ |
階差系列 (差分系列) |
1時点離れたデータとの差をとったデータの事 | ー |
名前 | 出題箇所 | 出題確率 |
---|---|---|
ラスパイレス指数 | 2018/11[7],2017/11[10] | 33% |
パーシェ指数 | ||
フィッシャー指数 |
記号 | 意味 |
---|---|
$p_{0i}$ | 基準年の価格 |
$q_{0i}$ | 基準年の数量 |
$p_{ti}$ | 比較年の価格 |
$q_{ti}$ | 比較年の数量 |
指数名 | 説明 | 公式 |
---|---|---|
ラスパイレス指数 | 基準年の数量で価格を比較 | $P_L= \frac{\displaystyle \sum^{n}_{i=1}p_{ti}q_{0i}}{\displaystyle \sum^{n}_{i=1}p_{0i}q_{0i}} \times 100 $ |
パーシェ指数 | 比較年の数量で価格を比較 | $P_P= \frac{\displaystyle \sum^{n}_{i=1}p_{ti}q_{ti}}{\displaystyle \sum^{n}_{i=1}p_{0i}q_{ti}} \times 100 $ |
フィッシャー指数 | ラスパイレス指数とパーシェ指数の幾何平均 | $\displaystyle \sqrt{P_L \times P_P} $ |
出題箇所 | 出題確率 |
---|---|
2017/11[9],2017/06[8] | 33% |
元のデータ」と「元のデータから時間をずらしたデータ」との相関係数を計算する。
そして、元データからずらした量(ラグ)を横軸にとり、計算した相関係数を縦軸に取る。
出題箇所 | 出題確率 |
---|---|
2017/11[13] | 17% |
名前 | 説明 |
---|---|
実験研究 | 研究対象に介入(投薬など)を行う |
観察研究 | 研究対象に介入を行わず、対象の状態を観察する |
名前 | 出題箇所 | 出題確率 |
---|---|---|
標準誤差 | 2017/06[24] | 17% |
偏りの源(調査の設計) | 2016/06[9] | 17% |
名前 | 公式 |
---|---|
標準誤差 | $\LARGE{se=\sqrt\frac{σ^2}{n}=\frac{σ}{\sqrt{n}}}$ |
出題箇所 | 出題確率 |
---|---|
2018/11[8,9],2018/06[12],2017/11[12],2017/06[12],2016/11[10],2016/06[14,15] | 100% |
名前 | 説明 | メリット | デメリット |
---|---|---|---|
単純無作為抽出法 | 母集団から、乱数表を用いて必要数だけサンプルを抽出 | 簡単に標本抽出が可能 | たまたま偏りを持った標本が抽出される可能性がある |
層化抽出法 | 母集団をいくつかの層に分けておき、各層の中から必要な数の調査対象を無作為に抽出 | 母集団内情報(年齢別,性別)の比較を行える母集団の推測の精度が増す | 母集団の構成情報を事前に知っておく必要がある |
比例抽出法 | 層化抽出法で標本の大きさに比例させて調査対象を抽出する | 同上 | 同上 |
クラスター抽出法 | クラスターに分割し、無作為にクラスターを選択し、選択したクラスターの全個体を標本とする | 作業コストを抑えられる | 同じクラスターに属する個体は似た傾向を持つことが多く標本が偏りを持ちやすい |
多段(二段)抽出法 | 母集団をいくつかのグループに分け、そこから無作為抽出でいくつかグループを選び、さらにその中から無作為抽出でいくつかのグループを選び・・・を繰り返し最終的に選ばれたグループの中から無作為抽出 | コストを低く抑えられる、抽出効率が高い | サンプルサイズが小さい場合、標本に偏りが生じる可能性がある |
系統抽出法 | 通し番号をつけた名簿を作成し、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出 | 単純無作為抽出より手間や時間やコストが掛からない | 名簿の並び順に何らかの周期があると標本に偏りが生じる可能性がある |
出題箇所 | 出題確率 |
---|---|
2018/06[11],2016/11[11] | 33% |
原則名 | 説明 |
---|---|
反復 | 同じ条件で2回以上の繰り返し実験する事。1回の測定値に違いは、偶然誤差なのか判断できないため。反復によって偶然誤差の大きさを評価する。 |
無作為化 | 実験の順序や場所などが複数ある場合に、比較したい処理群を無作為に割り付ける。系統誤差を偶然誤差に取り込む。 |
局所管理 | 実験を行う時間や場所を区切って、ブロック内でできるだけ均一になるように管理すること。系統誤差を小さくすることができる。 |
出題箇所 | 出題確率 |
---|---|
2018/11[10,11],2018/06[13,14],2017/11[14],2017/06[14,15,16],2016/11[12,13],2016/06[16,17,18] | 100% |
定理名 | 公式 |
---|---|
加法定理 | $ P(A\cup B)=P(A)+P(B)-P(A\cap B) $ |
条件付き確率 | $ P(B|A)={\large\frac{P(A \cap B)}{P(A)}}$ |
乗法定理 | $ P(A \cap B)={P(B)}\cdot{P(A|B)} = P(A)\cdot{P(B|A)} $ |
ベイズの定理 | $ P(B|A)={\large\frac{P(B)\cdot P(A|B)}{P(A)} }$ |
ベイズの定理(離散) | $ P(B_i|A)={\large\frac{P(B_i)\cdot P(A|B_i)}{\sum P(B_j)\cdot P(A|B_j)} }$ |
ベイズの定理(連続) | $P(B|A) = {\large\frac{P(B)\cdot P(A|B)}{P(B)\cdot P(A|B) + P(B^c)\cdot P(A|B^c)}}$ $P(B)$:事前確率、$P(B|A)$:事後確率、$P(A|B)$:尤度 |
出題箇所 | 出題確率 |
---|---|
2018/06[18,19],2017/11[16,21],2017/06/[19,20],2016/11[14,15,21],2016/06[7,8] | 83% |
公式名 | 公式 |
---|---|
分散 | $V(X) = \frac{1}{n}{\sum^{n}_{i=1}(x_i-{\overline{x}} )^2}={E}\left[\left[X-{E}\left(X\right)\right]^2\right]=E(X^2)-2{E(X)}^2+{E(X)}^2=E(X^2)-{E(X)}^2$ |
標準偏差 | $\sigma = \sqrt{V(X)}$ |
共分散 | $ Cov(X,Y) = \frac{1}{n}\sum_{i = 1}^n {(x_i - \overline{x})(y_i - \overline{y})}$ |
相関係数 | $ r_{XY} = \frac{\mathrm{Cov}(X,Y)}{\sqrt{V(X)V(Y)}} $ |
期待値の性質 | 公式 |
---|---|
一般的性質 | $ E(cX+dY+t) = cE(X) + dE(Y) +t $ |
分散の性質 | 公式 |
---|---|
和の分散 | $V(X \pm Y ) = V(X)+V(Y) \pm 2\mathrm{Cov}(X,Y)$ |
和の分散(3つの場合) | $V(X_1 + X_2 + X_3) $ $= V(X_1)+V(X_2)+V(X_3) + 2\mathrm{Cov}(X_1,X_2)+ 2\mathrm{Cov}(X_2,X_3)+ 2\mathrm{Cov}(X_1,X_3)$ |
分散の一般的性質 | $V(cX+dY+t) = c^2V(X)+d^2V(Y)+2cd\mathrm{Cov}(X,Y)$ |
分散と期待値および二乗期待値の関係 | $V(X) ={E}\left(\left(X-\mu \right)^2\right) = E(X^2)-2\mu{E}(x)+\mu^2 = E(X^2)-E(X)^2$ |
共分散の性質 | 公式 |
---|---|
共分散と期待値の関係 | $ \mathrm{Cov}(X,Y)=E[ (X-\overline{X})(Y-\overline{Y}) ]=E(XY)-E(X){E(Y)} $ |
共分散の加法性① | $Cov(X+Y,Z)$ $=E[(X+Y)Z]-E(X+Y)E(Z)$ $=[E(XZ)-E(X)E(Z)] + [E(YZ)-E(Y)E(Z)]$ $=Cov(X,Z)+Cov(Y,Z)$ |
共分散の加法性② | $Cov(X-Y,Z)$ $=E[(X-Y)Z]-E(X-Y)E(Z)$ $=[E(XZ)-E(X)E(Z)] + [-E(YZ)+E(Y)E(Z)]$ $=[E(XZ)-E(X)E(Z)] - [E(YZ)-E(Y)E(Z)]$ $=Cov(X,Z)-Cov(Y,Z)$ |
共分散の定数倍 | $Cov(cX,Y)=E(cXY)-E(cX)E(Y)=cCov(X,Y)$ |
同じ確率変数の共分散 | $Cov(X,X)=\frac{1}{n}\sum_{i = 1}^n {(x_i - \overline{x})(x_i - \overline{x})}=V(X)$ |
独立な確率変数の性質 | 公式 |
---|---|
期待値(平均) | $E(XY)=E(X)E(Y)$ |
分散 | $V(X\pm Y) = V(X)+V(Y)$ |
共分散 | $\mathrm{Cov}(X,Y) = 0$ |
相関係数 | $r_{XY} = 0 $ |
変量 | $x$ | $y$ | $u=ax+b$ | $v=cy+d$ |
---|---|---|---|---|
平均値 | $ \overline{x}$ | $ \overline{y}$ | $ \overline{u}=a\overline{x}+b$ | $ \overline{v}=c\overline{y}+d$ |
分散 | $ s_{x}^2$ | $ s_{y}^2$ | $ s_{u}^2=a^2 s_{x}^2$ | $ s_{v}^2=c^2 s_{y}^2$ |
標準偏差 | $ s_{x}$ | $ s_{y}$ | $ s_{u}=|a| s_{x}$ | $ s_{v}=|c| s_{y}$ |
変量 | $x$と$y$ | $u=ax+b$と$v=cy+d$ |
---|---|---|
共分散 | $s_{xy}$ | $s_{uv}=acs_{xy}$ |
相関係数 | $r_{xy}$ | $ac>0$の時$\,\,\,\,\, r_{uv}=r_{xy}$ $ac<0$の時$\,\,\,\,\, r_{uv}=-r_{xy}$ |
関数名 | 出題箇所 | 出題確率 |
---|---|---|
確率密度関数 | 2017/11[15,16],2016/11[19,20],2016/06[19,20] | 50% |
区分 | 関数名 | 関数f(x) | 確率変数P(X) | 期待値(平均) | 分散 |
---|---|---|---|---|---|
連続 | 確率密度関数 | $\int_{-{\infty}}^{\infty} f(x)dx = 1$ | $\int_a^b f(x)dx$ | $\displaystyle\int_{-{\infty}}^{\infty} xf(x)dx$ | $\displaystyle\int_{-{\infty}}^{\infty}(x-\mu)^2f(x)dx$ |
離散 | 確率質量関数 | $\sum_{i=1}^{\infty} p(x_i) = 1$ | $\sum_{i=a}^b p(x_i)$ | $\sum_{i=a}^b x_i\cdot{p(x_i)}$ | $\displaystyle \sum_{i=1}^n \left( x_i -\mu \right)^2 p_i$ |
区分 | 関数名 | F(x) | 第1四分位数 | 第2四分位数(中央値) | 第3四分位数 |
---|---|---|---|---|---|
連続 | 確率密度関数 | $P(X \leq x)= \int_{- \infty}^{x} f(t)dt$ | $\int_{- \infty}^{x} f(t)dt=0.25$ となる$x$ |
$\int_{- \infty}^{x} f(t)dt=0.50$ となる$x$ |
$\int_{- \infty}^{x} f(t)dt=0.75$ となる$x$ |
離散 | 確率質量関数 | $P(X \leq x)= \sum_{X\leq x} P(X) $ | $\sum_{X\leq x} P(X) =0.25$ となる$x$ |
$\sum_{X\leq x} P(X) =0.50$ となる$x$ |
$\sum_{X\leq x} P(X) =0.75$ となる$x$ |
出題箇所 | 出題確率 |
---|---|
2018/11[18],2017/11[16] | 33% |
関数f(x) | $E(x^n)$ |
---|---|
$\int_{-{\infty}}^{\infty} f(x)dx = 1$ | $\displaystyle\int_{-{\infty}}^{\infty} {x^n}f(x)dx$ |
分布名 | 出題箇所 | 出題確率 |
---|---|---|
二項分布 | 2018/11[14,24],2017/11[20],2017/06[17,18],2016/06[23,25] | 67% |
ベルヌーイ分布 | 2016/11[23] | 17% |
ポアソン分布 | 2017/11[22,23],2016/11[16,17,18] | 33% |
連続一様分布 | 2018/11[18] | 17% |
t分布 | 2018/11[18],2017/11[17] | 33% |
カイ二乗分布 | 2017/11[17],2017/06[21,22] | 33% |
F分布 | 2017/11[17,18] | 17% |
区分 | 分布名 | 意味とパラメータ | 関数f(x) | 平均 | 分散 | 分布の記号 |
---|---|---|---|---|---|---|
離散 | 二項分布 | 1回当たりの成功確率がpの試行をn回行ったときの成功回数xの分布 | ${_n C _x p^x (1-p)^{n-x}}$ | $np$ | $np(1-p)$ | $Bi(n, p)$ |
離散 | ベルヌーイ分布 | n=1の二項分布。成功確率がpの施工を1回行った時の成功回数x=0,1の分布 | $p^x(1-p)^{(1-x)}$ | $p$ | $p(1-p)$ | $Ber(p) $ |
離散 | ポアソン分布 | np=λ、n→∞、p→0の二項分布 | ${e^{-λ} \frac{λ^x}{x!}}$ | $λ$ | $λ$ | $Po(λ)$ |
離散 | 幾何分布 | 成功確率pの試行でx-1回目まで失敗してx回目で初めて成功したxの分布 | ${p(1-p)^{x-1}}$ | ${\frac{1}{p}}$ | ${\frac{1-p}{p^2}}$ | $Ge(p)$ |
離散 | 超幾何分布 | M個の赤玉とN-M個の白玉から同時にn個取り出した中に含む赤玉の個数xの分布 | $\begin{eqnarray*}\frac{{}_M\mathrm{C}_x\cdot {}_{N-M}\mathrm{C}_{n-x}}{{}_N\mathrm{C}_n}\end{eqnarray*}$ | $\frac{nM}{N}$ | $\left(\frac{nM}{N}\right)\left(1-\frac{M}{N}\right)\left(\frac{N-n}{N-1}\right)$ | $HG(N, M, n) $ |
離散 | 負の二項分布 | 成功確率がpの試行をk回成功するまで繰り返したときの失敗回数xの分布 | ${_{x+k-1} C _x p^k (1-p)^x}$ | $\frac{kq}{p}$ | $\frac{kq}{p^2}$ | $NB(k, p) $ |
離散 | 離散一様分布 | 確率変数Xの幅を固定した場合に確率が一定となる分布。Xの最大値をNとする。 | $\frac{1}{N}$ | ${\frac{N+1}{2}}$ | $\frac{N^2-1}{12}$ | $DU(N)$ |
区分 | 分布名 | 意味とパラメータ | 関数f(x) | 平均 | 分散 | 分布の記号 |
---|---|---|---|---|---|---|
連続 | 正規分布 | 期待値μの付近に標準偏差σで集積する分布 | $\frac{1}{\sqrt{2\pi \sigma^2}} \exp \left(-\frac{(x - \mu)^2} {2\sigma^2} \right) \hspace{20px}$ | $\mu$ | $\sigma^2$ | $N(\mu,\sigma^2)$ |
連続 | 指数分布 | 単位時間の生起回数が期待値λのポアソン分布に従う事象が初めて生起するまでの待ち時間tの分布 | ${λe^{-λt}}$ | ${\frac{1}{λ}}$ | ${\frac{1}{λ^2}}$ | $Ex(λ)$ |
連続 | 連続一様分布 | 確率変数Xの幅を固定した場合に確率が一定となる分布。 Xの最小値をaとし最大値をbとする。 |
$\frac{1}{b-a}$ (a≦x≦b) 0 (その他) |
${\frac{a+b}{2}}$ | ${\frac{(b-a)^2}{12}}$ | $U(a, b) $ |
連続 | t分布 | 母集団の平均と分散が未知で標本サイズが小さい場合に平均を推定する問題に利用される。kは自由度 自由度を大きくすると正規分布に近付く $W\sim \chi^2(k)$と$Z\sim N(0,1)$が互いに独立な時、 $\frac{\LARGE{Z}}{\sqrt{\LARGE{\frac{W}{n}}}}$は自由度$n$のt分布に従う |
省略 | $0$ $(k>1)$ |
${\large \frac{k}{k-2}}$ $(k>2)$ |
$t(k)$ |
連続 | カイ二乗分布 | 適合度検定や独立性検定等で用いられる。 k は自由度 $Z_{1},Z_{2}, ・・・ ,Z_{k}$が互いに独立で$N(0,1)$に従う時、$W=Z_{1}^{2}+Z_{2}^{2}+\cdots+Z_{k}^{2} $は自由度$k$のカイ二乗分布に従う |
省略 | $k$ | $2k$ | $\chi^2(k)$ |
連続 | F分布 | 等分散性の検定で用いられる。 $m_1$と$m_2$ は自由度 $W_1\sim \chi^2(k_1)$と$W_2\sim \chi^2(m_m)$が互いに独立な時、$\large{\frac{W_1/m_1}{W_2/m_2}}$は自由度$(m_1,m_2)$のF分布に従う $\large{F_{\alpha}(m_1,m_2)=}\frac{\LARGE{1}}{\LARGE{F_{1-\alpha}(m_1,m_2)}}$ と上側確率から下側確率を算出できる |
省略 | $\large{\frac{m_2}{m_2-2}}$ $(m_2>2)$ |
$\frac{2m_2^2(m_1+m_2-2)}{m_1(m_2-2)^2(m_2-4)}$ $(m_2>4)$ |
$F(m_1,m_2)$ |
出題箇所 | 出題確率 |
---|---|
2018/11[12,13],2018/06[15,16],2017/11[19,21],2017/06[13] | 67% |
名前 | 説明 |
---|---|
標準化 | $X \sim \mathcal{N}(\mu, \sigma^{2})$の時、$Z={\large\frac{X-\mu}{\sigma}}$と定義すると$Z \sim \mathcal{N}(0, 1)$となる。 標準化を行うことにより、単位や平均値などが異なるデータ同士を正規分布表を使って比較できるようになる。 |
正規分布の再生性 | $X_{1} \sim \mathcal{N}(\mu_{1}, {\sigma_{1}}^{2})$と独立な$X _{2}\sim \mathcal{N}(\mu_{2}, {\sigma_{2}}^{2})$を足すと、$(X_{1}+X_{2})\sim \mathcal{N}(\mu_{1} + \mu_{2}, {\sigma_{1}}^{2} + {\sigma_{2}}^{2} )$ |
差の分布 | $X_{1} \sim \mathcal{N}(\mu_{1}, {\sigma_{1}}^{2})$と独立な$X _{2}\sim \mathcal{N}(\mu_{2}, {\sigma_{2}}^{2})$を引くと、$(X_{1}-X_{2})\sim \mathcal{N}(\mu_{1} - \mu_{2}, {\sigma_{1}}^{2} + {\sigma_{2}}^{2} )$ |
出題箇所 | 出題確率 |
---|---|
2018/11[16],2016/11[22,29],2016/06[21,22] | 50% |
公式名 | 公式 |
---|---|
不偏分散 | ${\large\frac{1}{n - 1}}\sum_{i = 1}^n {(x_i - \overline{x})^2}$ |
標本分散 | ${\large\frac{1}{n }}\sum_{i = 1}^n {(x_i - \overline{x})^2}$ |
不偏分散と標本分散の関係 | $ \hat{\sigma}^2 = {\large\frac{n}{n-1}}\sigma^2 $ |
標本平均の期待値 | ${ \displaystyle E( \bar{X} ) = E( \frac{1}{n} \sum_{k = 1}^{n} X_i ) = \frac{1}{n} E( \sum_{k=1}^{n} X_i ) = \frac{1}{n} \sum_{k=1}^{n} E( X_i ) = \frac{1}{n} \sum_{k=1}^{n} \mu = \mu}$ |
標本平均の分散 | ${ \displaystyle V( \bar{X} ) = V( \frac{1}{n} \sum_{k = 1}^{n} X_i )= (\frac{1}{n})^2 V( \sum_{k=1}^{n} X_i )= \frac{1}{n^2} \sum_{k=1}^{n} V( X_i )= \frac{1}{n^2} \sum_{k=1}^{n} {\sigma}^2= \frac{{\sigma}^2}{n} }$ |
標本平均の分布 | 正規分布に従う。${ N(\mu,{\large\frac{{\sigma}^2}{n}})}$ |
標本の変動係数 | $ \frac{\sqrt{\LARGE{\frac{{\sigma}^2}{n}}}}{\LARGE{\mu}}$ |
用語 | 説明 |
---|---|
不偏性 | nが小さい時にも大きい時にも、推定量の外れ具合が偏っていない(外れ具合が上にも下にも同じである) 標本平均は一致推定量 |
一致性 | nが大きくなれば、推定量がだんだんと真のパラメータに近づく性質 標本平均は不偏推定量 |
名前 | 出題箇所 | 出題確率 |
---|---|---|
𝜎が既知(母分散既知) | 2018/06[20],2017/06[23] | 33% |
𝜎が未知(母分散未知) | 2018/06[21],2017/06[25,26],2016/06[26] | 50% |
No | 手順 | 説明 |
---|---|---|
01 | 標本平均$\LARGE{\overline{x}}$を求める | 抽出した標本の平均値を求める |
02 | 標本平均の標準化する | 母平均を$\large{\mu}$、母分散を$\large{\sigma^{2}}$、抽出したサンプルサイズを$\large{n}$とすると標本平均は、${\large\frac{\bar{x}-μ}{\sqrt{{\LARGE\frac{σ^2}{n}}}}}$と標準化される。 |
03 | 有意水準 | α=0.05とする |
04 | 統計量Tを定義する | 標準化した標本平均を統計量Tとすると、統計量 $T={\large\frac{\bar{x}-μ}{\sqrt{{\LARGE\frac{σ^2}{n}}}}}$ は$ N(0,\sqrt{1})$に従う |
05 | 統計量Tの有意水準での範囲 | $\large{-z_{\alpha/2}} \leq {\large\frac{\bar{x}-μ}{\sqrt{{\LARGE\frac{σ^2}{n}}}}} \leq \large{z_{\alpha/2} }$ $\large{z_{\alpha/2}}$は正規分布における上側確率が$\alpha/2$となる値。有意水準が0.05の場合はP値が0.025となる1.96が$\large{z_{\alpha/2}}$の値 |
06 | 母平均を区間推定する | $ \large{\overline{x}-\large{z_{\alpha/2}}\times \sqrt{\frac{\sigma^{2}}{n}} \leq \mu \leq \overline{x}+\large{z_{\alpha/2}} \times \sqrt{\frac{\sigma^{2}}{n}} }$ |
No | 手順 | 説明 |
---|---|---|
01 | 標本平均$\LARGE{\overline{x}}$を求める | 抽出した標本の平均値を求める |
02 | 有意水準 | α=0.05とする |
03 | 統計量Tを定義する | 母平均を$\large{\mu}$、標本分散を$\large{s^2 = {\large\frac{1}{n - 1}}\sum_{i = 1}^n {(x_i - \overline{x})^2}}$、抽出したサンプルサイズを$\large{n}$とすると、 統計量 $T={\LARGE\frac{\bar{x}-μ}{\LARGE\sqrt\frac{s^2}{n}}}$は$ t(n-1)$に従う |
04 | 統計量Tの有意水準での範囲 | $-\large{t_{\alpha/2}(n-1)}\leq \LARGE\frac{\overline{x}-\mu}{\sqrt{\frac{s^{2}}{n}}} \leq \large{t_{\alpha/2}(n-1)}$ $\large{t_{\alpha/2}(n-1)}$は自由度が(n-1)のt分布における上側確率が$\large{\alpha/2}$となる値。t値と呼ぶ |
05 | 母平均を区間推定する | $\large{\overline{x}}-\large{t_{\alpha/2}(n-1)} \times \LARGE{\sqrt{\frac{s^{2}}{n}}} \leq \mu \leq \large{\overline{x}}+\large{t_{\alpha/2}(n-1)} \times \LARGE{\sqrt{\frac{s^{2}}{n}}}$ |
名前 | 出題箇所 | 頻度 |
---|---|---|
母平均既知(母平均𝜇が既知) | ||
母平均未知(母平均𝜇が未知) |
条件 | 何を区間推定するか? | 統計量Tが従う分布 |
---|---|---|
母平均既知(母平均μが既知) | 母分散σを区間推定 | 統計量 $T=\sum_{i=1}^{k} {\large(\frac{X_i-\mu}{\sigma})^2}$は自由度nの$\chi^2$分布に従う |
母平均未知(母平均μが未知) | 母分散σを区間推定 | 統計量 $T=\sum_{i=1}^{k} {\large(\frac{X_i-\mu}{\sigma})^2}$は自由度n-1の$\chi^2$分布に従う |
出題箇所 | 出題確率 |
---|---|
2018/11[20],2018/06[22],2017/11[27] | 50% |
No | 手順 | 説明 |
---|---|---|
01 | 標本比率$\LARGE{\widehat{p}}$を求める | 成功回数Xを試行回数nで割って求める。${\large\widehat{p}=\displaystyle \frac{X}{n}}$ |
02 | 成功回数を標準化する | 十分大きなnに対して $B(n,p)$ は正規分布 $N(np,np(1-p))$に近似できる。(ラプラスの定理) よって成功回数Xが二項分布$B(n,p)$に従う場合、Xを標準化したZは$N(0,1)$に従う。 $\LARGE{Z=\frac{X-μ}{σ}=\frac{X-np}{\sqrt{np(1-p)}}}$ |
03 | 標準化成功回数を 標本比率で置換 |
$\LARGE{Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{\frac{1}{n}}{\frac{1}{n}} \times \frac{X-np}{\sqrt{np(1-p)}} = \frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} = \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}}$ |
04 | 信頼区間を設定 | $(1-\alpha)(=100(1-\alpha)\%)$ |
05 | Zの範囲 | $\LARGE{-z_{\alpha/2}} \leq {\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}} \leq z_{\alpha/2} $ $\large{z_{\alpha/2}}$は正規分布における上側確率が$\alpha/2$となる値。有意水準が0.05の場合はP値が0.025となる1.96が$\large{z_{\alpha/2}}$の値 |
06 | $\sqrt{\frac{p(1-p)}{n}}$のpを変更 | nが十分大きい時に$\widehat{p}$は$p$に近似するため、 $\LARGE{-z_{\alpha/2}} \leq {\frac{\widehat{p}-p}{\sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}}} \leq z_{\alpha/2} $ |
07 | 母比率を区間推定する | $\LARGE{\widehat{p}-z_{\frac{\alpha}{2}} \cdot{\sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}} \leq p \leq \widehat{p} + z_{\frac{\alpha}{2}} \cdot{\sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}} }$ |
出題箇所 | 出題確率 |
---|---|
2017/11[28] | 17% |
No | 手順 | 説明 |
---|---|---|
01 | 標本比率を求める | ${\large\widehat{p_{1}}=\frac{X_{1}}{n_{1}}} \,\,\,\,\,\,\,\, {\large\widehat{p_{2}}=\frac{X_{2}}{n_{2}}}$ |
02 | 正規分布へ近似 | $X$が$B(n,p)$に従う時、十分大きなnに対して$\large{\widehat{p}}$は近似的に$\large{N(p, \frac{p(1-p)}{n})}$に従う。 |
03 | 正規分布の差の再生性 | $ \large{\widehat{p_1}-\widehat{p_2} \sim N \left( p_1-p_2, \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2} \right) }$ |
04 | 信頼区間を設定 | $(1-\alpha)(=100(1-\alpha)\%)$ |
05 | Zの範囲 | $\LARGE{-z_{\alpha/2}} \leq {\frac{p_{1}-p_{2}}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}}} \leq z_{\alpha/2} $ $\large{z_{\alpha/2}}$は正規分布における上側確率が$\alpha/2$となる値。有意水準が0.05の場合はP値が0.025となる1.96が$\large{z_{\alpha/2}}$の値 |
06 | 分母のpを変更 | nが十分大きい時に $\widehat{p_1}$ は $p_{1}$ に、 $\widehat{p_2}$ は $p_{2}$ に近似するため、 $\LARGE{-z_{\alpha/2}} \leq {\frac{p_{1}-p_{2}}{\sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2} (1-\widehat{p_2} )}{n_2}}}} \leq z_{\alpha/2} $ |
07 | 母比率の差を区間推定する | $\LARGE{ (\widehat{p_1}-\widehat{p_2})-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2}(1-\widehat{p_2})}{n_2}} \leq p_1-p_2 \leq (\widehat{p_1}-\widehat{p_2})+z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2}(1-\widehat{p_2})}{n_2}} }$ |
09 | 区間推定が0を跨いでいないか確認 | 0を跨いでいない場合は、有意水準で割合が変化した(0より有意に大きい)と言える |
出題箇所 | 出題確率 |
---|---|
2018/11[23],2018/06[26,27],2017/11[29],2016/06[29] | 67% |
用語 | 意味 |
---|---|
帰無仮説 | 検定で最初に立てられる仮説。これが棄却されることにより、対立仮説を結論とする。$H_0$と記される。 |
対立仮説 | 本来証明したい仮説。帰無仮説が棄却された時に採択される仮説。$H_1$と記される。 |
統計量 | 一定の確率法則に従っていろいろな値をとる確率変数 |
P値 | 帰無仮説が正しいとした仮定とき、観測した事象よりも極端なことが起こる確率。有意水準と比較する。1を超える事はない。 |
有意水準 | 第一種過誤を犯す確率。αと表示する。P値が有意水準よりも小さい場合は帰無仮説は棄却される。0.05と設定されることが多い |
第一種過誤 | 偽陽性やαとも呼ばれる。帰無仮説が実際には真であるのに棄却してしまう過誤 |
第二種過誤 | 偽陰性やβとも呼ばれる。対立仮説が実際には真であるのに帰無仮説を採用してしまう過誤 |
検出力 | 1-βで求める。帰無仮説が正しくない時に、正しく帰無仮説を棄却する確率。 |
対応のあるデータ (反復測定) | 条件を変えても同じ個体群で繰り返し測定したデータ |
対応のないデータ | 測定した個体群が異なるデータ |
片側検定 | 帰無仮説μ=0に対して、μ<0やμ>0を片側対立仮説とよび、この対立仮説を用いた検定 |
両側検定 | 帰無仮説μ=0に対して、μ≠0を両側対立仮説とよび、この対立仮説を用いた検定 |
出題箇所 | 出題確率 |
---|---|
2018/11[21],2016/11[30,31],2016/06[27] | 50% |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:平均は○○である |
02 | 対立仮説を立てる | $H_{1}$:平均は○○ではない |
03 | 有意水準 | α=0.05とする |
04 | 統計量Tを算出 | 統計量 $T={\large\frac{\bar{x}-μ}{\sqrt{{\LARGE\frac{s^2}{n}}}}}$ |
05 | t分布表で有意水準か確認 | 統計量Tの値が、t分布の自由度「n-1」で有意水準「0.025」(両側検定なので0.5の半分)の値より大きい場合は、帰無仮説を棄却 |
名前 | 標本が同一か? | 出題箇所 | 出題確率 |
---|---|---|---|
母分散が等しいと仮定した2標本のt検定 | 標本が同一である(対応のあるデータ) | 2016/11[28] | 17% |
母分散が等しくない仮定した2標本のt検定 | 標本が同一でない(対応のないデータ) | 2018/06[24],2016/06[28] | 33% |
名前 | 意味 | 例 |
---|---|---|
対応のあるデータ(標本が同一) | 条件を変えても同じ個体群で繰り返し測定したデータ。(反復測定) | A、B、Cの3人について、10歳時と15歳時の身長を測定 |
対応のないデータ(標本が同一でない) | それぞれの条件において測定した個体群が異なるデータ | 10歳のA、B、Cの3人の身長と、15歳のD、E、Fの3人の身長を測定 |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:母平均は等しい |
02 | 対立仮説を立てる | $H_{1}$:母平均は等しくない |
03 | 有意水準 | α=0.05とする |
04 | それぞれの差の平均値を算出 | $\overline{x_{d}}=E($1回目の観測値$\large{_{i}}$-2回目の観測値$\large{_{i}})$ |
05 | それぞれの差の不偏分散を算出 | $S_{d}^2=\frac{1}{n - 1}\sum_{i = 1}^n {(観測値の差\large{_{i}} - \overline{x_{d}})^2}$ |
06 | 統計量Tを算出 | $T=\frac{\large{\overline{x_{d}}}-\mu_{d}}{\large{\sqrt{\frac{\LARGE{S}_{d}^2}{\LARGE{n}}}}}=\frac{\large{\overline{x_{d}}}}{\large{\sqrt{\frac{\LARGE{S}_{d}^2}{\LARGE{n}}}}}$ 帰無仮説「母平均が等しい」が正しいとすると$\mu_{d}=0$ |
07 | t分布表で有意水準か確認 | 統計量Tの値が、t分布の自由度「$n-1$」で有意水準「0.025」(両側検定なので0.5の半分)の値より大きい場合は、帰無仮説を棄却 |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:母平均は等しい |
02 | 対立仮説を立てる | $H_{1}$:母平均は等しくない |
03 | 有意水準 | α=0.05とする |
04 | プールされた分散を算出 | $s_{p}^{2}=\large{\frac{(n_{1}-1) \times {s_{1}}^{2}+(n_{2}-1) \times {s_{2}}^{2}}{n_{1}+n_{2}-2}} $ ${s_{1}^{2}}$:1群目の不偏分散、${s_{2}^{2}}$:2群目の不偏分散 |
05 | 統計量Tを算出 | $T=\large{\frac{\overline{x}_{1}-\overline{x}_{2}-(\mu_1-\mu_2)}{\sqrt{s_{p}^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{s_{p}^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}}$ 帰無仮説「母平均が等しい」が正しいとすると$(\mu_1-\mu_2)=0$ |
06 | t分布表で有意水準か確認 | 統計量Tの値が、t分布の自由度「$n_{1}+n_{2}-2$」で有意水準「0.025」(両側検定なので0.5の半分)の値より大きい場合は、帰無仮説を棄却 |
2つ以上の分類基準を持つクロス集計表で分類基準間に関連があるか、カイ二乗分布で検定。
出題箇所 | 出題確率 |
---|---|
2018/06[31,32,33],2017/06[28,29],2016/11[25,26,27],2016/06[30,31] | 67% |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:分類基準間は独立である(関連がない) |
02 | 対立仮説を立てる | $H_{1}$:分類基準間は独立ではない(関連がある) |
03 | 有意水準 | α=0.05とする |
04 | 理論値(期待度数)を算出 | ${\large{f_{i}}}$:i列目の度数合計、${\large{f_{j}}}$:j行目の度数合計、n:全度数合計 i列・j行目「理論値」= ${\large\displaystyle \frac{f_{i \cdot} \times f_{\cdot j}}{n}} $ |
05 | カイ二乗統計量を算出 | カイ二乗統計量=${\large Σ(\frac{([実測度数_{i}]-[期待度数_{i}])^2}{[期待度数_{i}]}})$ |
06 | カイ二乗分布表で有意水準か確認 | 統計量の値が、カイ二乗分布の自由度「(m-1)×(n-1)」で有意水準「0.05」(片側検定なの)の値より大きい場合は、帰無仮説を棄却 縦がm行、横がn列 |
出題箇所 | 出題確率 |
---|---|
2018/11[22],2018/06[34],2017/06[27] | 50% |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:二つの分布は分散が等しい |
02 | 対立仮説を立てる | $H_{1}$:二つの分布は分散が等しくない |
03 | 有意水準 | α=0.05とする |
04 | 検定統計量Fを算出 | $F={\LARGE\frac{s_{1}^{2}}{s_{2}^{2}}}$ ${\large{s_{1}^{2}}}$:1群目の不偏分散、${\large{s_{2}^{2}}}$:2群目の不偏分散 |
05 | 両側検定を行う | 統計数値表から${\LARGE{F_{\frac{α}{2}}(m_{1}, m_{2})}}={\LARGE{F_{\frac{α}{2}}(n_{1}-1, n_{2}-1)}}$ が棄却域か確認する |
出題箇所 | 出題確率 |
---|---|
2018/11[25],2016/11[24] | 33% |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:発生確率は○○である |
02 | 対立仮説を立てる | $H_{1}$:発生確率は○○ではない |
03 | 有意水準 | α=0.05とする |
04 | 統計量Zを算出 | 統計量 $\large{Z} = \frac{\LARGE{\widehat{p}-p_0}}{\LARGE{\sqrt{\frac{p_0(1-p_0)}{n}}}}$ $\widehat{p}=\displaystyle \frac{X}{n}\,\,\,\, {p}_0=母比率$ |
05 | 正規分布で有意水準か確認 | 統計量Zの値より、正規分布で確率を確認し、有意水準(両側検定なので0.025)より大きい場合は、帰無仮説を棄却 |
出題箇所 | 出題確率 |
---|---|
2018/11[26] | 17% |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:母比率は等しい |
02 | 対立仮説を立てる | $H_{1}$:母比率は等しくない |
03 | 有意水準 | α=0.05とする |
04 | プールした標本比率 $\widehat{p}$を算出 | プールした標本比率 $\widehat{p}=\frac{n_1\widehat{p}_1+n_2\widehat{p}_2}{n_1+n_2}$ $\widehat{p}_1$=1郡目の標本比率 $\,\,\,\, \widehat{p}_2$=2郡目の標本比率 $n_1$=1郡目のサンプル数 $\,\,\,\, n_2$=2郡目のサンプル数 |
05 | 統計量Zを算出 | 統計量 $\large{Z}=\frac{\widehat{p}_{1}-\widehat{p}_{2}}{\sqrt{\widehat{p}(1-\widehat{p}) \left(\frac{1}{n_1}+\frac{1}{n_2} \right)}}$ |
06 | 正規分布で有意水準か確認 | 統計量Zの値より、正規分布でP(Z)を確認し、両側検定なのでP(Z)を二倍した値が、有意水準より大きい場合は、帰無仮説を棄却 |
出題箇所 | 出題確率 |
---|---|
2018/11[27,28],2017/11[30,31] | 33% |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:理論値と実測値は等しい |
02 | 対立仮説を立てる | $H_{1}$:理論値と実測値は等しくない |
03 | 有意水準 | α=0.05とする |
04 | クロス集計表の各列のズレを算出 | 「理論値」からの「実測値」のズレを2乗したものを、「理論値」の値で割る |
05 | 統計量 $\large{\chi^{2}}$を算出 | ズレの和をとる。カイ二乗統計量${\LARGE= Σ\frac{([実測値_{i}]-[理論値_{i}])^2}{[理論値_{i}]}}$ |
06 | カイ二乗分布で有意水準か確認 | 統計量$\large{\chi^{2}}$の値が、自由度「カテゴリ数n-1」で有意水準「0.05」の値より大きい場合は、 帰無仮説を棄却 ※nはサンプル数ではなくカテゴリ数 |
項目 | 出題確率 |
---|---|
2018/11[32,33,34],2017/11[5,6,25],2017/06[10,11],2016/06[12,13] | 67% |
用語 | 意味 |
---|---|
P-値 | 説明変数が不要か判断する。「パラメータの真の値は0である」という仮説の検定結果で0.05より小さいと帰無仮説で棄却される。 値が大きいとモデルに入れても効果がない。1以下の値をとる。 |
t値 | その説明変数をモデルに使用する方が良いか表す。2以上なら使用するべきで、1未満なら使用しない方が良い。 1以上で2未満なら分析者が判断する。$\LARGE{t値=偏回帰係数➗標準誤差} \,\,\,\,\,\,\,$で算出できる。 |
回帰式 | $\large{y=\beta_{0}+\beta_{1} x}\,\,\,\,\,\beta_{0}$は切片を表す。$\large{\beta_{0}}$は偏回帰係数を表す。 |
決定係数 | $\large{R^{2}}$で表される。データに対する、推定された回帰式の当てはまりの良さ(度合い)を表す。 0から1の間の値を取り、1に近いほど良い。 |
誤差 | 真の回帰式から算出される値と実際のデータとの差。計算で求められない。 |
最小二乗法 | モデル関数を$\large{y=f(x)}$とする時、$\large{\sum_{i=1}^n\{y_i-f(x)\}^2}$が最小となる$\large{f(x)}$を求める事 |
残差 | 実際のデータを用いて推定された回帰式から算出される値と実際のデータとの差。計算で求められる。 |
残差標準誤差 | $\large{残差標準誤差^2}=残差平方和/(サンプルの数-説明変数の数-1)$で算出する。 |
残差平方和 | RSSで表される。残差の平方(二乗)の和 |
自由度調整済み決定係数 | $\large{R_{f}^{2}}$で表される。決定係数は説明変数の数が増えるほど1に近づくという性質を持っているため、説明変数の数が多い場合には補正する。 値が大きいほど良い。 |
重相関係数 | $\large{R}$で表される。実際に観測された目的変数の値と、重回帰式をあてはめて計算した推定値との相関係数 0から1の間の値を取り、1に近いほど分析の精度は高い。 |
切片 | y=ax+bとモデルがある場合、aの値。$\LARGE{[Yの平均] - [偏回帰係数b] * [Xの平均]}$で算出できる。 |
説明変数、特徴量 | y=ax+bとモデルがある場合、予測で使用する変数(X)の事 |
多重共線性 | モデル内の一部の予測変数が他の予測変数と相関係数が高く、回帰係数の分散を増加させて不安定にする問題。 |
偏回帰係数 | y=ax+bとモデルがある場合、bの値。$\LARGE{\frac{XとYの共分散}{Xの分散}} \,\,\,\,\,\,\,$で算出できる。 |
偏回帰係数の検定統計量 | 偏回帰係数=aかどうか検討する場合。$\large{T=}\LARGE{\frac{偏回帰係数-a}{標準誤差}}$ 自由度が[サンプル数] - [説明変数個数] - 1 のt分布に従う。 |
目的変数、被説明変数 | y=ax+bとモデルがある場合、予測したい変数(Y)の事。 |
出題箇所 | 出題確率 |
---|---|
2018/11[29,30,31],2018/06[28,29,30],2017/11[24,26],2017/06[33,34,35],2016/11[32,33,34],2016/06[32,33,34] | 100% |
用語 | 意味 |
---|---|
Coefficients | 回帰分析の結果の主要部分を表示 |
Intercept | 切片 |
Estimate | 偏回帰係数の推定値。 (単回帰分析の場合は直線の傾き) |
Std.Error | 標準誤差 |
t value | t値。説明変数の係数や定数項の確からしさの度合い |
Pr(>|t|) | p値。説明変数の係数や定数項が”たまたま”その値である確率 |
Residual standard error | 残差の標準誤差と自由度(サンプルの数-説明変数の数-1)を表示 |
Multiple R-squared | 寄与率、決定係数 |
Adjusted R-squared | 調整済み寄与率、調整済み決定係数 |
f-statistic | F値 |
p-value | p値 |
No | 手順 | 説明 |
---|---|---|
01 | 帰無仮説を立てる | $H_{0}$:偏回帰係数=○○ |
02 | 対立仮説を立てる | $H_{1}$:偏回帰係数≠○○ |
03 | 有意水準 | α=0.05とする |
04 | 統計量Tを算出 | $t_i=\frac{\widehat{\beta}_i-○○}{se(\widehat{\beta}_i)}$ $\widehat{\beta}_i$:偏回帰係数 $se(\widehat{\beta}_i)$:標準誤差(標本から測定された統計量の標準偏差) |
05 | t分布で有意水準か確認 | 統計量$t_i$の値が、自由度「n-k-1」で有意水準の半分の「0.025」の値より大きい場合は、帰無仮説を棄却 n:サンプルサイズ k:説明変数の数 |
出題箇所 | 出題確率 |
---|---|
2016/06[34] | 17% |
No | 手順 | 説明 |
---|---|---|
01 | 有意水準 | α=0.05とする |
02 | 統計量Tを算出 | $\LARGE{T=\frac{\widehat{\beta}-\beta}{se(\widehat{\beta})}}$ 統計量Tは自由度がn-(偏回帰係数の数)-1のt分布に従う。 $\widehat{\beta}$:偏回帰係数 $se(\widehat{\beta})$:標準誤差(標本から測定された統計量の標準偏差) |
03 | 統計量Tの信頼区間を算出 | $\LARGE{t_{α} \leq \frac{\widehat{\beta}-\beta}{se(\widehat{\beta})} \leq t_{1-α}} $ |
04 | 回帰係数の信頼区間を算出 | $\LARGE{\widehat{\beta} - t_{α}\cdot{se(\widehat{\beta})} \leq \beta \leq \widehat{\beta} -t_{1-α}\cdot{se(\widehat{\beta})}}$ |
用語 | 出題箇所 | 出題確率 |
---|---|---|
場合の数と確率 | 2018/11[15],2018/06[17] | 33% |
要約統計量(基本統計量、記述統計量、代表値) | 2017/11[32] | 17% |
用語 | 公式 |
---|---|
場合の数と確率 | $Aが起こる確率=\large{\frac{Aが起こる場合の数}{全ての場合の数}}$ |
用語 | 出題箇所 | 出題確率 |
---|---|---|
標本比率の和の標準誤差 | 2018/06[23] | 17% |
No | 手順 | 説明 |
---|---|---|
01 | 母比率の和の推定値を求める | $\LARGE{\frac{N_1\widehat{p}_1+N_2\widehat{p}_2}{N_1+N_2} }$ |
02 | 「母比率の和の推定値」 の分散を求める |
$\large{ V\left[ \frac{N_1\widehat{p}_1+N_2\widehat{p}_2}{N_1+N_2} \right] = V\left[ \frac{N_1\widehat{p}_1}{N_1+N_2} + \frac{N_2\widehat{p}_2}{N_1+N_2}\right] = V\left[ \frac{N_1\widehat{p}_1}{N_1+N_2} \right] + V\left[ \frac{N_2\widehat{p}_2}{N_1+N_2}\right] \\ }$ $\large{= \left( \frac{N_1}{N_1+N_2} \right)^2 V[\widehat{p}_1] + \left( \frac{N_2}{N_1+N_2} \right)^2 V[\widehat{p}_2]}$ |
03 | 正規分布へ近似 | $X$が$B(n,p)$に従う時、十分大きなnに対して$\large{\widehat{p}}$は近似的に$\large{N(p, \frac{p(1-p)}{n})}$に従う。 |
04 | 「母比率の和の推定値」 の分散を求める |
$\large{ V\left[ \frac{N_1\widehat{p}_1+N_2\widehat{p}_2}{N_1+N_2} \right] = \left( \frac{N_1}{N_1+N_2} \right)^2 \frac{\widehat{p}_1(1-\widehat{p}_1)}{n_1} + \left( \frac{N_2}{N_1+N_2} \right)^2 \frac{\widehat{p}_2(1-\widehat{p}_2)}{n_2}}$ |
05 | 「母比率の和の推定値」 の標準誤差を求める |
$\large{\sqrt{V\left[ \frac{N_1\widehat{p}_1+N_2\widehat{p}_2}{N_1+N_2} \right]} = \sqrt{\left( \frac{N_1}{N_1+N_2} \right)^2 \frac{\widehat{p}_1(1-\widehat{p}_1)}{n_1} + \left( \frac{N_2}{N_1+N_2} \right)^2 \frac{\widehat{p}_2(1-\widehat{p}_2)}{n_2}}}$ |