検定 — 仮説検定の考え方と過誤
仮説検定は、「データが、ある主張を否定するのに十分な証拠を示しているか」を確率的に判断する枠組みです。数量的な意思決定を、あらかじめ決めた基準に従って下せるようにします。
帰無仮説と対立仮説 ★★
検定では2つの仮説を立てます。
- 帰無仮説(H₀): 「差がない」「母平均はある値に等しい」といった、否定したい基準となる主張。
- 対立仮説(H₁): 本当に示したい主張。「差がある」「ある値より大きい」など。
考え方は背理法に似ています。まず H₀ が正しいと仮定し、その仮定のもとでは起こりにくいデータが観測されたなら「H₀ は考えにくい」として棄却します。
有意水準とp値 ★★
- 有意水準 α: 「本当は正しい H₀ を、誤って棄却してしまう」リスクの上限。検定を行う人があらかじめ決めます(例:5%)。
- p値: H₀ が正しいと仮定したとき、観測された結果と同じか、それ以上に極端な結果が得られる確率。
判断は単純で、p値 < α なら H₀ を棄却し、そうでなければ棄却しません。p値が小さいほど「H₀ のもとでは珍しいことが起きた」ことを意味します。
2種類の過誤 ★★★
検定の判断には2種類の誤りがあります。
- 第一種の過誤(α): 正しい H₀ を誤って棄却する誤り。有意水準そのもので、ユーザーが制御できます。
- 第二種の過誤(β): 誤っている H₀ を棄却できない誤り。β はユーザーが自由に選べず、真の差の大きさに依存します。差が大きいほど検出しやすく β は小さくなります。
「H₀ が偽のときに正しく棄却できる確率」1 − β を検出力と呼びます。α を小さくしすぎると β が増える(検出力が下がる)ため、両者はトレードオフの関係にあります。
検定の手順 ★★
- 帰無仮説 H₀ と対立仮説 H₁ を立てる(片側か両側かを決める)。
- 有意水準 α を決める。
- データから検定統計量を計算する。
- p値(または臨界値)と比較する。
- p値 < α なら H₀ を棄却し、H₁ を採択する。
まとめ
- H₀ を仮定して「起こりにくさ」を評価し、p値 < α で棄却する。
- α(第一種の過誤)は自分で決め、β(第二種の過誤)は真の差に依存する。
- 検出力 1 − β を上げるには標本サイズを増やすのが基本。
確認問題
問1. 第一種の過誤の説明として正しいものはどれか。
- 誤っている帰無仮説を棄却できない誤り
- 正しい帰無仮説を誤って棄却する誤り
- 対立仮説を誤って棄却する誤り
- p値を計算し忘れる誤り
正解: 2 解説: 第一種の過誤は「真の H₀ を棄却する」誤りで、その上限が有意水準 α です。1は第二種の過誤(β)の説明です。
問2. p値と有意水準の関係について正しいものはどれか。
- p値が有意水準より大きいとき帰無仮説を棄却する
- p値が有意水準より小さいとき帰無仮説を棄却する
- p値は有意水準と無関係である
- 有意水準はデータから計算する
正解: 2 解説: p値 < α のとき H₀ を棄却します。有意水準 α は検定前に決める基準で、p値はデータから計算する「H₀ のもとでの極端さ」を表す確率です。
問3. 検出力に関する記述として正しいものはどれか。
- 検出力は 1 − α で定義される
- 検出力は第一種の過誤の確率である
- 検出力は 1 − β で、標本サイズを増やすと高まりやすい
- 検出力は常に有意水準に等しい
正解: 3 解説: 検出力は「偽の H₀ を正しく棄却できる確率」1 − β です。標本サイズを増やすと β が下がり、検出力は高まりやすくなります。
参考にした考え方の出典
帰無仮説・対立仮説・第一種/第二種の過誤・有意水準の定義は NIST/SEMATECH e-Handbook(7.1.3)に基づき、出題範囲の対応は統計検定2級の公式出題範囲を参照して自分の言葉で整理しました(末尾の参考文献を参照)。