DS Learning Hub

検定 — 仮説検定の考え方と過誤

実践応用
更新日: 2026-07-05

仮説検定は、「データが、ある主張を否定するのに十分な証拠を示しているか」を確率的に判断する枠組みです。数量的な意思決定を、あらかじめ決めた基準に従って下せるようにします。

帰無仮説と対立仮説 ★★

検定では2つの仮説を立てます。

  • 帰無仮説(H₀): 「差がない」「母平均はある値に等しい」といった、否定したい基準となる主張。
  • 対立仮説(H₁): 本当に示したい主張。「差がある」「ある値より大きい」など。

考え方は背理法に似ています。まず H₀ が正しいと仮定し、その仮定のもとでは起こりにくいデータが観測されたなら「H₀ は考えにくい」として棄却します。

有意水準とp値 ★★

  • 有意水準 α: 「本当は正しい H₀ を、誤って棄却してしまう」リスクの上限。検定を行う人があらかじめ決めます(例:5%)。
  • p値: H₀ が正しいと仮定したとき、観測された結果と同じか、それ以上に極端な結果が得られる確率。

判断は単純で、p値 < α なら H₀ を棄却し、そうでなければ棄却しません。p値が小さいほど「H₀ のもとでは珍しいことが起きた」ことを意味します。

2種類の過誤 ★★★

検定の判断には2種類の誤りがあります。

  • 第一種の過誤(α): 正しい H₀ を誤って棄却する誤り。有意水準そのもので、ユーザーが制御できます。
  • 第二種の過誤(β): 誤っている H₀ を棄却できない誤り。β はユーザーが自由に選べず、真の差の大きさに依存します。差が大きいほど検出しやすく β は小さくなります。

「H₀ が偽のときに正しく棄却できる確率」1 − β を検出力と呼びます。α を小さくしすぎると β が増える(検出力が下がる)ため、両者はトレードオフの関係にあります。

検定の手順 ★★

  1. 帰無仮説 H₀ と対立仮説 H₁ を立てる(片側か両側かを決める)。
  2. 有意水準 α を決める。
  3. データから検定統計量を計算する。
  4. p値(または臨界値)と比較する。
  5. p値 < α なら H₀ を棄却し、H₁ を採択する。

まとめ

  • H₀ を仮定して「起こりにくさ」を評価し、p値 < α で棄却する。
  • α(第一種の過誤)は自分で決め、β(第二種の過誤)は真の差に依存する。
  • 検出力 1 − β を上げるには標本サイズを増やすのが基本。

確認問題

問1. 第一種の過誤の説明として正しいものはどれか。

  1. 誤っている帰無仮説を棄却できない誤り
  2. 正しい帰無仮説を誤って棄却する誤り
  3. 対立仮説を誤って棄却する誤り
  4. p値を計算し忘れる誤り

正解: 2 解説: 第一種の過誤は「真の H₀ を棄却する」誤りで、その上限が有意水準 α です。1は第二種の過誤(β)の説明です。

問2. p値と有意水準の関係について正しいものはどれか。

  1. p値が有意水準より大きいとき帰無仮説を棄却する
  2. p値が有意水準より小さいとき帰無仮説を棄却する
  3. p値は有意水準と無関係である
  4. 有意水準はデータから計算する

正解: 2 解説: p値 < α のとき H₀ を棄却します。有意水準 α は検定前に決める基準で、p値はデータから計算する「H₀ のもとでの極端さ」を表す確率です。

問3. 検出力に関する記述として正しいものはどれか。

  1. 検出力は 1 − α で定義される
  2. 検出力は第一種の過誤の確率である
  3. 検出力は 1 − β で、標本サイズを増やすと高まりやすい
  4. 検出力は常に有意水準に等しい

正解: 3 解説: 検出力は「偽の H₀ を正しく棄却できる確率」1 − β です。標本サイズを増やすと β が下がり、検出力は高まりやすくなります。

参考にした考え方の出典

帰無仮説・対立仮説・第一種/第二種の過誤・有意水準の定義は NIST/SEMATECH e-Handbook(7.1.3)に基づき、出題範囲の対応は統計検定2級の公式出題範囲を参照して自分の言葉で整理しました(末尾の参考文献を参照)。

参考文献

  1. NIST/SEMATECH e-Handbook of Statistical Methods 7.1.3 What are statistical tests?一次情報itl.nist.gov2026-07-05 取得
  2. 統計検定 2級 出題範囲(一般財団法人 統計質保証推進協会)一次情報toukei-kentei.jp2026-07-05 取得