推定 — 点推定と信頼区間
推定とは、調べたい全体(母集団)の性質を、一部を取り出したデータ(標本)から推し量ることです。母集団の平均や割合といった知りたい量を母数と呼び、標本から母数を推定します。
点推定と区間推定 ★★
推定には2つのやり方があります。
- 点推定: 母数を1つの値で言い当てる方法。たとえば標本平均を使って母平均を推定します。簡潔ですが、その値がどれくらい確からしいかは分かりません。
- 区間推定: 母数が含まれると考えられる範囲を幅をもって示す方法。推定の不確実さを一緒に表現できるのが利点です。
信頼区間の意味 ★★
区間推定の結果が信頼区間です。「95%信頼区間」は、次のように解釈します。
同じ手続きで標本抽出と区間計算を何度も繰り返したとき、作られる区間のうち約95%が母数を含む。
ここでの95%は「作り方(手続き)の当たり率」を指します。よくある誤解は「母数がこの区間に95%の確率で入っている」という言い方です。母数は固定された未知の値であり、確率的に動くのは標本から作られる区間の方だ、という点に注意します。区間には両側だけでなく、上限または下限のみを与える片側信頼区間もあります。
区間の幅を決める要因 ★★
信頼区間の幅は、次の要素で変わります。
- データのばらつき: ばらつき(標準偏差)が大きいほど幅は広がる。
- 標本サイズ: データを増やすほど推定は安定し、幅は狭くなる。
- 信頼水準: 95%より99%と高くするほど、確実を求める分だけ幅は広くなる。
「区間を狭くしたい(=精度を上げたい)」場合は、まず標本サイズを増やすことが基本的な手段になります。
まとめ
- 母集団の母数を標本から推定する。点推定は1つの値、区間推定は幅で示す。
- 95%信頼区間の95%は「手続きの当たり率」で、母数が動くわけではない。
- 幅はばらつき・標本サイズ・信頼水準で決まり、標本を増やすと狭くなる。
確認問題
問1. 95%信頼区間の解釈として最も適切なものはどれか。
- 母数がこの区間に入る確率がちょうど95%である
- 同じ手続きを繰り返すと、作られる区間の約95%が母数を含む
- 標本の95%がこの区間に入る
- 母数の95%がこの区間に入る
正解: 2 解説: 信頼水準95%は「区間の作り方の当たり率」を表します。母数は固定された未知の値で、確率的に変動するのは標本から作られる区間です。
問2. 信頼区間の幅を狭くする(精度を上げる)方法として適切なものはどれか。
- 標本サイズを増やす
- 信頼水準を95%から99%に上げる
- データのばらつきを大きくする
- 点推定に切り替える
正解: 1 解説: 標本サイズを増やすと推定が安定し区間は狭くなります。信頼水準を上げると幅は広がり、ばらつきが大きいほど幅も広がります。
問3. 点推定と区間推定に関する記述として正しいものはどれか。
- 点推定は推定の不確実さを幅で表す
- 区間推定は母数を必ず1点で言い当てる
- 区間推定は推定の不確実さを範囲として表現できる
- 点推定は区間推定より常に正確である
正解: 3 解説: 区間推定は母数が含まれると考えられる範囲を示し、不確実さを表現できます。点推定は1つの値で示すため、その確からしさは単独では分かりません。
参考にした考え方の出典
信頼区間の定義は NIST/SEMATECH e-Handbook(7.1.4)に基づき、出題範囲の対応は統計検定2級の公式出題範囲を参照して自分の言葉で整理しました(末尾の参考文献を参照)。