【統計検定2級対策】t分布とz分布の違いを、かんたんに思い出す方法

投稿日と更新日

著者

こんにちは。

昨日はChatGPTと「t分布とz分布の違い」についてじっくり話しました。理解したつもりでも、いざ思い出そうとすると「あれ、どっち使うんだっけ?」と迷いがちなこのテーマ。そんな自分のためにも、復習用としてブログ形式でまとめておきます。


🔍 まず結論:t分布とz分布の違いはここ!

分布使う場面条件特徴
z分布母集団の標準偏差が分かっているときnが大きくても小さくてもOK標準正規分布。左右対称。中心が0、分散1
t分布母集団の標準偏差が分からないときサンプルサイズが少ない(n<30)とき裾が広い。自由度によって形が変わる

🤔 そもそも何で2種類あるの?

ChatGPTの説明ではこうでした:

母集団の標準偏差(σ)がわかっているなら、z分布を使えばよい。
わかっていない場合は、標本標準偏差を使って計算する必要があり、その「不確実性」を補うためにt分布が必要になる。

つまり、t分布は「不確実な条件下で慎重に判断する」ための分布。だから裾が広くて余裕を持った構造になっている。


🧠 使い分けの判断軸(覚え方)

これを思い出せばOK:

① 母分散(σ²)が分かる? → Yes → z分布
↓ No
② サンプルサイズは30以上? → Yes → z分布で近似OK
↓ No
→ t分布を使う

📈 図のイメージで押さえると忘れない

昨日の会話では「図で覚えるとわかりやすいよね」という話も。

  • z分布:釣鐘型のキレイな左右対称(裾が短め)
  • t分布:少人数だと裾が長く、ばらつきが広い感じ(自由度が上がるほどz分布に近づく)

※t分布は“保守的に見る”ときに使うイメージ!

こちらが見やすく再描画したZ分布とt分布の比較図です:

  • 青線(Z-distribution):釣鐘型で左右対称、裾が短い=ばらつきが小さい
  • オレンジ破線(t分布, 自由度=2):裾が広く、ピークが低い=少人数の不確実性を反映
  • 緑点線(t分布, 自由度=5):少しZ分布に近づくが、まだ広い
  • 赤点線(t分布, 自由度=30):Z分布にかなり近づく=標本数が多いと正規分布とほぼ同等

💡 実務への落とし込み例

例えば:

  • アイスの売上が平日より土日に上がるかどうかを、10店舗のデータだけで判断したいとき → t分布
  • 全国1000店舗のデータで傾向を調べる → z分布でもOK

📝 昨日の会話から得た「印象的なフレーズ」

  • 「t分布は不確実性へのお守り」
  • 「z分布は、すでに道が舗装されているようなもの」
  • 「自由度が上がればt分布はz分布になる」←この考えが超重要

✅ 最後に:自分のための思い出し方

  • z → 標準偏差(σ)が分かってる安心感
  • t → σが不明+サンプルが少ないときの不安への対処

t分布とz分布の数式の違いは、「分母に何があるか」が核心です。以下に両者の定義式と違いをシンプルに示します。


Z分布(標準正規分布)の式:

Z=xˉ−μσnZ = \frac{\bar{x} – \mu}{\frac{\sigma}{\sqrt{n}}}Z=n​σ​xˉ−μ​  

  • xˉ\bar{x}xˉ:標本平均
  • μ\muμ:母平均(既知)
  • σ\sigmaσ:母標準偏差(既知)
  • nnn:標本サイズ

👉 母標準偏差 σ\sigmaσ が分母にあるため、標本数が少なくても使えるが、σ\sigmaσが分かってる前提。


t分布の式(Student’s t-distribution):

t=xˉ−μsnt = \frac{\bar{x} – \mu}{\frac{s}{\sqrt{n}}}t=n​s​xˉ−μ​

  • sss:標本標準偏差(母標準偏差が不明な場合に代用)

👉 母標準偏差が不明なときに、標本標準偏差 sss を使うため不確実性が増す。
→ これが「裾が広い=ばらつきが大きい」理由。


🔍 結論:

分布使用条件式の違い特徴
Z分布母標準偏差 σ\sigmaσ が 既知分母に σ/n\sigma/\sqrt{n}σ/n​裾が狭い、確定的
t分布母標準偏差 σ\sigmaσ が 不明分母に s/ns/\sqrt{n}s/n​裾が広い、小標本向け

次に学ぶといい話題

  • t検定の種類(対応あり・対応なし)
  • 自由度とグラフの変化
  • 二項分布と正規分布の近似関係

最新記事

コメントを残す

ATTRIP Search