Reactive Stats
EMUYN 統計シミュレーター

信頼区間シミュレーション

このシミュレーションの目的

統計学における「信頼区間」の正しい解釈を理解するためのツールです。一般的な誤解である「95%信頼区間には真の値が95%の確率で含まれる」という考えがなぜ間違っているのか、視覚的に確認できます。

よくある誤解

「95%信頼区間とは、母集団の真の平均値がその区間内に95%の確率で含まれる範囲である」

正しい解釈

「同じ母集団から何度もサンプルを抽出して95%信頼区間を計算すると、それらの区間の約95%が母集団の真の平均値を含む」

シミュレーション設定
5 200
サンプルサイズが大きいほど、推定の精度が上がり、信頼区間は狭くなります。
70% 99%
信頼水準が高いほど、より多くのシミュレーション試行で真の値を捕捉できますが、その代わりに信頼区間は広くなります。
10 100
母集団情報

真の平均値: {{ trueMean.toFixed(2) }}

標準偏差: {{ trueSD.toFixed(2) }}

分布の形状: {{ getDistributionName() }}

シミュレーション結果
真の値を含む回数
{{ coverageCount }}
真の値を含まない回数
{{ numTrials - coverageCount }}

真の値を含む割合: {{ coverageRate.toFixed(1) }}%

期待される割合: {{ confidenceLevel }}%

平均信頼区間幅: {{ averageWidth.toFixed(2) }}

{{ coverageRate.toFixed(1) }}%
信頼区間の視覚化

このグラフは、{{ numTrials }}回のサンプリングを行い、それぞれの試行で計算された信頼区間を示しています。

緑の線 真の平均値を含む信頼区間
赤の線 真の平均値を含まない信頼区間
点線 真の平均値 ({{ trueMean.toFixed(2) }})

{{ confidenceLevel }}%信頼水準では、理論上は{{ confidenceLevel }}%の信頼区間が真の平均値を含むはずです。実際には{{ coverageRate.toFixed(1) }}%の区間が真の値を含んでいます。

サンプルサイズの影響
サンプルサイズが増えると信頼区間の幅は狭くなります。これは、多くのデータがあるほど、より正確な推定ができるためです。
信頼水準の影響
信頼水準が高いほど、真の値を含む区間の割合は増えますが、その代わりに信頼区間の幅は広くなります。
シミュレーションの各設定の意味
このシミュレータでの信頼区間の計算方法
  1. サンプル統計量の計算: ランダムに抽出したサンプルから、サンプル平均(x̄)とサンプル標準偏差(s)を計算します。
  2. 標準誤差の計算: 標準誤差 SE = s ÷ √n (nはサンプルサイズ)
  3. 臨界値の決定:
    • サンプルサイズが小さい場合(n ≤ 30): t分布のパーセント点を使用 (tα/2, n-1)
    • サンプルサイズが大きい場合(n > 30): 標準正規分布のパーセント点を使用 (zα/2)
  4. 信頼区間の計算: x̄ ± (臨界値 × 標準誤差)

重要: 中心極限定理により、サンプルサイズが十分大きければ、元の母集団分布に関わらず、サンプル平均の分布は正規分布に近似します。そのため、サンプルサイズが大きい場合、母集団が正規分布でなくても信頼区間の計算は有効です。サンプルサイズが小さい場合は、t分布を使用することで、分布の不確実性を考慮しています。