統計学における「信頼区間」の正しい解釈を理解するためのツールです。一般的な誤解である「95%信頼区間には真の値が95%の確率で含まれる」という考えがなぜ間違っているのか、視覚的に確認できます。
「95%信頼区間とは、母集団の真の平均値がその区間内に95%の確率で含まれる範囲である」
「同じ母集団から何度もサンプルを抽出して95%信頼区間を計算すると、それらの区間の約95%が母集団の真の平均値を含む」
真の平均値: {{ trueMean.toFixed(2) }}
標準偏差: {{ trueSD.toFixed(2) }}
分布の形状: {{ getDistributionName() }}
真の値を含む割合: {{ coverageRate.toFixed(1) }}%
期待される割合: {{ confidenceLevel }}%
平均信頼区間幅: {{ averageWidth.toFixed(2) }}
このグラフは、{{ numTrials }}回のサンプリングを行い、それぞれの試行で計算された信頼区間を示しています。
緑の線
真の平均値を含む信頼区間
赤の線
真の平均値を含まない信頼区間
点線 真の平均値 ({{
trueMean.toFixed(2) }})
{{ confidenceLevel }}%信頼水準では、理論上は{{ confidenceLevel }}%の信頼区間が真の平均値を含むはずです。実際には{{ coverageRate.toFixed(1) }}%の区間が真の値を含んでいます。
重要: 中心極限定理により、サンプルサイズが十分大きければ、元の母集団分布に関わらず、サンプル平均の分布は正規分布に近似します。そのため、サンプルサイズが大きい場合、母集団が正規分布でなくても信頼区間の計算は有効です。サンプルサイズが小さい場合は、t分布を使用することで、分布の不確実性を考慮しています。