正規分布に従うデータから出現確率を計算する:累積分布関数

エクセルで正規分布を活用!出現確率の計算方法をマスターしよう:累積分布関数

今回は、Excelを活用して正規分布に従うデータからの出現確率【累積分布関数】を計算する方法を解説していきます。

正規分布とは何か?

正規分布は、統計学で最もよく使われる確率分布の一つです。形状は、中央が高く両端に行くほど低くなる「ベルカーブ」や「ガウス曲線」などと呼ばれる曲線です。自然現象や社会現象の多くがこの分布に従うと言われ、例えば人間の身長や試験のスコアなどがその一例です。

Excelで正規分布の確率を計算する

Excelには「NORM.DIST」という関数があり、これを使用することで正規分布の確率を計算することができます。

計算式は以下の通りです:

=NORM.DIST(ポイント, 平均, 標準偏差, TRUE)

各パラメータの意味は以下の通りです:

  • ポイント:確率を求めたい値
  • 平均:正規分布の平均
  • 標準偏差:正規分布の標準偏差
  • TRUE累積分布関数を求めるための引数(”ポイント”以下の出現確率を求めるために使用)

具体例で見てみよう

さて、ここで具体例を用いて見てみましょう。ある大規模グループ(例えば○○県の中学1年生)の学生の身長を測定したとき、その平均値が160cm、標準偏差が5cmだったとします。ここで、「このグループで学生の身長が155cm以下である確率は何%か?」と知りたいとき、ExcelのNORM.DIST関数を使って計算することができます。

=NORM.DIST(155, 160, 5, TRUE)

この計算式を実行すると、「このグループにおける155cm以下である学生の確率」が求められます(この標本では約15.87%のようです)。

計算式の意味 1

この計算式は、正規分布の確率を計算しています。具体的には、「ポイント」が平均値から何標準偏差離れているのかを計算し、その位置までの正規分布の面積(確率)を求めます。

つまり、「155cm」が平均値「160cm」から何標準偏差離れているのかを調べ、155cm以下の身長を持つ学生が全体の何パーセント存在するかを求める、という計算を行っているのです。

一部の範囲の出現確率を計算する

ここまで見てきた方法は、「ポイント」以下の出現確率を計算するものでした。しかし、特定の範囲内、例えば「153cm以上、155cm以下」のような範囲の出現確率を知りたい場合はどうすればいいでしょうか?

これは、「153cm以下の確率」から「155cm以下の確率」を引くことで計算できます。つまり、以下の2つの式を用います:

=NORM.DIST(155, 160, 5, TRUE) - NORM.DIST(153, 160, 5, TRUE)

この計算式により、「153cm以上155cm以下」の学生の出現確率を求めることができます(約7.79%
)。

計算式の意味 2

ここでは、「155cm以下の出現確率」から「153cm以下の出現確率」を引いています。これにより、「153cm以上、155cm以下」という特定の範囲内の出現確率を得ることができます。

つまり、求めたい範囲の上限と下限の出現確率を個別に計算し、その差を取ることで、指定した範囲内の出現確率を計算しているのです。

まとめ

今回は、Excelを用いて正規分布から確率を計算する方法について解説しました。Excelは、単なる表計算ソフトではなく、統計学の知識を活用してデータ分析を行う強力なツールであることを理解して頂けたと思います。

コメント