スタージェスの公式とExcelで適切なビンの数を計算する方法

スタージェスの公式の意義とExcelで適切なビンの数を計算する方法

スタージェスの公式は、データ分析においてヒストグラムのビン(階級)の数を決定する指標の役割を果たします。この記事では、スタージェスの公式の基本と、Excelでこの公式を用いて適切なビンの数を計算する方法を解説します。

スタージェスの公式とは

スタージェスの公式は、データセットに対して適切な階級数を提供することで、ヒストグラムの作成を容易にします。公式は次のように表されます。

k = 1 + log2(N)

ここで、kは階級数、Nはデータポイントの総数、log2は2を底とする対数を表します。

データセットが大きい場合、適切な階級数を見つけることは難しくなります。スタージェスの公式は、データセットのサイズに基づいて、理論的に適切な階級数を提供します。これにより、データの分布を正確に捉えることが可能になります。

Excelでの計算方法

Excelのヒストグラム自動生成機能では、階級数を自動的に決定してくれます。しかしながら、手動でヒストグラムを生成する際には自分で決定する必要があります。決定の指標となる階級数の計算手順を紹介します。

Excelのヒストグラム作成でスタージェスの公式に基づく階級数を自分で計算するには、LOG関数を用い、以下の手順を実行します。

  1. データセットのサイズ(N)を確認する。
  2. 次の式を使用して階級数を計算する:
    =1 + LOG(N, 2)
  3. 得られた結果を必要に応じて四捨五入する。

データセットの数が150ならば8程度が標準の階級数だとされます。

まとめ

スタージェスの公式は、データ分析において非常に有用です。Excelでこの公式を使用することで、データのヒストグラムを効率的かつ適切に作成することができます。ただし、データの特性によっては公式に基づいた階級数が最適でないこともあるため、分析の目的に応じて階級数を調整することが重要です。

 

コメント

PAGE TOP
タイトルとURLをコピーしました