標準偏差と標準誤差
・標準偏差はデータの平均値からのバラツキを示す
・標準誤差はデータの平均値自体のバラツキを示す
なかなか、理解できなかったので改めて確認してみました。
標準偏差(SD;standard deviation)
標準誤差(SE;standard error)
これだけみると、両者は似ている気がしてしまいますが、実は結構違いました(自分的には)。
式をみるとその違いがわかります。
標準偏差(上のδ)
標準誤差(下のSE)
*nはデータの総数、μはデータの平均値、Xiはi番目のデータ
つまり「標準誤差は標準偏差をデータ総数の平方根で割ったもの」なのです。
この先の式は割愛しますが、結局何を示しているかというと
標準偏差はデータの平均値からのばらつき
標準誤差はデータの平均値と母集団の平均値の差異(≒データの平均値自体のばらつき)
であり、
標準偏差は平均値±2SDだと「データの95%が平均値±2SDに入る」
標準誤差は平均値±2SE だと「データの平均値が95%で平均値±2SEに入る」
ということになります。
具体例を示します。
「総数100人から10人選び、体重を測定した。10人の体重の平均値が50kg、
標準偏差(SD)が6.2、標準誤差(SE)が1.97だった」
この場合、
10人の体重の平均値は50kg
10人の各々の体重は95%の確率で、37.6kgから62.4kgの間にある
100人の母集団の体重の平均値は95%の確率で、46.1kgから53.94kgの間にある
≒100人からどんな10人選ぼうと10人の体重の平均値は95%の確率で、46.1kg
から53.94kgの間にある
ということになります。
*平均値-2SD=37.6、平均値+2SD=62.4、平均値-2SE=46.1、平均値+2SE=53.94
図にするとこのようなイメージでしょうか。