a brilliant donut

医療を中心とした、話題を。いつか、どこかで、誰かの役にたてば幸いです。

標準偏差と標準誤差

標準偏差はデータの平均値からのバラツキを示す

・標準誤差はデータの平均値自体のバラツキを示す

 

なかなか、理解できなかったので改めて確認してみました。 

 

標準偏差(SD;standard deviation)

標準誤差(SE;standard error)

 

これだけみると、両者は似ている気がしてしまいますが、実は結構違いました(自分的には)。

 

式をみるとその違いがわかります。

 

f:id:abrilliantdonut:20171018224639p:plain

標準偏差(上のδ)

標準誤差(下のSE)

*nはデータの総数、μはデータの平均値、Xiはi番目のデータ

 

つまり「標準誤差は標準偏差をデータ総数の平方根で割ったもの」なのです。

 

この先の式は割愛しますが、結局何を示しているかというと

 

標準偏差はデータの平均値からのばらつき

標準誤差はデータの平均値と母集団の平均値の差異(≒データの平均値自体のばらつき)

 

 であり、

 

標準偏差は平均値±2SDだと「データの95%が平均値±2SDに入る」

標準誤差は平均値±2SE だと「データの平均値が95%で平均値±2SEに入る」

 

ということになります。

 

具体例を示します。

「総数100人から10人選び、体重を測定した。10人の体重の平均値が50kg、

標準偏差(SD)が6.2、標準誤差(SE)が1.97だった」

 

f:id:abrilliantdonut:20171018235236p:plain

 

この場合、

 

10人の体重の平均値は50kg

10人の各々の体重は95%の確率で、37.6kgから62.4kgの間にある

100人の母集団の体重の平均値は95%の確率で、46.1kgから53.94kgの間にある

≒100人からどんな10人選ぼうと10人の体重の平均値は95%の確率で、46.1kg

から53.94kgの間にある

 

ということになります。

*平均値-2SD=37.6、平均値+2SD=62.4、平均値-2SE=46.1、平均値+2SE=53.94

 

図にするとこのようなイメージでしょうか。

 

 

f:id:abrilliantdonut:20171018222659p:plain