標準偏差と標準誤差 - a brilliant donut

・標準偏差はデータの平均値からのバラツキを示す

・標準誤差はデータの平均値自体のバラツキを示す

なかなか、理解できなかったので改めて確認してみました。

標準偏差（SD；standard deviation）

標準誤差（SE；standard error）

これだけみると、両者は似ている気がしてしまいますが、実は結構違いました（自分的には）。

式をみるとその違いがわかります。

f:id:abrilliantdonut:20171018224639p:plain

標準偏差（上のδ）

標準誤差（下のSE）

*nはデータの総数、μはデータの平均値、Xiはi番目のデータ

つまり「標準誤差は標準偏差をデータ総数の平方根で割ったもの」なのです。

この先の式は割愛しますが、結局何を示しているかというと

標準偏差はデータの平均値からのばらつき

標準誤差はデータの平均値と母集団の平均値の差異（≒データの平均値自体のばらつき）

であり、

標準偏差は平均値±2SDだと「データの95%が平均値±2SDに入る」

標準誤差は平均値±2SE だと「データの平均値が95%で平均値±2SEに入る」

ということになります。

具体例を示します。

「総数100人から10人選び、体重を測定した。10人の体重の平均値が50kg、

標準偏差(SD)が6.2、標準誤差(SE)が1.97だった」

f:id:abrilliantdonut:20171018235236p:plain

この場合、

10人の体重の平均値は50kg

10人の各々の体重は95％の確率で、37.6kgから62.4kgの間にある

100人の母集団の体重の平均値は95%の確率で、46.1kgから53.94kgの間にある

≒100人からどんな10人選ぼうと10人の体重の平均値は95%の確率で、46.1kg

から53.94kgの間にある

ということになります。

*平均値-2SD=37.6、平均値+2SD=62.4、平均値-2SE=46.1、平均値+2SE=53.94

図にするとこのようなイメージでしょうか。

f:id:abrilliantdonut:20171018222659p:plain