統計学の分散と標準偏差を図でわかりやすく解説

統計学の分散と標準偏差を図でわかりやすく解説

こんばんは。早速ですが、何かを分析し、改善策を検討する際、第一歩として正確なデータの読み取りによる現状把握は非常に重要なことです。統計の指標が「どういう考え方で、そのような意味になるのか」を詳細に理解せず、計算式と意味だけを丸覚えしていませんか?今日は、タイトルの通り、統計による分析でよく使われる『分散と『標準偏差について、わかりやすく解説します。

 

目次

1.偏差と分散について、図でわかりやすく解説

2.標準偏差について

 

統計学の分散と標準偏差を図でわかりやすく解説

1.偏差と分散について、図でわかりやすく解説

まずは、ややこしい言葉で説明すると、分散は『平均からの偏差の二乗を平均した値です。

偏差とは、各値から平均値を引いたものです。

言葉では分かりづらいため、後でイメージ図を用いながら説明していきます。

 

例として、A氏~J氏までの10人の国語の点数が以下の通りだとします。

A氏の場合、10点から平均点55点を差し引いた―45点が偏差となります。

つまり、平均点に比べ45点低いということです。

 

偏差と分散について、図でわかりやすく解説

 

偏差を図で表すと以下のようになります。

オレンジ色の線が平均点で、一部しか記載していませんが、緑の乖離部分が偏差です。

 

統計学の分散と標準偏差を図でわかりやすく解説

 

これを二乗するということは以下の図のようになります。

偏差を二乗するということは、正方形を作図し、その面積を求めることと同義です。

そして、分散は作成したすべての正方形の面積の平均であるということです。

 

統計学の分散と標準偏差を図でわかりやすく解説

 

※ちなみに二乗する理由は、バラツキとは上振れと下振れの両方を含む概念であり、二乗しない場合、偏差の平均を求める際に足し合わせた時、プラスとマイナスが相殺されて、データに一見バラツキがないように計算されてしまうからです。二乗をすることで、下振れのバラツキもプラスの数値に置き換えることができ、プラスとマイナスでバラツキが相殺されてしまうことを防ぎます。

 

2.標準偏差について

さて、単位が『点』である偏差を二乗したものの平均であるため、分散の単位は『点の二乗』となります。

しかし、「10人の点数のデータは平均的に825(点の二乗)バラツキがあります。」といわれてもなんのこっちゃわかりません。

そのため、標準偏差というものに変換します。

分散の単位である『点の二乗』を『点』に直すには、平方根をとればよいため、以下の式で求められます。

$$標準偏差=\sqrt{分散}$$

言い換えると以下の式です。

$$標準偏差=分散^\frac{1}{2}$$

この10人の点数のデータの標準偏差は、28.72点です。

そして「10人の点数のデータは平均的に28.72点のバラツキがあります」。

これなら、わかりやすいですね。

 

いかがでしたでしょうか。

2つのデータがあって、各値が違えば、その2つのデータの平均点が同じ55点でも、標準偏差は異なる可能性があります。

又、ただ単に分散や標準偏差という言葉とその計算式を覚えただけでは、分析には使えません。

その意味をきちんと理解して使うことが重要です。

 

さて、引き続き統計学の解説として、以下の記事では、共分散について取り上げています。

是非、読んで見て下さい。

共分散を図でわかりやすく解説【視覚で学ぶ統計学】

 

『本日の気づき』

・偏差とは、『平均値から各値を引いたもの』

・分散とは、『平均からの偏差の二乗を平均した値』

・分散は単位がわかりづらいため、標準偏差に置き換える

 

 


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です