KDL BLOG

不偏分散の謎に迫る(1)〜分散を理解し、不偏分散の存在を知る〜

株式会社神戸デジタル・ラボ DataIntelligenceチームの高木です。

今回から全3回にわたって統計学の基本でありながら、多くの初学者の頭を悩ませる内容である不偏分散の謎を解きほぐしていきます。

「不偏分散って何?」って方や、「分散さえそもそも怪しい…」という方も、是非ともに統計の世界に一歩踏みだしましょう!

本シリーズの全3記事は以下の通りです。

そもそも分散って何?

数値で表されるデータの特徴を掴むために、よく利用される指標として「平均」と「分散」の2つが挙げられます(今回扱う平均は全て算術平均を想定しています)。

平均は日常生活でも馴染みがある方が多い一方、分散はあまり利用されたことのない方も多いのではないでしょうか。

数値データの全体像を把握するためには、私は「データの代表値を知り、ばらつきを知ること」が必要であると考えています。ここにおける代表値とばらつきには、平均と分散の二つの値が対応しており、どちらもとても重要です。

この章では、具体例を通して平均と分散の概要を解説していきます。

(つづきは、ブログ「神戸のデータ活用塾!KDL Data Blog」へ)

hatena.png