KDL BLOG
2022.12.01
神戸のデータ活用塾
不偏分散の謎に迫る(2)〜不偏分散を理解する〜
株式会社神戸デジタル・ラボ DataIntelligenceチームの高木です。
前回の記事では、前提知識となる分散について解説しました。今回の記事では、このシリーズのメインである不偏分散について解説していきたいと思います。
この記事は全3記事にわたるシリーズの2記事目になります。
- 不偏分散の謎に迫る(1)〜分散を理解し、不偏分散の存在を知る〜
データのばらつきを知ることができる分散の基本を確認し、本シリーズのメインの不偏分散を理解するための前提知識を身につけます。 - 不偏分散の謎に迫る(2)〜不偏分散を理解する〜
不偏分散そのものについて理解し、分散と不偏分散の違いを踏まえた適切な使い分けができることを目指します。 - 不偏分散の謎に迫る(3)〜n-1で割る理由に迫る〜
分散と不偏分散において、一般式の違いが生まれる理由を数式を利用して解き明かします。
不偏分散を理解するためには、統計学の基本である標本と母集団の知識が必要不可欠です。早速、具体例を通して理解していきましょう!
標本と母集団
統計学には、標本と母集団という概念があります。
例として、日本国民の平均身長を求めることを考えましょう。
値を求めるには日本国民全員の身長のデータを取得する必要があります。しかし、日本国民全員の身長データを集めるなんて現実的ではありませんよね!「全国一斉身長検査」なんて聞いたことありません(笑)しかし、平均身長は求めたい…
そこで役立つのが統計学です!
統計学では、興味のある集団全体の母集団から一部を標本として抽出し、母集団の情報を推測します!
これによって、日本国民の平均身長という実際に調査するのは非現実的なような値でも算出することができます。
他の例としては、テレビの視聴率の調査や、選挙速報などがあります。特に、「選挙速報の当選確実は、全ての票を調べていないのにどうやってわかるのか?」と疑問を持つ方が多い調査ですが、実はこのような母集団と標本の関係が使われているんですね!
(つづきは、ブログ「神戸のデータ活用塾!KDL Data Blog」へ)