KDL BLOG
不偏分散の謎に迫る(3)〜n-1で割る理由に迫る〜
株式会社神戸デジタル・ラボ DataIntelligenceチームの高木です。
前回の記事では、このシリーズのメインである不偏分散について解説しました。本記事では、不偏分散を数式の観点から見ていき、「なぜn-1で割るのか?」という疑問を解決していきます。
この記事は全3記事にわたるシリーズの最終記事(3記事目)になります。
- 不偏分散の謎に迫る(1)〜分散を理解し、不偏分散の存在を知る〜
データのばらつきを知ることができる分散の基本を確認し、本シリーズのメインの不偏分散を理解するための前提知識を身につけます。 - 不偏分散の謎に迫る(2)〜不偏分散を理解する〜
不偏分散そのものについて理解し、分散と不偏分散の違いを踏まえた適切な使い分けができることを目指します。 - 不偏分散の謎に迫る(3)〜n-1で割る理由に迫る〜
分散と不偏分散において、一般式の違いが生まれる理由を数式を利用して解き明かします。
本記事では、期待値、推定量における数式的理解、標本数が1の時の期待値と分散といった前提知識について解説し、母平均と母分散の推定量について数学的に考えるという流れで進めることにします。
0章 全体概要
本シリーズのメインである不偏分散は、以下のような式で表すことができました。
シリーズの最後である今回は、「なぜn-1で割るのか?」を深く掘り下げていきます。記事の構成としては、以下の通りです。
本内容を理解するために、1章から3章までは必要な前提知識の解説を行います。具体的には、以下の通りです。
【1章】期待値
統計分野でよく利用される専門用語である期待値を、具体例を用いながら解説します。
【2章】推定量の性質
前回の記事で解説した推定量について、数学的な観点から考察します。
【3章】標本数が1の時の期待値と分散
母集団に対しての標本数が1という特殊な場合においての、期待値と分散を理解します。
前提知識を獲得した後は、メインである分散を取り扱う前に、比較的計算が簡易な平均でシミュレーションを行います。
【4章】母平均の推定量
母集団の平均の推定量として、標本平均が利用できることを数式で解き明かします。
最後にメインである分散を取り扱い、 n−1 で割る理由について迫ります。
【5章】母分散の推定量
母集団の分散の推定量は、標本分散を n−1 で割った値である理由を数式で解き明かします。
(つづきは、ブログ「神戸のデータ活用塾!KDL Data Blog」へ)