データサイエンス 統計学

【超初心者向け】仮説検定について分かりやすく解説

    ※当ブログでは、運営者sohe自身がかってよかったモノや、読者の皆さんに紹介したいモノなどに一部広告リンクを使用しています。

「仮説検定って何?」「統計を知らない初心者にも分かりやすく教えてほしい」

本記事はこういった悩むを持つあなたに向けて書いています。統計学をこれから学ぶ初心者の人にも分かりやすくまとめていますので安心してお読みください。

本記事を読めば次のことが分かります。

本記事まとめ

  • 仮説検定とは
  • 帰無仮説と対立仮説について
  • 有意水準について

それでは上記について詳しく解説していきます。

仮説検定とは

仮説検定(hypothesis testing)とは、確率をもとに仮説に関する結論を出す検定のことを言います。

簡単にいうと「ある出来事の想定に対して、仮説によってその想定が矛盾するのかどうかを調べること」をします。

ここで理解するのはとても難しいので、具体例を交えながら仮説検定の流れに沿って解説していきます。

大まかな流れは次の通りです。

  • 1. 帰無仮説と対立仮説を決める
  • 2. 有意水準を決める
  • 3. 帰無仮説が起こる確率と有意水準を比較
  • 4. 有意水準を下回れば、対立仮説を採用。上回れば帰無仮説を採用。

それでは上記について詳しく解説していきます。

帰無仮説と対立仮説について

例えば、50%の確率で表が出るコインを5回投げたとして、5回とも表が出たとします。

この時、投げたコインが本当に50%の確率で表が出るのでしょうか?

これを確立的に検証するのが仮説検定です。

仮説検定では、帰無仮説と対立仮説を用いて仮説の結論を導き出します。

帰無仮説は否定したい仮説のことを指し、一般的に関係性や差がないことを表す仮説がよく使われます。

さきほどのコイン仮設の例だと、「裏表の出る確率に差がないコイン」つまり「コインの表が出る確率は50%である。」が帰無仮説となります。

対立仮設は、帰無仮説が成り立たない時に成たたせる代わりの仮説のことです。

コイントスの場合、「投げたコインはイカサマ用のコイン」つまり「コインの表が出る確率が50%ではない」が対立仮設になります。

そして、仮説検定で帰無仮説と対立仮説を用いて仮説の結論を導き出す際に使用するのが有意水準です。

次からは有意水準について解説していきます。

有意水準について

有意水準は帰無仮説を棄却する確率の基準値を定めたもので、この基準値を下回っていると棄却できます。

コイントスを例に有意水準を5%と1%でそれぞれ設定した時を考えていきます。

コイントスの有意水準を5%にした場合

コイントスの有意水準を5%にした場合

コインが5回連続で表になる確率は1/2の5乗で3.125%となります。

この時、3.125%は5%を下回っているので、帰無仮説を棄却することができます。

帰無仮説の代わりに対立仮設である、「コインの表が出る確率は50%でない」を採用します。

コイントスの有意水準を1%にした場合

コイントスの有意水準を1%にした場合

コインが5回連続で表になる確率は1/2の5乗で3.125%となります。

この時、3.125%は5%を上回っているので、帰無仮説を棄却しないようになります。

このため、帰無仮説を採用し、「コインの表が出る確率は50%である」と言えます。

しかしこの結論は、対立仮設が正しいと言い切れないということを指している点で注意が必要です。

有意水準を下回ると帰無仮説を棄却できる理由

有意水準を下回っていると帰無仮説を棄却できるかというのは、有意水準を偶然受け入れる基準となる確率と考えると理解しやすくなります。

50%の確率で表が出るコインを5回投げ5回とも表である確率は3.125%でしたが、この偶然を判断する基準が有意水準です。

有意水準が5%のとき、偶然ではないと判断されて帰無仮説棄却し、コインに何らかの細工があると考えます。

一方で、有意水準が1%のとき、偶然であると判断されて帰無仮説を採用し、普通のコインと考えます。

検定の過誤について

仮説検定の結果について、2種類の誤りを引き起こすことがあります。

そして、この2種類の誤りを第1種過誤・第2種過誤と言います。

第1種過誤は、本来は帰無仮説が正しいのに誤って帰無仮説を棄却してしまうことを指します。

コイントスの場合、コインは普通なのにイカサマだと判断してしまうような状態を言います。

第2種過誤は本来は対立仮設が正しいのに誤って帰無仮説を採用することを指します。

コイントスの場合、コインはイカサマにも関わらず、普通のコインと判断してしまうような状態を言います。

まとめ

いかがでしたでしょうか。

本記事では統計学を初めて学ぶ初心者のために仮説検定について解説しました。

本記事をまとめると次の通りです。

本記事まとめ

  • 仮説検定とは
  • 帰無仮説と対立仮説について
  • 有意水準について

仮説検定の大まかなながれは次の通りです。

  • 1. 帰無仮説と対立仮説を決める
  • 2. 有意水準を決める
  • 3. 帰無仮説が起こる確率と有意水準を比較
  • 4. 有意水準を下回れば、対立仮説を採用。上回れば帰無仮説を採用。

本ブログでは統計学に関する別の記事も書いていますので、是非、参考にしてみてください。

-データサイエンス, 統計学