ブログ

医療従事者のための基礎統計学part.4【p値・有意水準・有意差】


前回はこちら

医療従事者のための医学統計学基礎part.3【度数分布表・ヒストグラム・確率分布・正規分布】ここでは、度数分布表、ヒストグラム、確率分布、正規分布を解説します。 標準偏差を理解していないと分からない内容なので、まだ標準偏差を理...

 

p値という言葉を聞いたことはあるでしょうか?

「ぴーち」と呼びます🍑

医学論文を読むとよくこの「p値」が出てきます。

p値は重要度がかなり高い言葉で、統計を見る上ではかかせません。

この概念も中々厄介です。

しかもp値を学ぼうとすると帰無仮説やら棄却やら対立仮説やらと難しい言葉の羅列でさらにこんがらがります。

まずはもっと簡単に理解すれば良いと私は思います。

今回は統計学基礎part.4としてp値、有意差、有意水準をざっくりみていきます。

 

p値と有意水準、有意差

統計を取った時に、それが偶然か否かは重要なことです。

p値はこの、偶然、たまたまを検出するのに使われます。

例えば、「ストレッチ」と「ストレッチのフリ(シャム)」で効果を比べて、ストレッチの方が効果があれば、ストレッチに効果ありと分かりますが、このストレッチとストレッチのフリの効果の違いは、偶然起こったのかどうかを確かめなければなりません。

偶然効果が高く出たのたらストレッチに効果があるとはいえないですよね。

ここで2つ仮説を立てます。

ストレッチとストレッチのフリには効果に

  • 差がない
  • 差がある(証明したいこと)

それで、「差がない」確率が低いのなら「差がある」と言えますよね。

このような回りくどいようなことをしていくので、統計は難しいです。

それでp値というのは、ここでいう「差がない」という仮説と実際の実験結果がどれだけ不一致かを表しています。

つまりp値が低いほど、「差がない」といえないので、「差がある」可能性が高いと言えるのです。

それで、じゃあどれだけp値が低ければ良いの?となりますよね。

  • 0.1
  • 0.05
  • 0.01

これを統計を取る前に予め決めておきます。

この基準を有意水準といいます。

有意水準はαで表されます。

大抵は0.05、つまりp値がα=0.05より低ければ、効果あり(有意差あり)とされます。

実は0.05にする決まりはなく、数値が小さければ問題はないのですが、習慣的に0.050.01にされます。

その名の通り有意水準は有意であるための水準です。

因みに論文の中ではわかりやすいように有意差がある数値には*がついていることが多いです。

このp0.05を別の言い方で表現するのなら、

「この結果(差がない)を再現できる確率は5%未満」、つまり「差がない」となるのは5%未満であるのだから「差がある」可能性があるとなるのです。

こうしてみるとp0.05の問題点も分かると思います。

「差がない」が5%未満の確率ということは20回やったら19回は「差がある」、1回は「差がない」になるのです。

だから0.05を基準にするのは確実性が高いとはいいきれないですよね。

有意差があるとはいっても信頼しきれない理由はこれによります。

そのため有意水準を0.05ではなく、0.01に設定する人もいます。

もう一つ、有意差だけで判断してはならない理由があります。

研究のサンプル数が少ないほど、有意差は出にくく、サンプル数が多いほど有意差は出やすくなります。

つまりサンプル数が多いと臨床で使えないレベルの差でも有意差ありとなってしまうのです。

そのため有意差があるかどうかの情報では臨床に使うことはできません。

大雑把にp値、有意水準、有意差の関係をまとめると、

p値が有意水準未満なら有意差ありと判断します。

 

補足:帰無仮説と対立仮説

 

最初に帰無仮説と対立仮説という名前を出しました。

実は帰無仮説と対立仮説はすでに上記しています。

ここでいうと

「差がない」は帰無仮説で「差がある」が対立仮説です。

対立仮説の方が証明したいことで、帰無仮説はその反対です。

ここでは証明したいことの逆である帰無仮説を否定する(棄却)することで対立仮説の正当性を確かめています。