ブログ

検査における感度・特異度とは?


先日ツイッターで感度・特異度がどれだけ理解されているか聞いたところ

  • 46%が知らない
  • 40%が何となく知っている
  • 8%が説明できる
  • 7%が臨床応用している

という結果でした。これはツイッターでの調査なのでそこまで当てになる数値ではありませんが、少なくともこのアンケートでは感度・特異度を臨床に用いている人の割合が7%という結果で、日本中の医療従事者にアンケートをとればもう少し変動した数値になるとは思いますが、それでもほとんどの医療従事者が感度・特異度が使えないということが予想できます。

ここでは感度・特異度とは何かについて説明していきます。

まず大雑把に言っておくと感度・特異度は「ある検査がどれだけ信頼できるかの1つの指標」です。つまり感度・特異度を知らずに検査するということは自信の行っている検査がどれだけ信頼できるものか知らずに行っていることになります。

これは明らかに誤った鑑別を誘発します
だから医療従事者にとって、検査の感度・特異度は必須の知識であるにもかかわらず、医療系の学校では感度・特異度を習わないケースがあります。

具体的な感度特異度のまとめは↓です。

スペシャルテストの感度・特異度まとめ感度・特異度という言葉自体医療従事者の中ではまだメジャーとなっていない可能性があります。 ここでは各スペシャルテストの感度...

感度・特異度とは

感度・特異度というのは先ほど説明したように「ある検査がどれだけ信頼できるかの1つの指標」です。1つの指標ということはこれ以外にも指標は存在します。
それでも感度特異度は指標の中で最も一般的に用いられ、そして指標の中でもシンプルで理解しやすいものです。

なぜこの感度・特異度という概念が必要かといえば、すべての検査法は確実ではないからです。
例えば神経根症の検査法には「スパーリングテスト」というものがありますが、このスパーリングテストで陽性だったとしても、必ずしも神経根症とは限りません。反対にスパーリングテストで陰性だったとしても神経根症でないとは限りません。

そうなってきたときに、ではこの陽性/陰性はどのくらい信用できるだろうとする指標が感度・特異度です。
検査をして陽性でも、まったく信頼できない検査だったら意味ないですよね。
しかし臨床においてこの感度・特異度は無視されているケースが多くあります。
ちなみに

  • 実際に罹患しているときに、陽性と出ることを「真陽性」
  • 罹患していないのに、陽性と出ることを「偽陽性」
  • 罹患していない時に、陰性と出ることを「真陰性」
  • 罹患しているのに、陰性と出ることを「偽陽性」

といいます。これを踏まえたうえで感度・特異度を見ていきます。

感度とは

感度は真陽性率とも呼ばれ「罹患している疾患を正しく陽性と判定できる確率」です。

感度は陽性と検査された人を罹患している人全員で割ることで導きだすことができます。
例えば
ある集団にスパーリングテストをするとして、神経根症が陽性と出た人が10人、でも実際は20人が神経根症だったとします。
その場合10÷20=0.5です。百分率にすれば、50%です。
この時感度は50%となります。実際スパーリングテスト自体の感度は30-60パーセント程度で、あまり感度が高い検査ではありません。

感度が高い検査は疾患の除外に使えます(ドクターでいう除外診断)。
これが割と理解しにくいかと思います。
感度が「罹患している疾患を正しく陽性と判定できる確率」というのは、「罹患している人を正しく陽性とする」だけで、「罹患していない人を正しく陰性とする」わけではないので、感度が高いとしても、陰性の人が間違って陽性と判断される可能性は十分あります。
そのため感度が高い検査で陽性とでても罹患しているかはわからないのです。
簡単に言えば感度が高い検査は「罹患していてもしていなくても陽性とでる」のです。

反対に感度が高い検査、つまり「罹患している疾患を正しく陽性と判定できる」検査で陰性だった場合は正しく、その疾患に罹患していない可能性が高いので除外診断として使えるのです。

特異度とは

特異度は感度の陰性バージョンです。
真陰性率とも呼ばれ、「罹患していない疾患を正しく陰性と判定できる確率」が特異度です。
特異度は陰性と検査された人を罹患していない人全員で割ることで導きだすことができます。
例えば
ある集団にスパーリングテストをするとして、神経根症が陰性と出た人が10人、でも実際は20人が神経根症ではないとします。
その場合10÷20=0.5です。百分率にすれば、50%です。
この時特異度は50%となります。実際スパーリングテスト自体の感度は92-100パーセントで、特異度の高い検査といえます。
特異度が高い検査は疾患の確定に使えます(ドクターでいう確定診断)。
これも感度同様、割と理解しにくいかと思います。
特異度は、疾患に罹患していない人を正しく陰性と判断できますが、疾患に罹患している人も陰性としてしまいます。
そのため特異度が高い検査で陰性と出たところで、その疾患を除外することはできません。
反対にこの陽性となりにくい検査(特異度が高い検査)で陽性とでれば、その疾患に罹患している可能性が高いと言えます。

シンプルにまとめるのであれば
感度が高い検査→疾患の除外に使いましょう
特異度が高い検査→疾患の確定に使いましょう

となります。
実際は感度も特異度も高い検査をすべきではあるのですが、都合よく多くの検査が感度・特異度どちらも高いというのはあまりありません。
そういう時はいくつかの検査をコンビネーション(感度が高い検査+特異度が高い検査)で使うのが理想的です。

感度・特異度の問題点

感度特異度が高いからと言ってそれが信頼できるかと言われたら条件によっては当てにならないこともあります。

例えばある検査が研究事に感度・特異度にばらつきが大きくみられることがあります。
ある研究では感度90パーセントなのに他の研究では感度20パーセントなんてこともあります。

この場合は研究方法自体に違いがある可能性が考えられます。
感度特異度の研究はその手段(メソッド)として、何をもってその疾患に罹患したかという基準が重要です。
例えば椎間板性腰痛を検査しようとしても椎間板性腰痛の完全な診断方法というもの自体存在しないため、椎間板性腰痛の完全な感度特異度を研究する方法はなくなります。
その場合は「この場合は椎間板性腰痛とする」と定義づけして研究することになりますが、その定義づけが間違っていたら、その研究は当てにならなくなります。
この定義づけが研究間で異なることはよくあります。

例えばスパーリングテストの感度特異度を研究しようとしたときに、脊髄造影検査を基準に感度特異度を調査するのか、脊髄造影+他の神経学的な兆候を基準に感度特異度を調査するのでは基準が異なるので、当然感度特異度も変わってきます。

他にも例えば何をもってスパーリングテストとするかでも感度特異度は変動します。
側屈は何度で行うか、伸展は何度で行うのか、頚部にかける圧力は何キロで行うのか、こういう細かいところの違いが感度特異度をばらつかせる原因になります。

これはどの検査でもいえることですが、ある検査を行う時、感度特異度を参考にしようと思ったらその研究とまったく同一の手段を使わなければその感度特異度は当てになりません。

もう一つ感度特異度の信頼度を下げる要因は、検査以外の臨床的に重要な兆候が見られない時です。
例えばスパーリングテストを行うにしても神経根症を疑うべき兆候がない時に検査すると感度特異度が著しく当てにならなくなる条件があります。
それはその疾患の罹患率が低い時です。
感度特異度が例えば99パーセントだったとしても、罹患率の低い疾患に用いた場合は全く当てになりません。これを陽性検査のパラドックスといいます。
そのため検査をするときはある程度妥当性がある場合に用いる必要があります。

RELATED POST