False Negative Tests for SARS-CoV-2 Infection – Challenges and Implications
Steven Woloshin et al.
N Engl J Med. 2020 Aug 6;383(6):e38. doi: 10.1056/NEJMp2015897. Epub 2020 Jun 5.
PMID: 32502334
DOI: 10.1056/NEJMp2015897
背景
米国を安全に再開するためには、SARS-CoV-2検査の普及が不可欠であることは、幅広いコンセンサスがある。大きな関心事は検査の利用可能性であるが、検査精度の方が長期的には大きな問題となる可能性がある。
これまでの議論では、以前の感染を特定する抗体検査の精度に焦点が当てられてきたが、現在の感染を特定する診断検査はあまり注目されていなかった。しかし、不正確な診断検査はパンデミックを封じ込めようとする努力を弱めてしまう。
診断検査(通常は鼻咽頭スワブを使用)は、2つの方法で不正確になる可能性がある。偽陽性の結果は、不必要な隔離や接触者の追跡などをもたらし、感染者を誤って認識(表示)してしまう。偽陰性の場合は、無症状の感染者が隔離されずに他の人に感染する可能性があるため、より重大な結果となる。
診断検査で感染がどの程度除外されているかを知る必要があるため、食品医薬品局(FDA)や臨床研究者による検査精度の評価や、パンデミック時の検査結果の解釈を確認することが重要である。
SARS-CoV-2に対する検査精度と問題点
FDAは、市販の検査メーカーに緊急使用許可(Emergency Use Authorizations, EUAs)を与え、検査バリデーションに関するガイダンスを発行している。検査の(分析)感度とは、あらゆるウイルス株を含む物質に対して検査が陽性となる可能性と、検査で検出できる最小濃度を示す。検査の(分析)特異度とは、標的ウイルス以外の病原体を含む物質に対して検査が陰性となる可能性を示す。
患者の検体に対する検査性能の臨床評価は、メーカーによって異なる。FDAは「自然な臨床検体」の使用を好んでいるが、残された臨床検体にウイルスRNAや不活化ウイルスを添加して作製した「人工検体」の使用を許可している。通常、検査性能試験では、患者に指標検査と「参照基準」検査を受けてもらい、患者の真の状態を判定する。臨床感度とは、問題となる疾患に実際に罹患している患者であり、指標検査の陽性の割合のことである。感度とその測定法は、臨床環境によって異なる場合がある。感染者(病人)の場合、基準となる標準検査は臨床診断である可能性が高く、理想的には、指標検査の結果を知らない独立した裁定委員会によって確立される。SARS-CoV-2については、FDA認可の市販検査の感度がこのように評価されているかどうかは不明である。EUAsの下では、FDAは、症状のある人から得られた既知の陽性物質または偽検体を用いて、承認された逆転写酵素ポリメラーゼ鎖反応(RT-PCR)検査と新しい検査の一致を確立することで、臨床試験の性能を実証することを許可している。既知の陽性検体または偽検体のいずれかを使用すると、実際にはswabが感染した検体を見逃してしまう可能性があるため、検査感度の過大評価につながる可能性がある。
無症状者における SARS-CoV-2 検査の感度を測定するための参照基準値を作成することは、接触追跡やスクリーニングを目的とした検査結果の信頼性を高めるために、緊急に注意を払う必要がある未解決の問題である。無症状のままであっても感染している可能性があるため、単に症状が発現するまで追跡するだけでは不十分な場合がある。2020年6月1日現在、市販の検査では、無症状者における臨床的感度の評価は報告されていない。
RT-PCR検査の偽陰性率
中国の武漢で行われた2つの研究は、明らかなCOVID-19患者におけるRT-PCR検査の偽陰性についての懸念を喚起している。Yangらの論文では、COVID-19で入院した患者213例のうち37例が重症であったことが報告されている。彼らは、205の咽頭スワブ、490の鼻スワブ、142の喀痰サンプル(中央値 3サンプル/患者1人)を採取し、中国の規制当局によって承認されたRT-PCR検査を使用した。発症後1日目から7日目までの間に、喀痰検体の11%、鼻腔検体の27%、喉検体の40%が偽陰性と判定された。Zhao らは、急性呼吸器症状を呈し、胸部CTでCOVID-19、またはSARS-CoV-2が少なくとも 1 つの呼吸器検体から「典型的」に検出された入院患者173例を対象に研究を行った。入院1日目から7日目に採取した呼吸器検体のRT-PCR検査では、患者の67%から少なくとも1つの検体でSARS-CoV-2が陽性であった。どちらの研究も、COVID-19の最終診断を下すために、指標検査の結果を知らない独立したパネルを使用したことは報告されていないが、これは研究者が感度を過大評価するバイアスの可能性がある。
患者957例(「COVID-19の感染疑い」または「確定症例」)を対象とした研究5件(YangとZhaoの研究を含まない)のプレプリントシステマティックレビューでは、偽陰性は2~29%であった。しかし、研究間の感度推定値の不均一性、診断を確定する際の指標検査結果の盲検化の欠如、主要なRT-PCR特性の報告がないため、エビデンスの確実性は非常に低いと考えられていた。全体として見ると、限られたエビデンスではあるが、RT-PCRの結果が頻繁に偽陰性であることが懸念される。
SARS-CoV-2の診断検査が完全であれば、陽性検査は誰かがウイルスを保有していることを意味し、陰性検査はウイルスを保有していないことを意味する。不完全な検査では、陰性の結果はその人が感染している可能性が低いことを意味する。可能性が高いかを計算するには、人とテスト精度、両方についての情報を組み込んだベイズの定理を使用することができる。陰性検査の場合、2つの重要な入力がある:テスト前の確率 – 検査前の推定値であり、感染する可能性のある人の確率 – 検査感度である。検査前確率は、局所的なCOVID-19の有病率、SARS-CoV-2曝露歴、症状に依存する。理想的には、各検査の臨床的感度と特異度は、臨床的に関連する様々な実生活の状況(例えば、検体の供給源の変化、タイミング、および疾患の重症度)で測定されるかもしれない。
ベイズの定理を活用する
RT-PCR検査が完全に特異的(SARS-CoV-2に感染していない人では常に陰性)で、例えば、COVID-19を有している人と密接に接触した後に気分が悪くなった人の検査前の確率が20%であったとする。もし検査感度が95%(感染者の95%が陽性)であれば、検査後の陰性の感染確率は1%となり、これは感染していないと考えるには十分に低い値であり、リスクの高い親族を訪問する際に安心感を与えてくれるかもしれない。検査前の確率が50%と高かったとしても、検査後の確率は5%以下のままであり、これは「ホットスポット」地域で最近暴露され、初期症状を呈している人にとってはより合理的な推定値である。
しかし、利用可能な多くの検査の感度はかなり低いようである:上記に引用した研究では、感度70%がおそらく妥当な推定値であることを示唆している。この感度レベルでは、検査前の確率が50%の場合、検査後の陰性の確率は23%となり、安全に誰かが感染していないと仮定するには高すぎる。
グラフ(https://www.nejm.org/na101/home/literatum/publisher/mms/journals/content/nejm/2020/nejm_2020.383.issue-6/nejmp2015897/20200731/images/img_medium/nejmp2015897_f1.jpeg)では、感度が低い(70%)および高い(95%)検査について、検査後の感染確率が検査前の確率とどのように変化するかを示している。横線は、その人が感染していないかのように行動することが合理的である確率のしきい値を示している(例えば、その人が高齢の祖母を訪問することを許可するなど)。この閾値をどこに設定すべきか(ここでは5%)は価値判断であり、文脈によって異なる(例えば、リスクの高い親族を訪問する人ほど低い)。この閾値は、なぜ非常に感度の高い診断検査が必要なのかを強調している。低感度の検査で陰性の結果が得られた場合、テスト前の確率が15%を超えると閾値を超えるが、高感度の検査では、テスト前の確率が33%までであっても、5%の閾値を仮定すると、他人と接触しても安全であると考えられる。
このグラフはまた、検査前の確率を下げる努力(例えば、社会的距離を置く、場合によってはマスクを着用するなど)が重要である理由を浮き彫りにしている。検査前の確率が高すぎると(例えば50%を超えると)、陰性の結果は閾値に達するほど感染の確率を下げることができないため、検査の価値を失うことになる。
著者の結論
我々はいくつかの結論を導き出した。
第一に、診断検査は安全な開国に役立つが、臨床的に意味のある基準値に対して現実的な条件下で高感度で検証された検査でなければならない。
第二に、FDAは、製造業者が市場認可時に検査の臨床感度と特異度の詳細を提供することを保証すべきである。
第三に、無症状の人における検査感度の測定は緊急の優先事項である。また、検査前の感染確率を推定する方法(例えば、予測規則)を開発し、検査結果が陽性または陰性であった場合の検査後の確率を計算できるようにすることも重要である。
第四に、高感度の検査で陰性であっても、検査前の確率が高ければ感染を除外することはできないため、臨床家は予期せぬ陰性結果を信用すべきではない(すなわち、典型的な症状を持ち、曝露が知られている人の陰性結果は「偽陰性」であると仮定すべきである)。複数の同時または反復検査を行うことで、個々の検査の限られた感度を克服できる可能性があるが、そのような戦略は検証が必要である。
最後に、感染を除外するためのしきい値を様々な臨床状況に合わせて開発する必要がある。これらのしきい値を定義することは価値判断であるため、国民の意見が非常に重要である。
コメント