人工知能によるコンピュータ支援検出の効果はどのくらいなのか?
大腸内視鏡検査における大腸新生物の人工知能によるコンピュータ支援検出(CADe)は、腺腫検出率(ADR)を高め、腺腫見逃し率を低下させる可能性があるものの、非腫瘍性ポリープの過剰診断や過剰治療を増加させる可能性があります。しかし、充分に検証されていません。
そこで今回は、ランダム化比較試験においてCADeの有益性と有害性を定量化するために実施された系統的レビューおよびメタ解析(PROSPERO: CRD42022293181)の結果をご紹介します。
本試験では、2023年2月までのMedline、Embase、Scopusデータベースが検索され、ポリープおよびがんの検出について、CADe支援大腸内視鏡検査と標準的な大腸内視鏡検査を比較したランダム化比較試験が対象となりました。
本試験では、腺腫検出率(1個以上の腺腫を有する患者の割合)、1回の大腸内視鏡検査で検出された腺腫数、進行腺腫(10mm以上で高悪性度異形成および絨毛組織を有する)、1回の大腸内視鏡検査で検出された鋸歯状病変数、および腺腫見逃し率が有益性のアウトカムとして、非腫瘍性病変に対するポリペクトミー数および離脱時間が有害アウトカムとして抽出されました。
各アウトカムについて、ランダム効果モデルを用いて研究がプールされました。エビデンスの確実性は、GRADE(Grading of Recommendations Assessment, Development and Evaluation)の枠組みを用いて評価されました。
試験結果から明らかになったことは?
182例の患者を対象とした21件のランダム化比較試験が組み入れられました。
CADe群 | 標準大腸内視鏡群 | 見逃し率の相対的減少 | ||
腺腫検出率 | 44.0% | 35.9% | 相対リスク 1.24 (95%CI 1.16~1.33) 確実性の低いエビデンス | リスク比 0.45 (95%CI 0.35~0.58) 確実性が中等度のエビデンス |
非腫瘍性ポリープの切除 (1回の大腸内視鏡検査) | 0.52 | 0.34 | 平均差[MD] 0.18ポリペクトミー (95%CI 0.11~0.26) 確実性の低いエビデンス | – |
腺腫検出率はCADe群で標準大腸内視鏡群よりも高く(44.0% vs. 35.9%;相対リスク 1.24、95%CI 1.16~1.33;確実性の低いエビデンス)、これは見逃し率の相対的減少55%(リスク比 0.45、CI 0.35~0.58)に相当しました(確実性が中等度のエビデンス)。
CADe群では標準群よりも多くの非腫瘍性ポリープが切除されました(1回の大腸内視鏡検査あたり0.52 vs. 0.34;平均差[MD] 0.18ポリペクトミー、CI 0.11~0.26 ポリペクトミー;確実性の低いエビデンス)。
平均検査時間はCADeによりわずかに増加したのみでした(MD 0.47分、CI 0.23~0.72 分;確実性が中程度のエビデンス)。
コメント
Open AI社がChatGPTを2022年に公開したことを皮切りに、AIへの関心やAI開発が集まっています。
大腸内視鏡検査における大腸新生物の人工知能によるコンピュータ支援検出(CADe)は、腺腫検出率を高め、腺腫見逃し率を低下させる可能性があるものの、非腫瘍性ポリープの過剰診断や過剰治療を増加させる可能性があることから、検証が求められています。
さて、ランダム化比較試験を対象としたシステマティックレビュー・メタ解析の結果、大腸内視鏡検査時のポリープ検出に人工知能によるコンピュータ支援検出を使用すると、腺腫の検出率は増加するものの進行腺腫は検出されず、非腫瘍性ポリープの不必要な切除率が高くなることが示されました。
CADeについては、まだまだ精度が充分ではないようです。さらなる開発と検証が求められます。
続報に期待。
✅まとめ✅ ランダム化比較試験を対象としたシステマティックレビュー・メタ解析の結果、大腸内視鏡検査時のポリープ検出に人工知能によるコンピュータ支援検出を使用すると、腺腫の検出率は増加するが進行腺腫は検出されず、非腫瘍性ポリープの不必要な切除率が高くなる。
根拠となった試験の抄録
背景:大腸内視鏡検査における大腸新生物の人工知能によるコンピュータ支援検出(CADe)は、腺腫検出率(ADR)を高め、腺腫見逃し率を低下させる可能性があるが、非腫瘍性ポリープの過剰診断や過剰治療を増加させる可能性がある。
目的:ランダム化比較試験においてCADeの有益性と有害性を定量化すること。
デザイン:系統的レビューおよびメタ解析(PROSPERO: CRD42022293181)
データ情報源:2023年2月までのMedline、Embase、Scopusデータベース。
研究の選択:ポリープおよびがんの検出について、CADe支援大腸内視鏡検査と標準的な大腸内視鏡検査を比較したランダム化比較試験。
データ抽出:腺腫検出率(1個以上の腺腫を有する患者の割合)、1回の大腸内視鏡検査で検出された腺腫数、進行腺腫(10mm以上で高悪性度異形成および絨毛組織を有する)、1回の大腸内視鏡検査で検出された鋸歯状病変数、および腺腫見逃し率を有益性のアウトカムとして抽出した。非腫瘍性病変に対するポリペクトミー数および離脱時間を有害アウトカムとして抽出した。各転帰について、ランダム効果モデルを用いて研究をプールした。エビデンスの確実性は、GRADE(Grading of Recommendations Assessment, Development and Evaluation)の枠組みを用いて評価した。
データの統合:182例の患者を対象とした21件のランダム化比較試験が組み入れられた。腺腫検出率はCADe群で標準大腸内視鏡群よりも高く(44.0% vs. 35.9%;相対リスク 1.24、95%CI 1.16~1.33;確実性の低いエビデンス)、これは見逃し率の相対的減少55%(リスク比 0.45、CI 0.35~0.58)に相当した(確実性が中等度のエビデンス)。CADe群では標準群よりも多くの非腫瘍性ポリープが切除された(1回の大腸内視鏡検査あたり0.52 vs. 0.34;平均差[MD] 0.18ポリペクトミー、CI 0.11~0.26 ポリペクトミー];確実性の低いエビデンス)。平均検査時間はCADeによりわずかに増加したのみであった(MD 0.47分、CI 0.23~0.72 分;確実性が中程度のエビデンス)。
限界:このレビューは、患者にとって重要な転帰の代用に焦点を当てている。しかしながら、ほとんどの患者はがん罹患率およびがん関連死亡率を重要な転帰と考えている可能性がある。このような患者にとって重要な転帰に対するCADeの効果は依然として不明である。
結論:大腸内視鏡検査時のポリープ検出に人工知能によるコンピュータ支援検出を使用すると、腺腫の検出率は増加するが進行腺腫は検出されず、非腫瘍性ポリープの不必要な切除率が高くなる。
主要資金源:European Commission Horizon 2020 Marie Skłodowska-Curie Individual Fellowship
引用文献
Real-Time Computer-Aided Detection of Colorectal Neoplasia During Colonoscopy : A Systematic Review and Meta-analysis
Cesare Hassan et al. PMID: 37639719 DOI: 10.7326/M22-3678
Ann Intern Med. 2023 Aug 29. doi: 10.7326/M22-3678. Online ahead of print.
— 読み進める https://pubmed.ncbi.nlm.nih.gov/37639719/
コメント