医療システム規模の言語モデルは万能予測エンジンとなりますか？（AIプログラム; Nature. 2023）

40_AI

Photo by Tara Winstead on Pexels.com

2023.07.22

この記事は約4分で読めます。

根拠となった試験の抄録
References
引用文献

根拠となった試験の抄録

背景：医師は毎日、時間に制約のある重要な意思決定を行っている。臨床予測モデルは、臨床や業務上の出来事を予測することで、医師や管理者の意思決定を支援することができる。既存の構造化データに基づく臨床予測モデルは、データ処理やモデルの開発・展開が複雑なため、日常診療での使用は限られている^1-3。

方法：自然言語処理^4,5における最近の進歩を活用し、医療言語のための大規模な言語モデル（NYUTron）を訓練し、その後、臨床および運用の幅広い予測タスクにわたって微調整を行った：まずNYU Langone EHRに2種類のデータセットを照会した。事前学習用データセットであるNYU Notesには、10年分の入院患者の臨床記録（387,144例の患者、41億語）が含まれている。微調整用データセットは5つある。EHRに含まれる医療言語の事前学習モデルを作成するために、MLMタスクを使用してEHR全体に対してNYUTronと呼ばれる1億900万パラメータのBERTライクLLMを事前学習した。その後、特定のタスク（例えば、30日全原因再入院予測）について事前学習したモデルを微調整し、保持されたレトロスペクティブデータで検証した。このようなタスクについて、5つの項目について医療システム内でアプローチを評価した：30日全死因再入院予測、院内死亡予測、合併症指数予測、在院日数予測、保険拒否予測。

結果：NYUTronが予測タスク（院内死亡率、再入院、在院日数、保険拒否）について78.7〜94.9％の曲線下面積（AUC）を持ち、従来のモデルと比較してAUCが5.36〜14.7％改善することを示す。さらに、臨床テキストを用いた事前トレーニングの利点、微調整による異なる部位への一般化可能性の向上、前向き単群試験における本システムの完全な展開の可能性を示す。

結論：これらの結果は、医療において臨床言語モデルを使用することで、医師と一緒に読み、治療の時点でガイダンスを提供できる可能性を示している。

References

Roberts M, et al. Common pitfalls and recommendations for using machine learning to detect and prognosticate for COVID-19 using chest radiographs and CT scans. Nat. Mach. Intel. 2021;3:199–217. doi: 10.1038/s42256-021-00307-0. – DOI
Kelly CJ, Karthikesalingam A, Suleyman M, Corrado G, King D. Key challenges for delivering clinical impact with artificial intelligence. BMC Med. 2019;17:195. doi: 10.1186/s12916-019-1426-2. – DOI – PMC – PubMed
Gaube S, et al. Do as AI say: susceptibility in deployment of clinical decision-aids. NPJ Digit. Med. 2021;4:31. doi: 10.1038/s41746-021-00385-9. – DOI – PMC – PubMed
Devlin, J., Chang, M.-W., Lee, K. & Toutanova, K. BERT: pre-training of deep bidirectional transformers for language understanding. in Proc. 2019 NAACL: Human Language Technologies (eds Burstein, J., Doran, C. & Solorio, T.) 4171–4186 (Association for Computational Linguistics, 2019).
Brown, T. B. et al. Language models are few-shot learners. in Proc. NeurIPS (eds Wallach, H. et al.) 1877–1901 (Neural Information Processing Systems, 2020).

引用文献

Health system-scale language models are all-purpose prediction engines
Lavender Yao Jiang et al. PMID: 37286606 PMCID: PMC10338337 DOI: 10.1038/s41586-023-06160-y
Nature. 2023 Jul;619(7969):357-362. doi: 10.1038/s41586-023-06160-y. Epub 2023 Jun 7.
ー続きを読む https://pubmed.ncbi.nlm.nih.gov/37286606/