医療システム規模の言語モデルは万能予測エンジンとなりますか?(AIプログラム; Nature. 2023)

robot s hand on a blue background 40_AI
Photo by Tara Winstead on Pexels.com
この記事は約4分で読めます。
ランキングに参加しています!応援してもよいよという方はポチってください!

根拠となった試験の抄録

背景:医師は毎日、時間に制約のある重要な意思決定を行っている。臨床予測モデルは、臨床や業務上の出来事を予測することで、医師や管理者の意思決定を支援することができる。既存の構造化データに基づく臨床予測モデルは、データ処理やモデルの開発・展開が複雑なため、日常診療での使用は限られている1-3

方法:自然言語処理4,5における最近の進歩を活用し、医療言語のための大規模な言語モデル(NYUTron)を訓練し、その後、臨床および運用の幅広い予測タスクにわたって微調整を行った:まずNYU Langone EHRに2種類のデータセットを照会した。事前学習用データセットであるNYU Notesには、10年分の入院患者の臨床記録(387,144例の患者、41億語)が含まれている。微調整用データセットは5つある。EHRに含まれる医療言語の事前学習モデルを作成するために、MLMタスクを使用してEHR全体に対してNYUTronと呼ばれる1億900万パラメータのBERTライクLLMを事前学習した。その後、特定のタスク(例えば、30日全原因再入院予測)について事前学習したモデルを微調整し、保持されたレトロスペクティブデータで検証した。このようなタスクについて、5つの項目について医療システム内でアプローチを評価した:30日全死因再入院予測、院内死亡予測、合併症指数予測、在院日数予測、保険拒否予測

結果:NYUTronが予測タスク(院内死亡率、再入院、在院日数、保険拒否)について78.7〜94.9%の曲線下面積(AUC)を持ち、従来のモデルと比較してAUCが5.36〜14.7%改善することを示す。さらに、臨床テキストを用いた事前トレーニングの利点、微調整による異なる部位への一般化可能性の向上、前向き単群試験における本システムの完全な展開の可能性を示す。

結論:これらの結果は、医療において臨床言語モデルを使用することで、医師と一緒に読み、治療の時点でガイダンスを提供できる可能性を示している。

References

  1. Roberts M, et al. Common pitfalls and recommendations for using machine learning to detect and prognosticate for COVID-19 using chest radiographs and CT scans. Nat. Mach. Intel. 2021;3:199–217. doi: 10.1038/s42256-021-00307-0. – DOI
  2. Kelly CJ, Karthikesalingam A, Suleyman M, Corrado G, King D. Key challenges for delivering clinical impact with artificial intelligence. BMC Med. 2019;17:195. doi: 10.1186/s12916-019-1426-2. – DOI – PMC – PubMed
  3. Gaube S, et al. Do as AI say: susceptibility in deployment of clinical decision-aids. NPJ Digit. Med. 2021;4:31. doi: 10.1038/s41746-021-00385-9. – DOI – PMC – PubMed
  4. Devlin, J., Chang, M.-W., Lee, K. & Toutanova, K. BERT: pre-training of deep bidirectional transformers for language understanding. in Proc. 2019 NAACL: Human Language Technologies (eds Burstein, J., Doran, C. & Solorio, T.) 4171–4186 (Association for Computational Linguistics, 2019).
  5. Brown, T. B. et al. Language models are few-shot learners. in Proc. NeurIPS (eds Wallach, H. et al.) 1877–1901 (Neural Information Processing Systems, 2020).

引用文献

Health system-scale language models are all-purpose prediction engines
Lavender Yao Jiang et al. PMID: 37286606 PMCID: PMC10338337 DOI: 10.1038/s41586-023-06160-y
Nature. 2023 Jul;619(7969):357-362. doi: 10.1038/s41586-023-06160-y. Epub 2023 Jun 7.
ー 続きを読む https://pubmed.ncbi.nlm.nih.gov/37286606/

コメント

タイトルとURLをコピーしました