― Science誌が警鐘を鳴らす「量産される観察研究」の問題点(Science. 2026)
臨床疑問
近年、TriNetXを用いたリアルワールドデータ(RWD)研究が急増しています。
しかし、「TriNetXを用いた研究結果は、そのまま臨床に応用できるほど信頼できるのだろうか?」
Science誌は2026年、この問いに対して警鐘を鳴らす特集記事を掲載しました。
研究の背景
近年、医療分野では電子カルテ(Electronic Health Records:EHR)を利用した観察研究が急速に増加しています。
その代表的なプラットフォームがTriNetXです。
TriNetXでは、米国を中心に3億人以上の匿名化電子カルテ、ブラウザ上で容易に解析可能、傾向スコアマッチングなどの解析機能を搭載しており、多くの医療機関や大学で利用されています。
その結果、TriNetXを利用した論文数は以下のように爆発的に増加しています。
- 2020年:33報
- 2025年:約2,700報
- 2026年(6月時点):2,100報超
一方で、この急増に伴い、「質の低い研究が大量に生産されているのではないか」という懸念が研究者の間で高まっています。
Science誌が指摘した問題点とは?
① ボタン一つで解析できることによる”簡単すぎる研究”
TriNetXでは専門的な統計ソフトを使用しなくても、コホート作成、傾向スコアマッチング、生存時間解析などが比較的容易に実行できます。
そのため、十分な疫学教育を受けていない研究者でも解析が可能となっています。
② Immortal-time bias(不死時間バイアス)
Science誌が最も問題視したバイアスの一つです。例えば、心筋梗塞後にある薬剤を開始した患者群と、開始しなかった患者群を比較するとします。
薬剤を開始するまで生存していなければ治療群には入れないため、治療群には必然的に「死亡しない期間(Immortal time)」が含まれます。
これを適切に補正しないと、薬剤が実際以上に有効に見えてしまいます。
③ Collider bias(コライダーバイアス)
電子カルテ研究では「医療機関を受診した患者」という共通条件で患者を抽出することが多くあります。しかし、受診行動そのものが治療、疾患の双方に影響される場合、見かけ上の関連が生じることがあります。
これが合流点バイアス(Collider bias)です。
例えば、GLP-1受容体作動薬とがんリスクを検討した研究では、このバイアスへの配慮が不足していたとScience誌は指摘しています。
④ p-hacking(都合の良い結果だけを報告)
解析が短時間で何度でも実施できるため、多数の解析を行い、有意差が出た結果だけを論文化する危険性があります。
これをp-hacking(pハッキング、p値ハッキング、または分岐道 forking paths)と呼びます。
⑤ AIによるMethods作成の可能性
特に衝撃的だった指摘です。Joshua Wangらは、複数の大規模言語モデル(LLM)に「TriNetXでImmortal-time biasを補正する方法」を質問しました。
その結果、6種類のLLMがTriNetXでは実装できない解析方法を提案しました。
さらに、実際のTriNetX論文を調査したところ、同じ不可能な解析方法がMethodsに記載された論文が複数見つかりました。
著者らは、AIの回答をそのままMethodsへ記載した。他論文からMethodsをコピーした等の可能性を指摘しています。
実際に問題視された論文
Science誌では具体例として以下を紹介しています。
1)GLP-1受容体作動薬とがんリスク
ある研究では、GLP-1受容体作動薬が多種類のがんを予防すると報告しました。しかし、前述のCollider bias、Immortal-time biasについて十分な補正が行われていませんでした。
2)SGLT2阻害薬と心筋梗塞後死亡率
別の研究では、MethodsにTriNetXでは実装できない解析手法が記載されていました。
これに対してJoshua Wangらは、Methodsの妥当性に疑問を呈しています。
TriNetX社の見解
TriNetX社は、問題がある論文は全体のごく一部であると反論しています。
また、実行不可能なMethodsについても、用語の誤解、記載不足、外部解析など様々な可能性があると説明しています。
一方で、同社も疫学・統計学の知識が必要であることは認めています。
この問題から何が学べるか?
Science誌の記事は、TriNetXそのものを否定しているわけではありません。
むしろ、TriNetXは非常に有用な研究基盤である一方、適切な研究デザインや疫学的知識が不可欠であることを強調しています。
実際、Target Trial Emulationなど、適切に設計されたTriNetX研究からは重要な知見も数多く報告されています。
重要なのは「TriNetXを使ったから信頼できる」でも、「TriNetXだから信用できない」でもなく、研究デザインそのものを評価することです。
薬剤師・研究者がTriNetX論文を読む際のチェックポイント
以下の点を確認すると、研究の妥当性を評価しやすくなります。
① Target trial emulationか?
単純な傾向スコアマッチングだけでなく、Target Trial Emulationを採用しているか。
② Immortal-time biasへの対応
治療開始時点の定義が明確か。Time-zeroは適切か。
③ Collider biasへの配慮
患者選択によるバイアスが生じていないか。
④ 感度解析
複数の解析で結果が一貫しているか。
⑤ Methodsが再現可能か
TriNetXで本当に実施可能な解析なのか。Methodsが具体的に記載されているか。
まとめ
✅ TriNetXを用いた研究は近年急増している。
✅ 一部ではImmortal-time biasやCollider biasなどの基本的な問題が指摘されている。
✅ AIによるMethods作成やコピー&ペーストの可能性も懸念されている。
✅ TriNetX自体が問題なのではなく、研究デザインと解析の質が重要である。
✅ 論文を読む際には、「どのデータを使ったか」ではなく、「どのように解析したか」を評価する姿勢が求められる。
上記のチェックポイントは、TriNetXを活用した論文を読む際に有効ですね。
続報に期待。

✅まとめ✅ TriNetXは非常に有用な研究基盤である一方、適切な研究デザインや疫学的知識が不可欠であることが強調された。
引用文献
Medical students are using a popular research tool to pump out misleading studies
Critics say TriNetX’s easy analyses of electronic medical records fuel quick-and-dirty publications from inexperienced authors
Science. 2026. DOI: 10.1126/science.znbitdz. 24 Jun 2026 1:30 PM ET By Frederik Joelving, Retraction Watch
ー 続きを読む https://www.science.org/content/article/medical-students-are-using-popular-research-tool-pump-out-misleading-studies

コメント