コクランレビューと非コクランレビューでは、得られる効果推定値は一致しないことが多い
多くの臨床試験が行われていますが、一貫した結果が得られない場合があります。その場合、システマティックレビュー・メタ解析(SR&MA)により得られる結果が、臨床疑問に答えられることがあります。
SR&MAの方法論としては、大きくコクランレビューと、コクランレビュー以外(非コクランレビュー)に分けられます。しばしば問題となるのは、同じ臨床疑問に答えるコクランレビュー(CR)と非コクランレビュー(NCR)のプール効果推定値の不一致です。
そこで今回は、CRとNCRによるSR&MAを支える方法論的要因を系統的に探求したメタ疫学研究の結果をご紹介します。本試験では、母集団、介入、条件、アウトカムをマッチさせたCRとNCRのメタ解析間の効果推定値の一致を定量的・定性的に分析されました。
試験結果から明らかになったことは?
コクランレビュー(CR)24件、非コクランレビュー(NCR)20件のレビューからマッチしたメタ解析24件(内包されたのはランダム化対照試験[RCT]545件)を同定しました。
CRのマッチドペアと比較して、NCRのプール効果は1つのペアでのみ同じであり、平均0.12 log units(13%)高く(P=0.012)、4つのマッチドペアで2倍以上の効果量となりました。
CRの3分の2(15/24、70.8%)とNCRの0/20(0%)が、その結果に中程度から高い信頼性を持つと評価されました(AMSTAR 2による評価)。
検索戦略、適格基準、二重スクリーニングの実施など、事前に定義された方法論の違いは、含まれる研究のミスマッチを説明する可能性があります。14組の研究では、適格基準の解釈の不一致が、不一致の原因として特定されました。24分の23のメタ解析には、少なくとも1件の一致した研究が含まれていました。同じ研究の数値データについて合意したのは2組のみでした。不一致の研究の50%(n=45)の評価では、15件の研究で抽出されたデータの違いの理由が特定されました。
コメント
しばしば問題となるのがコクランレビューと非コクランレビューで得られた結果の違いですが、その要因については充分に追求されていません。
さて、本試験結果によれば、非コクランレビューによるメタ解析は、同じ臨床疑問に答えるコクランレビューによるメタ解析と比較して、より高い効果推定値を報告していました。この要因として、方法論、著者の判断や実績が挙げられ、含まれる研究の重複の不充分さや報告された効果推定値の不一致を支える重要な側面であると考えられました。
システマティック・レビューのための厳密な評価ツールとしてAMSTAR 2が知られていますが、これに基づくと、メタ解析から得られた結果において、CRの70.8%とNCRの0%が、その結果に中程度から高い信頼性を持つと評価されました。したがって、コクランレビューで取り上げられた臨床疑問については、非コクランレビューよりも優先して参照したほうが良い可能性があります。ただし、コクランレビューであっても、メタ解析の方法論に問題があったり、含まれた研究が適切でなかったりと、結果の解釈に注意を要するものがあります。いずれにせよ結果の鵜呑みは避けたほうが良いと考えられます。
まだまだ検証が必要な分野であると考えられますので、今後の報告に注目したいところです。
✅まとめ✅ 非コクランレビューによるメタ解析は、同じ臨床疑問に答えるコクランレビューによるメタ解析と比較して、より高い効果推定値を報告していた。方法論、著者の判断や実績が、含まれる研究の重複の不充分さや報告された効果推定値の不一致を支える重要な側面である。
根拠となった試験の抄録
目的:同じ臨床的疑問に答えるコクランレビュー(CR)と非コクランレビュー(NCR)のシステマティックレビューのプール効果推定値の不一致を支える方法論的要因を系統的に探求すること。
研究デザインおよび設定:母集団、介入、条件、アウトカムをマッチさせたCRとNCRのメタ解析間の効果推定値の一致を定量的・定性的に分析した。
結果:CR24件、NCR20件のレビューからマッチしたメタ解析24件(545件のランダム化対照試験[RCT])を同定した。CRのマッチドペアと比較して、NCRのプール効果は1つのペアでのみ同じであり、平均0.12 log units(13%)高く(P=0.012)、4つのマッチドペアで2倍以上の効果量となった。CRの3分の2(15/24、70.8%)とNCRの0/20(0%)が、その結果に中程度から高い信頼性を持つと評価された(AMSTAR 2*)。検索戦略、適格基準、二重スクリーニングの実施など、事前に定義された方法の違いは、含まれる研究のミスマッチを説明する可能性がある。14組の研究では、適格性基準の解釈の不一致が、不一致の原因として特定された。23/24のメタ解析には、少なくとも1件の一致した研究が含まれていた。同じ研究の数値データについて合意したのは2組のみであった。不一致の研究の50%(n=45)の評価では、15件の研究で抽出されたデータの違いの理由が特定された。
*AMSTAR 2:ヘルスケア介入のランダム化または非ランダム化研究あるいは両方を含むシステマティック・レビューのための厳密な評価ツール
結論:平均して、NCRによるメタ解析は、同じ臨床的疑問に答えるCRによるメタ解析と比較して、より高い効果推定値を報告していた。方法論、著者の判断や実績が、含まれる研究の重複の不充分さや報告された効果推定値の不一致を支える重要な側面である。医療政策や臨床実践に及ぼす潜在的な影響は広範囲に及ぶが、まだ不明な点が多い。報告ガイドラインの適用に関する認識と精査の強化、およびプロトコール登録の改善が必要である。
キーワード:コクランレビュー、矛盾、マッチドペア分析、メタ分析、方法論の質、非コクランレビュー、システマティックレビュー
引用文献
Discrepancies in meta-analyses answering the same clinical question were hard to explain: a meta-epidemiological study
Claudia Hacke et al. PMID: 31783099 DOI: 10.1016/j.jclinepi.2019.11.015
J Clin Epidemiol. 2020 Mar;119:47-56. doi: 10.1016/j.jclinepi.2019.11.015. Epub 2019 Nov 26.
ー 続きを読む https://pubmed.ncbi.nlm.nih.gov/31783099/
関連記事
【コクラン・レビューで検証されたほとんどの医療介入は、質の高いエビデンスによれば有効ではない(J Clin Epidemiol. 2022)】
コメント