死亡をアウトカムとした非劣性試験における適切な非劣性マージンはどのくらい?(システマティックレビュー; BMJ 2021)

非劣性試験の課題とは?

非劣性試験の前提は、新しい治療法が標準的な治療法と比較して、研究者が事前に設定した非劣性マージンによって悪化しないことを証明することです(PMID: 16522836)。しかし、医薬品、医療機器、その他の医療行為が比較対象と比較して悪化しないことを証明することは困難です(PMID: 28976859PMID: 21923583)。

非劣性マージンの許容幅(非劣性マージン)は、これらの試験のデザインにおいて議論の余地があります。 この非劣性マージンは、試験に必要なサンプルサイズを決定し、対照薬に対して「許容できないほど悪くない」という解釈に大きな影響を与えます。非劣性マージンが広いと、より小さなサンプルサイズで非劣性を結論づけることができますが、これとは反対に広すぎる場合、非劣性の結論が臨床的に無意味であったり、倫理的に不適切であったりする可能性をはらんでいます(PMID: 21048948PMID: 23157733PMID: 16395993PMID: 28270184PMID: 27855102PMID: 21539749PMID: 12520555PMID: 28875400PMID: 30756306)。

非劣性マージンをどのように選択するか、それが正当化されるかどうか(PMID: 12520555FDA 2016)、試験結果や結論の妥当性にどのような影響を与えるかについて、多くの注目が集まっています。 しかし、先行研究では、死亡率などのリスクの高いアウトカム(ハードアウトカム)を対象とした試験で使用される非劣性マージンの大きさやばらつきについては述べられておらず、また、患者のタイプ、対象とする医療条件、アウトカムの選択、アウトカムのベースラインリスクなどの試験の特性が、非劣性マージンの大小と関連するかどうかについても検討されていません。非劣性試験のデザインと分析に関する基準を確立し、これらの試験の一貫した質を向上させる必要があります。したがって、重要なステップとしては、非劣性試験で使用される非劣性マージンの範囲を特定し、試験の特性がマージンサイズの選択に影響を与えるかどうかを判断することです。

そこで今回は、死亡率を主要評価項目とする薬剤の非劣性試験で用いられた非劣性マージンの大きさとばらつきについて検証したシステマティックレビューの結果をご紹介します。

試験結果から明らかになったことは?

3,992件の記録がスクリーニングされ、195件の論文がフルテキストレビューに選ばれ、111件の論文が解析に含まれました。試験の82%は、血栓症、感染症、腫瘍で実施されていました。

死亡率は23件(21%)の試験で唯一(単独)の主要評価項目であり、88件(79%)の試験では複合主要評価項目の一部でした。

全体の非劣性マージンの中央値は、絶対的なリスク差が9%(IQR 4.2%~10%)でした。

非劣性マージンを対照群の主要アウトカムのベースラインリスクに対する相対的な値で表した場合、相対的非劣性マージンの中央値は1.5(IQR 1.3〜1.7)でした。

試験の特徴(専門医、小児患者の組み入れ、死亡率を単独または複合主要アウトカムの一部とすること、企業からの資金提供の有無)と非劣性マージンの大きさとの関連を調べた多変量回帰分析では、専門医のみが非劣性マージンの大きさと有意に関連していました。

現在の中央値(絶対死亡率 9%未満、相対死亡率 1.5倍未満)よりも低い非劣性マージンを推奨すれば、死亡率を伴うランダム化比較試験で使用される非劣性マージンの削減につながる可能性があります。

コメント

新薬開発において、よほどの希少疾患に対する治療薬でない限り、倫理的な観点から既存薬との比較試験(主に非劣性試験)が行われます。

優越性試験(一般的な比較試験)と比較して、非劣性試験では、少なくとも有効性が劣っていないこと、少なくとも有害事象が増えすぎないことが示せれば良いため、結果の解釈に注意を要します。

さて、本試験結果によれば、1989年1月〜2019年12月までに死亡をアウトカムとした非劣性試験において、全体の非劣性マージンの中央値は、絶対的なリスク差が9%(IQR 4.2%~10%)でした。一方、非劣性マージンを対照群の主要アウトカムのベースラインリスクに対する相対的な値で表した場合では、相対的非劣性マージンの中央値は1.5(IQR 1.3〜1.7)でした。糖尿病領域においては、FDAが推奨した非劣性マージン1.3が使用されることが多いと考えられます。

このほかにも非劣性試験を繰り返すことによる弊害、バイオクリープが発生することもあることから、やはり非劣性試験の批判的吟味は、より慎重に行うことが求められるのではないでしょうか。

photo of gray cat looking up against black background

✅まとめ✅ 絶対死亡率 9%未満、相対死亡率 1.5倍未満よりも低い非劣性マージンの使用を推奨すれば、死亡率を伴うランダム化比較試験で使用される非劣性マージンの削減につながる可能性がある

根拠となった試験の抄録

目的:死亡率を主要アウトカムとする薬剤の非劣性試験で使用された非劣性マージンの大きさとばらつきを説明し、試験の特徴と非劣性マージンの大きさの関連性を調べること。

試験デザイン:システマティックレビュー。

データソース:1989年1月から2019年12月までのMedline,Medline In Process,Medline Epub Ahead of Print,Embase Classic+Embaseデータベース。

適格性の基準:薬物療法を比較した前向き非劣性ランダム化対照試験で、非劣性に関する一次解析と、死亡率のみまたは複合アウトカムの一部を含む一次アウトカムを有するもの。
試験では、非劣性マージンを絶対的リスク差またはアウトカムのリスクに対する相対的リスクとして事前に規定し、対照介入における主要アウトカムのベースラインリスクを提供する必要があった。

結果:3,992件の記録がスクリーニングされ、195件の論文がフルテキストレビューに選ばれ、111件の論文が解析に含まれた
試験の82%は、血栓症、感染症、腫瘍で実施されていた。死亡率は23件(21%)の試験で唯一の主要評価項目であり、88件(79%)の試験では複合主要評価項目の一部であった。全体の非劣性マージンの中央値は、絶対的なリスク差が9%(IQR 4.2%~10%)であった。
非劣性マージンを対照群の主要アウトカムのベースラインリスクに対する相対的な値で表した場合、相対的非劣性マージンの中央値は1.5(IQR 1.3〜1.7)であった。
試験の特徴(専門医、小児患者の組み入れ、死亡率を単独または複合主要アウトカムの一部とすること、企業からの資金提供の有無)と非劣性マージンの大きさとの関連を調べた多変量回帰分析では、専門医のみが非劣性マージンの大きさと有意に関連していた。

結論:公表されている薬剤比較試験で使用されている絶対的および相対的な非劣性マージンは大きく、死亡率に大きな差がある状況で非劣性の結論を出すことができる。
非劣性を宣言しながら、死亡率を含むアウトカムの大きな増加の可能性を受け入れることは、非劣性試験の実施における方法論上の課題である。

キーワード:臨床試験、疫学、統計・研究法

引用文献

Testing for non-inferior mortality: a systematic review of non-inferiority margin sizes and trial characteristics
Sandra Pong et al.
BMJ Open. 2021 Apr 20;11(4):e044480. doi: 10.1136/bmjopen-2020-044480.
ー 続きを読む

関連記事

【心血管疾患を伴う痛風患者へのフェブキソスタットとアロプリノール、どちらがより安全に使用できますか?(DB-RCT; 非劣性; CARES trial; NEJM 2018)】

【ハイリスク心房細動患者における経皮的左心耳閉鎖術(LAAC)と直接経口抗凝固薬は、どちらが優れていますか?(非劣性RCT; PRAGUE-17; JACC 2020)】

【PCIを受けたACS患者におけるDAPT 1ヵ月後のプラスグレル de-escalationは、同用量の治療継続と比較して、有害事象を減らせますか?(非劣性 Open-RCT; HOST-REDUCE-POLYTECH-ACS; Lancet 2020)】

【80歳以上の高血圧患者における降圧剤の減量と通常のケアが短期的な血圧コントロールに及ぼす影響 はどのくらいですか?(非劣性 Open-RCT; OPTIMISE trial; JAMA. 2020)】

コメント

タイトルとURLをコピーしました