95%信頼区間とは何ですか？（統計学ワード） | 2017年12月23日 | 猫薬プロジェクト3rd〜ある薬剤師の備忘録〜

95%信頼区間とは何ですか？（統計学ワード）

ことば　コトバ　言葉　Word

2017.12.232020.09.28

この記事は約2分で読めます。

背景

今更ながら “95%信頼区間” という言葉の定義を自分なりに理解したい。

95%信頼区間とは、95%の確率で母集団の平均を含む区間である。

しかし、より正確には、仮に同じ臨床試験を 100回施行した場合、そのうち 5回くらいの結果は真の値を含まない平均値（点推定）を示す、ということである。

薬の効果と副作用を検討する際、世界中の全人類が臨床試験に参加することは不可能である。年齢や既往歴等の特徴で参加対象を絞ったとしても、その特徴を有す全員が参加することもまた現実的ではない。

ではどうするのか？

その問いの一つとして区間推定があげられる（以下のイメージ図を参照）。 f:id:noir-van13:20171109001735p:plain （点推定と 95%信頼区間のイメージ図）

ある薬剤Aについて、評価項目（アウトカム）の発生数（イベント数）を計算しサンプルサイズ（標本数）を予め設定することで、全体（母集団）の平均値を推定しようとする試みである。

サンプルサイズは過去の類似研究の結果を基に算出することが多い。

臨床試験の結果は、ハザード比やリスク比、オッズ比 etc. で示される。例えば、ある臨床試験の、あるアウトカムにおけるハザード比＝1.21 （95%信頼区間 0.78〜1.62）があったとしよう。この場合、1.21が点推定値であり、0.78〜1.62が区間推定値である。

つまり、ある臨床試験に参加した集団（標本）の平均値は 1.21であり、母集団（全人類）の平均値、つまり真の値を含んでいそうな区間が 0.78〜1.62の範囲内に95%の確率で存在している、ということである。

より正しくは真の値に重きを置くので、100回施行したうちの5%は真の値を含まない、という表現の方が良いのかもしれない。

ここまでの表現はややこしいので「ある試験を 100回やったら 95回は同じ結果になるよ」で何ら問題ないと個人的には思う。

1. いまさら誰にも聞けない医学統計の基礎のキソ第1巻まずは統計アレルギーを克服しよう！ISBN-10: 4904307240、ISBN-13: 978-4904307243（発売日： 2010/4/10）