因果推論入門
因果関係とは
「→の因果関係がある」とは、の値を変化させること(介入)によっての値を変化させることができることを意味する。介入した場合のの値を、介入しなかった場合のYの値をとすると、その差分を介入効果と呼ぶ。
介入効果であれば、→の因果関係が存在するといえるが、とは同時に観測できない(因果的推論の根本問題)ため、往々にして因果関係を証明するのは難しい。
因果と相関
因果と相関はしばしば混同されるが、ビジネスや政策で物事を決定する際に重要なのは因果関係であって相関関係ではない。データに対して間違った解釈をしないために、相関関係が現れるパターンを理解しておく必要がある。
相関関係のパターン①【因果関係】
喫煙()と肺がんリスク()のように因果関係がある場合、相関関係として現れる。
相関関係のパターン②【偶然】
2回続けてコイントス(1回目を、2回目をとする)するような明らかに相関関係のない試行でも、何セットも繰り返すと1回目の2回目の結果が同じになることがある。都合の良いデータだけを集めない、事前に実験計画を立てて場当たり的に何度も検定することを防ぐなど対策が必要。
相関関係のパターン③【因果関係が逆】
警察の人数()と犯罪者数()に相関が見られたとき、本当は「犯罪が多い場所には警察が増える」なのに、「警察が多い場所では犯罪が増える」と安易に決めつけ、「犯罪を減らすために警察の数を減らそう」などと考えると的外れな施策になってしまう。
相関関係のパターン④【交絡】
小学生を対象とした調査で、身長()と学力()の間に相関が見られたとき、実際には年齢()という身長()と学力()の両方に影響するような共通の要因があるかもしれない。として考えられる要素は無限にあるため、としてのデータを集めて調整するのには限界がある。
相関関係のパターン⑤【合流点で選抜/合流点バイアス】
学力試験()と実技試験()の試験結果に相関がなかったとしても、データを合格者のみに絞ると負の相関があるように見える場合がある。
ランダム化比較試験(RCT)
1個人に対して介入効果を測定することは原理的に不可能だが、複数人のグループに対して平均介入効果を測定することは可能である。すなわち、介入を受けるグループ(介入群)の平均値と介入を受けないグループ(対照群)の平均値の差分で表される平均介入効果は測定できる。ランダム化比較試験(RCT)では、グループ分けを完全に無作為(ランダム)に実施して、介入群と対照群を統計的に同質なグループになるように調整する。
介入群と対照群の間には、「もしも介入がなかった場合、介入群の平均値と対照群の平均値は等しい」という仮定が必要である。この仮定が成り立つ場合、介入以外の要因の影響を排除でき、介入の効果のみを測定できる。上述のように、ランダム化比較試験(RCT)では、グループ分けを完全に無作為(ランダム)に実施することでこの仮定が成り立つようにする。
回帰分析
回帰分析はRCTが行えない場合によく利用される分析手法。目的変数を説明変数の線形和で表現し、一般的な回帰式は以下で表される。
特に説明変数が1つの場合は単回帰分析と呼ばれ、回帰式は以下で表される。
単回帰分析では、回帰式が以下の図のように直線で表現でき、の値がの値にどの程度影響するのかを知ることができる。回帰直線は残差(図の赤点線の長さ)の二乗和が最小になるように決定する(最小二乗法)。
効果を測定したい変数の係数の95%信頼区間に0が入らないとき、有意水準5%で「介入効果がある」と判定できる。
傾向スコア
無作為のグループ分けができない場合、傾向スコアを使う手法が用いられる場合がある。傾向スコアとは、介入を受ける確率のことで、傾向スコアを用いることでグループ分けで発生したセレクションバイアスの影響を軽減できる。
傾向スコアマッチング
傾向スコアマッチングでは、介入群と対照群の中から類似の傾向スコアを持つ人同士をマッチングすることで、セレクションバイアスを軽減する。
逆確率重み付け法(IPW)
逆確率重み付け法(IPW)では、傾向スコアの逆数で重み付けすることでセレクションバイアスを軽減する。介入群に対しては、傾向スコアの逆数をかけることで傾向スコアの値が小さい人の重みが大きくなるように、対照群に対しては、(1-傾向スコア)の逆数をかけることで傾向スコアの値が大きい人の重みが大きくなるように調整する。
差分の差分法(DID)
差分の差分法は、「介入前後の介入群の差分」から「介入前後の対照群の差分」を差し引くことで、時間経過などによる影響を取り除いた介入効果を求める分析手法。
回帰不連続デザイン(RDD)
回帰不連続デザイン(RDD)は、実際には実験を行わず、あたかも実験したような状況をうまく利用して介入効果を測る手法の一つ。介入するかどうかに明確な条件が存在する場合に、介入条件の境界線付近の人は類似の傾向を示すと仮定し、境界線付近の人に対して介入群と対照群を比較する。