トップQs
タイムライン
チャット
視点

交絡

ウィキペディアから

Remove ads

交絡(こうらく、: confounding)とは、説明変数従属変数が共通原因をもつことにより生じる、推定の偏り(バイアス)である[1]。 この考え方は、疫学に限らず統計学因果推論の全般で用いられる。

疫学では典型的に、ある曝露(独立変数)と転帰(従属変数)の両方に関連し、かつ因果経路上の中間因子ではない第3の変数が存在するとき、曝露と転帰の関連推定が偏ることを指して交絡という[2]

もし交絡が存在すると、観測された現象の真の原因が交絡因子であるにもかかわらず、曝露などの独立変数が原因であると誤って解釈し、偽陽性の結論(第一種過誤)に至ることがある。

そこで因果推論においては、研究計画や解析において交絡の回避(例:層別・回帰調整、DAGに基づく変数選択、無作為化 等)が用いられる[3] [4]

交絡に関与する第3の変数は、一般に交絡因子(confounder、交絡変数)と呼ばれる。関連語として「潜伏変数」(lurking variable)が挙げられるが、こちらは交絡に限らず広く「観測されないが関係に影響する変数」を指す用法で用いられる。

交絡などにより見かけ上生じる関連は、疑似相関(spurious correlation)と呼ばれることがある。ただし、疑似相関は交絡以外(偶然や共通トレンド、条件付け等)でも生じる可能性があるため、両者は同義ではない。

Remove ads

概要

定義上、交絡変数は想定される原因と結果の両方に関連している。交絡変数は原因と結果の中間に位置することはない。AがCの原因と想定されるとき、交絡変数BはAを原因として起きるのではないし、またBによって常にCが起きるとは限らない。例えば、女性であることは常に喫煙の原因とはならないし、喫煙が常に癌の原因とは限らない。従って、女性であることと癌になることの因果関係を研究する際には、考えられる交絡変数として「喫煙」を考慮すべきである。さらに、2つのリスクグループ(例えば男性と女性)があるとき、交絡変数はそれぞれのグループで常に異なる普及率(例えば喫煙率)となっている。(Hennekens, Buring & Mayrent, 1987)

統計学的研究における因果関係の判定基準は盛んに研究されてきたが、ジューディア・パールは統計学的な概念だけで交絡変数を定義することはできず、そのためにはある程度の因果的想定が必要であることを示した[5]。Austin Bradford Hill は1965年の論文で因果関係の判定基準を提案した[6]。多くの疫学者はこれを交絡と因果関係を考える出発点として採用した。しかし、これはせいぜいヒューリスティック的な価値しかない。因果グラフによって因果的な想定を表す際には、backdoorバックドアといわれる簡単な基準によって、交絡変数の集合を特定することが可能である。

Remove ads

研究における交絡の回避方法

研究において、交絡変数を積極的に除去したり制御したりする方法がいくつか存在する[7]

ケースコントロール研究(case-control studies)
ケース群とコントロール群に共通する交絡変数の値を揃えて他の変数を比較する方法。例えば、67歳の患者の心筋梗塞の原因を研究するときに年齢が交絡変数になると考えられるならば、67歳のその患者(ケース)と67歳の健常者(コントロール)を対照する。ケースコントロール研究では、対照する変数は年齢や性別であることが多い。
コホート研究(cohort studies)
ある交絡変数の値が等しい集団の中で他の変数を比較する方法。例えば、年齢が交絡変数になると考えられるとき、年齢層をそろえた集団(コホート)を対象として観測する。その集団の中で、例えば心筋梗塞の原因として運動量の多寡で対照する。
層化(stratification)
心筋梗塞において、運動量が多いほど罹患する割合が低く、年齢が交絡変数になりうると仮定する。このとき、サンプリングされたデータは年齢層によって層化される。すなわち、運動量と心筋梗塞の関係を年齢層ごとに分析する。年齢層によって罹患率に差が生じるなら、年齢が交絡変数であると考えられる。層化されたデータを扱う統計手法としてマンテル=ヘンツェル法などがある。

これらの手法にはそれぞれ欠点がある。例えば、ケースコントロール研究の対象者(ケース)が、ある病気にかかった45歳のアラスカ出身の黒人で、フットボール選手で、菜食主義者で、教育者として働いている人であったとする。対照者として、属性がほとんど同じでその病気に罹患していない点だけが異なる人を見つけなければならないが、これは大変な作業である。また、常に過大対応や過少対応のリスクがつきまとう。コホート研究では、研究対象から除外される人があまりにも多くなる傾向があり、層化では層が薄くなりすぎる(標本サイズが小さすぎる)傾向がある。

既知の交絡変数を測定することによって交絡を制御し、それらを多変量解析における共変動とする方法もある。ただし、層化と比較して、交絡変数の強さに関する情報をほとんど得られないという欠点がある。

重要な問題として、交絡変数は必ずしも判別・測定が可能であるとは限らない。疫学では交絡を完全に制御できないことを指して残余交絡(residual confounding)という。標本サイズが大きいならば、無作為化(無作為割付)が最も良い方法であることが多く、その場合は(既知のものも未知のものも含めた)全ての交絡変数が全ての研究対象群に等しく分散していると考えられる。

Remove ads

脚注

関連項目

外部リンク

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads